● 摘要
随着多媒体和网络技术的发展,视频数据的数量以指数速度增长。个人计算机的普及也使得数字视频在生活中的应用越来越广泛。基于内容的视频结构分析系统能根据视频本身的底层特征,对视频进行分析和理解,分析的结果可以直接服务于更高层次的视频语义分析。如何对这些视频数据进行高效分析和管理已经成为多媒体技术领域的研究热点。近年来对视频结构化的研究发展迅速,但其仍然面临着许多挑战。视频剪辑方式日趋复杂和隐蔽,如何能有效的在低复杂度情况下检测出镜头边界受到了越来越多研究人员的关注;传统聚类算法要求用户对样本拥有大量先验知识,提供最佳聚类数,并不能直接应用于镜头聚类,如何在没有先验知识的情况下得到最优分类数,并得到准确的聚类结果也是迫切需要解决的问题。论文对基于内容的视频结构分析领域中镜头分割、关键帧提取、镜头聚类算法都进行了深入探索和研究。本文的研究重点包括镜头边界检测算法、关键帧提取算法的研究与实现,镜头特征提取方法的研究与改进,镜头聚类算法的研究与改进。本文在分析了常用的镜头边界检测算法的基础上,实现了一种级联分类的镜头边界检测方法。该方法分析了镜头发生切变和渐变时边界帧的亮度方差变化的特点,分别对这两种边界进行检测。实验证明该算法与传统算法相比具有更高的准确性。本文提出了一种基于谱分割的镜头聚类算法。该算法首先使用了非一致性量化维数的镜头特征提取方法,此方法更符合人眼识别模式,能够更有效的表征镜头的内容。然后算法采用谱分割对镜头集进行迭代分割,算法克服了传统聚类算法需要提供最优分类数的缺陷,提高了聚类算法的自适应性。实验结果表明该算法在聚类结果的有效性和准确性方面均优于传统方法。最后本文结合级联分类镜头边界检测算法,关键帧提取算法,非一致性量化颜色特征策略,基于谱图分割的镜头聚类算法,设计实现了基于内容的视频结构分析原型系统。
相关内容
相关标签