● 摘要
近年来,随着互联网和多媒体技术的快速发展,基于内容的视频检索成为国内外研究的热点主题。视频的内容包括图像颜色、纹理、形状等物理层特征,这些特征提取容易,但并不能充分表达视频含义,因此视频的语义表述尤为重要。视频字幕属于语义级别信息,在很多情况下可以作为一帧图像的简要说明,如新闻视频中的标题、电影中的人物对白等,字幕的提取与检索渐渐进入研究者的视线。字幕在视频检索中的应用很广泛,在大数据时代可直接作为检索依据应用在海量视频检索中,也可以为基于内容的图像检索提供索引。视频包含大量的图像、文字信息,每一帧图像又包含大量像素点,这使得字幕的检索不仅要考虑检索效果,更应将检索速率作为重要研究点。同时光学字符识别的发展使字幕检索准确度不断提高,检索速率愈发成为制约字幕检索发展的瓶颈。为了解决信息量大、检索效率低下的问题,很多学者将视频检索引入到高性能计算领域,利用硬件性能提高算法效率。
Intel公司在2011年上旬推出MIC架构硬件来支持并行计算。MIC是一款基于x86核心的众核架构协处理器,它的编程方式灵活多样,对并行计算提供了强有力的支持。本文根据应用范围广、复杂度高、适合并行加速的原则对字幕定位、增强与分割等核心算法进行了分析与选型,给出了一种字幕识别方案。进而对核心算法进行了详细的并行分析,根据当前主流的加速部件的硬件特点与编程方式,结合字幕识别关键算法自身特点选取MIC平台进行并行加速,设计并实现了并行程序。针对大数据量、高复杂度的运算,从并行度、有效传输、异步传输、Cache性能、向量化、负载均衡六个方面实现了并行程序优化。同时为了便于实验验证,设计并实现了视频字幕识别原型系统,完成了从视频读入到字幕文字输出的详细过程。通过实验验证,并行程序取得了良好的加速效果。
相关内容
相关标签