当前位置:问答库>论文摘要

题目:立体视频深度图编码及处理

关键词:深度图编码, H.264, 区域划分, 帧间预测,视点间预测

  摘要


    伴随着现代信息技术的迅速发展以及人们需求的日益增加,作为人们从外界获得、分享信息的主要方式,数字视频技术的发展速度不断攀升。数字技术带给人们的不只是视觉的冲击,更是形象鲜活的立体式感受。由多深度相机构成的多视点系统能够提供三维视频图像,实现与场景的良好交互能力,其数据量也随之成倍增加。由于立体视频包含的数据的信息量非常多,因而在对其进行传输之前,一定要将其数据量进行压缩。决定三维技术是否能够在广阔的领域中被使用有很多限制条件,其中较为主要的一条便是怎样能够大幅地将三维视频数据进行压缩。基于此种考虑,各种新的深度图编码方法不断被提出。

    针对深度图边缘部分质量非常重要这一特点,本文提出了基于深度图区域划分的码率控制算法。利用宏块方差计算法和K-means方法将深度图以宏块为单位划分为边缘区域、背景区域和前景区域,根据各区域特点为不同区域制定不同的码率分配策略。以较低的计算复杂度准确分割了边缘区域,有效分割了前景区域和背景区域,提高了边缘区域编码质量,并且图像整体质量也未受影响。

    为了降低多视点视频的编码复杂度,基于深度图区域划分的划分结果,提出了帧间快速编码算法和多视点深度图视点间编码改进算法。根据对深度图不同区域预测模式的统计结果,结合各区域的特点及其重要性对预测模式进行优化,对背景区域选择较大的预测块、前景区域选择适中的预测块、边缘区域选择完整的预测块作为预测模式的遍历方式。在保证整体编码效果的基础上,减少了预测模式选择的复杂度,大幅提高了编码效率,编码时间减少55%左右。基于对深度图视点间预测和时间预测的统计分析,对目前的多视点编码框架进行了修改,只对关键帧和非关键帧中TLID为1和2的深度图进行了视点间的预测编码,在降低编码复杂度的前提下,提高了随机访问性能,抑制了编码错误在视点间的扩散。