● 摘要
课题组研制的高效静态图像压缩算法在JPEG 2000压缩框架内加入了基于小波域视觉失真敏感模型的量化以及基于互信息量的位平面预测编码,获取了比JPEG 2000更高的压缩性能。然而,复杂的算法和多样的需求,使得当前基于DWT图像压缩的硬件结构难以适配其计算特性。因此,优化高效静态图像压缩算法核心技术的实现性能和资源代价,研究其VLSI结构具有重要意义。
在此背景下,本文针对高效静态图像压缩中关键技术的VLSI结构进行了研究,主要研究内容和创新性成果包括:
1、提出了一种多级2-D DWT高速并行VLSI结构
针对1-D DWT直接映射结构中硬件效率及处理速度低的问题,根据小波变换中提升步骤数据流特性,设计了基于行方向双输入的行变换硬件结构,使行变换的硬件效率与处理速度提升1倍。依据列变换输入的可获取性,利用流水缓存机制,将列变换提升单元计算结果缓存并参与下一条带处理,避免了重复计算导致的硬件开销。根据多级变换之间的数据依赖关系,将多个行、列并行处理单元耦合级联建立了多级2-D DWT的高速并行处理机制,利用后续级别计算周期总和不超过第一级的特性,设计各级变换的通信及同步机制,将后续变换级采用一个行、列并行处理单元,实现了多级2-D DWT低资源消耗的高速并行硬件结构,在N2/2周期内完成整幅图像处理,在同类电路结构中具有最快的处理速度,但计算资源消耗仅为同等性能结构的1/3。
2、提出了一种小波域视觉量化零延时的VLSI结构
为降低小波域视觉量化算法向压缩系统引入O(N2)计算周期延时,对量化参数计算与量化操作给出了不同的优化方法。通过将产生的小波系数直接导入量化参数计算,建立一种量化参数计算与小波变换并行处理机制,小波变换结束时便可获取量化参数。通过将量化操作推迟到位平面预测请求码块、判断该码块是否需要量化之后,构造两模块的集成算法,将量化操作中的步骤编排到位平面编码的流水处理结构中,从整体上实现零延时的量化操作,比实现同类计算需求的电路结构具有更低的计算周期延时、更高的吞吐率。
3、 设计了一种基于高带宽存储的多路并行位平面预测编码硬件结构
基于互信息量的位平面预测编码用到子带间、子带内系数,具有高维的数据需求,导致获取预测系数消耗多个周期,加之庞大的位平面数据规模,使其成为压缩系统的性能瓶颈部分。在预测系数获取方面,结合预测系数的流水复用机制,设计了基于分散存储的高带宽小波系数存储结构,减少了获取预测系数所需的周期数目。对小波系数存储进行子带方向、行编号两个维度上更为精细的划分,进一步提升数据获取带宽,利用三个子带方向独立预测编码的特性,建立了三路并行位平面预测编码机制,有效提升该模块以及压缩系统的吞吐率。
4、 提出了一种基于数据依赖消除的并行MQ算术编码器
算术编码算法包含复杂的变量迭代运算,在硬件上形成了不易流水和并行的反馈环路。针对连续上下文依赖导致并行MQ电路结构时钟频率低的问题,采用基于数据内容的动态优化手段,判断连续上下文之间是否存在数据依赖,动态选择处理过程,去除MQ并行编码中的逻辑耦合。实验表明,本文结构能够有效提升并行MQ电路的时钟频率及吞吐率,避免了并行MQ编码中数据依赖导致的强逻辑耦合、低时钟频率问题。
最后,对以上关键技术的VLSI结构进行有效集成,设计了高效静态图像压缩系统,其速度性能及压缩质量方面优于同类压缩系统。