● 摘要
语音信号数字化取样技术是建立在Nyquist取样定理之上的,众所周知,用不低于语音信号最高频率两倍的速率取样所得的语音数据中有大量冗余,在存储或传输之前经常要进行压缩编码,以节约存储资源或节约传输带宽。压缩感知的提出为信息采集技术开辟了新的道路,让信号以低于奈奎斯特速率取样成为了可能。论文基于此,研究了压缩感知用于语音信号处理,设计了基于该理论的语音信号编码系统。主要内容如下:
一、介绍压缩感知基本原理及其关键技术,紧接着对语音信号稀疏表示做了研究,主要研究了语音在DCT基和小波基上的稀疏性。
二、研究压缩感知运用于语音处理。在这一部分分别研究了测量矩阵构造以及不同测量矩阵在语音重构中的作用;重构算法的分类以及不同重构算法在语音重构中的作用。使用matlab软件仿真,对比实验结果看出:同样条件下采用最优测量矩阵得到的重构信号失真最小,但随机测量矩阵是最容易构造的;同样测量矩阵下,凸优化类重构算法重构信号效果好,但贪婪追踪类重构算法的计算复杂度较低,用时更短。
三、对压缩感知运用于语音压缩编码进行了研究,设计了新的编码系统。结合编码系统的具体要求选择适合的稀疏基、测量矩阵和重构算法,通过实验中对比原语音与重构语音,具体研究了该编码方案下不同参数设置对语音信号重构效果的影响。该编码方案在编码端采用随机高斯矩阵对语音信号进行观测,得到较少的观测值,然后使用矢量量化编码进一步压缩数据;在解码端,通过矢量量化解码得到观测值,根据语音信号在离散余弦域中的稀疏性,用正交匹配追踪算法重构语音信号。所用算法,在确保语音信号一定重构质量的条件下降低计算复杂度,减小时延。实验结果表明,对于取样率为44100Hz,量化位数为16bit,码速率为705.6Kbps单声道语音信号压缩到100Kbps左右仍具有较好的语音质量,同时算法时间延迟低。
相关内容
相关标签