当前位置:问答库>论文摘要

题目:噪声环境下语音分离与增强方法的研究与实现

关键词:单声道语音分离;非负矩阵分解;隐半马尔可夫模型;语音增强

  摘要

论文研究噪声环境下的语音分离与增强方法。目标是解决噪声环境下,对单麦克风采集的混合数据进行语音和噪音的分离,从而达到语音增强的目的。目前常采用盲源分离的方法实现混合语音的分离,但在语音分离领域应用该技术主要存在两个问题:第一,对于单声道采集的混合语音,实现分离的难度较大,例如独立成分分析等较为成熟的盲分离算法并不适用;第二,训练数据集的不完备性会导致语音分离模型的适用性降低,从而影响最终的分离效果。针对上述问题,本文主要开展以下研究工作。论文研究基于非负矩阵分解(Nonnegative Matrix Factorization, NMF)的语音分离算法。NMF算法可以用于解决单声道的混合语音分离问题,而且在模型的建立上更接近实际信号的混合方式。论文主要研究基于NMF的语音分离方法,包括模型的训练及分离的实现,并结合维纳滤波提高含噪语音的分离效果。此外,本文还提出一种基于两步NMF的语音分离算法,该算法在只有语音训练数据集的情况下,利用两次NMF算法完成语音和噪音的分离,扩展了基于NMF的语音分离算法。针对第二个问题,本文设计结合语音检测的语音分离算法。利用语音检测方法从待分离混合信号中识别出语音和噪音,将识别结果用于训练语音分离模型,从而完成语音和噪音的分离。本文采用基于隐半马尔可夫模型(Hidden Semi-Markov Model,HSMM)和似然比检验的语音检测方法完成语音和噪音的识别,识别结果用于训练基于NMF的语音分离模型,并利用该模型完成混合信号的分离。论文针对语音检测方法中似然比计算结果波动较大的问题进行了平滑处理,提高了语音检测的准确性,从而有助于语音分离模型的训练,以达到更好的分离效果。论文在上述工作的基础上,设计实现了语音分离与增强系统。将基于HSMM的语音检测算法和基于NMF的语音分离算法相结合并应用到系统当中,实现含噪语音的分离,从而达到语音增强的目的。通过一系列实验,论文讨论了基于NMF的语音分离方法的影响因素,评估了语音检测算法的准确性并且对不同的语音分离算法进行了对比。结果表明本文提出的基于两步NMF的语音分离算法及结合HSMM语音检测的NMF语音分离算法,在低信噪比情况下较对比算法能取得更好的分离效果,保证了系统的可行性。