当前位置:问答库>论文摘要

题目:噪声环境下语音检测与说话人识别技术的研究与实现

关键词:语音检测,隐半马尔可夫模型,说话人识别,模型选择,贝叶斯信息准则

  摘要

论文研究噪声环境下提高语音检测和说话人识别性能的技术。语音检测是指检测含噪音频信号的语音和非语音部分,目前常用的算法是采用似然比检验结合统计模型的方法,这些算法存在的问题在于噪音环境下检测正确率不高。语音检测是说话人识别预处理中的关键步骤。说话人识别指利用语音特征识别说话人的身份,训练环境和识别环境的不一致是目前影响说话人识别性能的重要因素,主要存在的问题包括自适应性低,不能根据训练语音的复杂度选择相应的有效模型及噪声环境下识别率不高的问题。论文针对上述问题展开以下研究工作:论文设计基于隐半马尔可夫模型(Hidden Semi-Markov Model,HSMM)的语音检测。论文分析了基于隐马尔可夫(Hidden Markov Model,HMM)对语音时间相关性描述不足的缺点,设计了基于HSMM模型的检测算法。主要研究模型中不易被噪音影响的语音特征的概率分布和段长的概率分布,并结合维纳滤波来增强语音特征的抗噪性,从而提高模型的检测性能。论文设计自适应说话人模型选择的方法。论文研究基于隐马尔可夫模型说话人识别中的模型选择问题,使用贝叶斯信息准则(Bayes Information Critirion,BIC)来选择HMM模型中状态个数及各个状态中高斯分量个数,使用簇复杂率结合贪心算法来缩短模型的求解过程。实验证明基于BIC模型选择法提高说话人识别的自适应性。论文在上述工作基础上,设计实现了语音检测与说话人识别系统。将基于HSMM的语音检测算法结合基于BIC模型选择算法应用到该系统中,提高了说话人识别在噪声环境下的识别性能,提高了系统的自适应性。实验结果表明在语音检测上,与G.729B,AMR2,AFE,基于HMM,基于Laplace-Gauss模型的语音检测算法相比,在不同噪音环境下基于HSMM的语音检测检测错误率降低8%以上。在说话人识别上,与基于矢量量化,基于混合高斯模型和基于固定HMM模型的说话人识别算法相比,在使用不同时长语音训练情况下,基于BIC的HMM说话人识别算法识别率性能均好于其它算法,正确率提高10%左右。结合了HSMM语音检测的说话人识别算法比使用能量语音检测算法的说话人识别法正确率提高约3%。