● 摘要
汉语是著名的有调语言,声调在汉语语音中携带着丰富的信息,尤其是声调在区分汉语中的同音异义字方面起着至关重要的作用,因此声调识别一直是语音信号处理领域的研究热点,并成为一项跨学科研究课题,融合了心理学、模式识别、信号处理、计算机科学、人工智能等多种技术。
本文主要从逐点修改基频曲线中的野值并自适应的提取声调核两方面进行情感点的声调识别研究。首先针对语料库不足的情况,建立了情感点的电声门图语音双模语料库,并对语料库中的数据做了预处理,提取相关的声学特征。
本文提出了逐点修改基频曲线中野值的算法。根据分布特点,将基频野值划分为第一类野值与第二类野值,利用统计学实验得到频数阈值,进而确定第一类野值的修改范围,并利用半频,倍频及其相关组合值逐点修正第一类野值。
此外,本文提出了一种自适应的声调核提取算法。首先基于声调核模型对其结构进行了改进,然后利用Viterbi算法,T-test假设检验将完整的基频曲线划分为若干部分,再利用自相关系数去除其中的第二类野值,最后根据分段情况进行声调核决策。
最后,本文基于隐马尔可夫模型(HMM)设计了三组对比实验进行声调识别,实验结果表明本文提出的基频野值修改算法与自适应声调核提取算法均取得较好的效果。
相关内容
相关标签