● 摘要
语音中包含说话人的情感信息。语音情感识别是情感计算领域的重要研究内容,国内外众多学者对其产生了浓厚兴趣。本文以实现说话人无关并且说话内容无关的语音情感识别为目标,对相关问题进行研究,主要内容包括:(1)情感语音数据库的建立在广泛研究国内外现有的情感语音数据库的基础上,本文建立完备的普通话情感语音数据库,并对数据库中的情感语音样本进行主观评测,以验证样本中所包含的情感的有效性。最终建立的北航情感语音数据库(BHUDES)共有6300条情感语音样本。(2)语音情感特征提取将参数滤波与分形几何方法引入语音情感识别,提出自相关密度和计盒维数两种新颖的语音情感特征,并通过实验验证其对情感识别的有效性。(3)基于Fisher准则的分层语音情感识别首先应用Fisher准则探索不同语音特征与情感之间的内在联系,达到特征降维的目的。然后,将情感分类模型与情感语音特征紧密结合,建立一个分层语音情感分类模型,根据Fisher比率确定该模型的层次结构以及每层分类器所采用的语音情感特征最佳组合,实现对六种基本情感的识别。最后,通过实验验证分层语音情感分类模型的有效性。(4)结合情感点信息的语音情感识别本文提出情感点(Emotional Point)的概念,即语音中存在的持续时间较短,语音特征十分明显,富含特定情感信息的语音片段,如感叹词、语气词等,并将其作为语音情感识别的参考信息,提高语音情感识别率。(5)基于电声门图的语音情感特征分析电声门图是通过电极采集到的声带振动信息。本文利用电声门图将语音信号中包含的声门激励信息和声道调制信息分离,提取了基于幂率分布(Power-Law Distribution)的一组声门激励情感特征和基于倒谱分析的一组声道调制情感特征。最后通过对比实验验证本文提出的情感特征的有效性。
相关内容
相关标签