● 摘要
自然和谐的人机交互(HCI)是自计算机诞生以来,人们一直不懈追求的目标。情感计算对于实现和谐人机交互具有重要意义,因此,人机情感交互模式已成为新的研究热点。作为人机情感交互的重要组成部分,以语音情感计算为基础的情感语音交互,越来越多的受到研究者的关注。本文以实现基于汉语语音的人机情感交互为研究目标,从建立情感语音数据库出发,深入研究语音情感识别方法,提出了两种语音情感识别模型,并进行了情感语音生成的探索性研究。高质量的情感语音数据库是语音情感计算的研究基础,也是目前相关研究的瓶颈之一。本文根据研究需求,制定了BHU(北京航空航天大学)情感语音数据库建立和管理的原则和规范,并根据该规范建立了BHUDES(北京航空航天大学情感语音数据库)。而且,本文建立了在线情感语音评测系统,完成了大量情感语音的评测工作,为语音情感计算,乃至情感研究提供了可靠数据。在说话人准相关的语音情感识别研究中,本文提出了基于孤立HHM(Hidden Markov Model,隐马尔可夫模型)和HMM/ANN(Artificial Neural Network,人工神经网络)混合模型的两种语音情感分类器。首先,本文讨论了基于孤立HMM的语音情感分类器性能,实验得出适合该模型的输入特征序列,并指出矢量量化码本容量对于德语、汉语语音情感识别效果的不同影响。然后,结合HMM处理动态时序模型和ANN分类性能的优势,本文设计了基于HMM/ANN混合模型的汉语语音情感识别系统。在说话人不相关的语音情感识别研究中,本文提出了一种基于SVM(Support Vector Machine,支持向量机)的多级汉语语音情感识别方法。本文进行了基于SVM的语音情感类别一对一分类实验,总结了不同语音情感类别间区分度的特点,并据此设计了基于SVM的多级语音情感分类系统,该系统与激励-评价(Activation-Evaluation)情感空间理论具有一致性,且分类模型简单,易于实现。 最后,在基于韵律调节的情感语音生成研究中,本文主要做了两方面的工作:1. 利用BHUDES总结情感语句基于全局和分段韵律特征的变化规律;2. 利用语音韵律调节技术进行情感语音生成的实验。
相关内容
相关标签