当前位置:问答库>论文摘要

题目:与文本无关的说话人识别系统研究与实现

关键词:说话人识别,特征提取,MFCC,高斯混合模型,最大后验概率

  摘要

说话人识别(Speaker Recognition),又称声纹识别(Voiceprint Recognition),是由计算机利用语音波形中所包含的反映特定说话人生理和行为特征的语音特征参数来自动识别说话人身份的技术。在世界范围内,说话人识别技术已经广泛应用于诸多领域。随着说话人识别系统的进一步开发、完善和推广,说话人识别技术必将在国家安全、交通、通信、教育以及人们的日常生活和工作中起到越来越重要的作用。本文就是在说话人识别技术被广泛研究和应用的背景下,结合相关系统,进行了说话人识别系统在端点检测、特征提取、语音建模、模型匹配等模块算法的研究。本文采用了一系列高效算法,提出了一个高性能说话人识别系统模型。该系统采用MFCC(Mel-Frequency Cepstrum Coefficients)参数和高斯混合模型(GMM)为语音的声学模型,并以最大后验概率(MAP)算法进行模型的训练并实现最终的模型匹配。尤其是在特征参数提取模块中,本文介绍了2种基于MFCC的特征参数提取算法的改进,不仅提高了识别率,而且大大降低了计算量。本文以Xilinx vertex 4-ML403 FPGA开发板为硬件平台,最终在其上实现说话人识别系统。