基于MFCC的说话人识别的研究.doc

上传人:文库蛋蛋多 文档编号:2393287 上传时间:2023-02-17 格式:DOC 页数:40 大小:583KB
返回 下载 相关 举报
基于MFCC的说话人识别的研究.doc_第1页
第1页 / 共40页
基于MFCC的说话人识别的研究.doc_第2页
第2页 / 共40页
基于MFCC的说话人识别的研究.doc_第3页
第3页 / 共40页
基于MFCC的说话人识别的研究.doc_第4页
第4页 / 共40页
基于MFCC的说话人识别的研究.doc_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《基于MFCC的说话人识别的研究.doc》由会员分享,可在线阅读,更多相关《基于MFCC的说话人识别的研究.doc(40页珍藏版)》请在三一办公上搜索。

1、本科学生毕业论文(设计)题目(中 文):基于MFCC的说话人识别的研究(英 文):The research of speaker recognition based on MATLAB姓 名 学 号 院 (系)电子工程系专业、年级电子信息工程 级指导教师 湖南科技学院本科毕业论文(设计)诚信声明本人郑重声明:所呈交的本科毕业论文(设计),是本人在指导老师的指导下,独立进行研究工作所取得的成果,成果不存在知识产权争议,除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本

2、人承担。 本科毕业论文(设计)作者签名: 二 年 月 日 毕业论文(设计)任务书课题名称:基于MFCC的说话人识别的研究学生姓名: 系 别:电子工程系专 业:电子信息工程指导教师: 2013年5月8日湖南科技学院本科毕业论文(设计)任务书1、 主题词、关键词: MFCC;说话人识别;特征提取; MATLAB。2、毕业论文(设计)内容要求:1)总体论述基于MFCC的说话人识别研究意义。2)提出系统设计任务,设计系统框架。3)设计提取特征参数,识别模型匹配。4)对说话人识别进行仿真实验。5)实验效果及结论。3、 文献查阅指引:1 白俊梅,张世磊,张树武,徐波.噪声环境下的鲁棒性说话人识别J.合肥:

3、中国科技大学博士论文,2007:1-22 高端声纹识别技术的研究与应用.3 S.B.Davis and P.Mermelstein,Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Trans. ASSP,1980(28):357-3664 陶利.说话人识别技术的研究D.北京:华北电力大学,2007.5 李经智.说话人识别系统的研究及DSP实现.哈尔滨:哈尔滨工程大学.20097 董恩清,万东辉,周亚同,蔡毓.基于短时

4、能量和噪声谱自适应估计的语音激活性检测方法J.模式识别与人工智能,2004,17(2):227-231.8 甄斌,吴玺宏,刘志敏,迟惠生.语音识别和说话人识别中各倒谱分量的相对重要性.北京大学学报(自然科学报),第37卷,第3期,2001年5月.9 李昱,林志谋,黄云鹰,卢贵主.基于短时能量和短时过零率的VAD算法及其FPGA实现J.电子技术应用,2006,9:110-113.10 F.K.Soong,A.E.Rosenberg,B.H.Juang,L.R.Rabiner.Vector quantization approach to speaker recognition.AT&TTECH.

5、J.,1987.4、毕业论文(设计)进度安排:(1)2012.10-2012.11 市场需求分析;(2)2012.12 收集、整理资料、书籍、文献;(3)2013.1 整理资料,撰写论文,定好初稿;(4)2013.2 说话人识别的设计与评价;(5)2013.3 提取MFCC程序的设计;(6)2013.5 修改,制板,测试,定稿,装订,答辩。教研室意见: 负责人签名: 注:本任务书一式三份,由指导教师填写,经教研室审批后一份下达给学生,一份交指导教师,一份留系里存档。论文(设计)题目基于MFCC的说话人识别的研究作 者 姓 名熊冰峰所属系、专业、年级 电子工程系 电子信息工程专业 2009年级指

6、导教师姓名、职称谭永宏预计字数10000开题日期2012.12.25一、课题目的和意义 说话人识别技术利用语音信息可以进行身份鉴定,例如缉拿电话诈骗案罪犯,法庭中根据电话录音信息做身份确认,电话语音跟踪,为用户提供防盗门开锁功能。同时在互联网可用于声音拨号,电话银行,语音E-mail,数据库访问等。说话人识别系统利用MFCC参数和VQ识别模型,准确识别说话人是谁,并不注重语音信号中的语义内容,而是希望从语音信号中提取出代表个人身份的个性信息。现在随着时代的发展,人类已开始进入了信息化时代,用现代手段研究说话人识别系统,使人们的日常生活工作更加有效率,这对于促进社会的发展具有十分重要的意义。二、

7、课题主要内容(提纲)及拟解决的关键问题1 绪论2 说话人识别技术的概述3 说话人识别的主要技术4 基于MATLAB的说话人识别 结论拟采用的思路和方法1 特征提取利用MFCC参数。2 识别模型采用VQ模型,提高研究效率。3 查阅国内外最新资料,开拓视野,对已有的成果加以分析利用。4 虚心向导师和同学学习,不断积累知识,再运用所学知识,完成论文完成期限和采取的主要措施:1-7周:对课题进行可行性分析,并根据课题搜集资料,查阅相关知识,熟悉掌握相关技术,理解毕业设计任务。第8-9周:设计出基本框架及模块。10-14周:编程,实现仿真的功能。15-16周:检查及完善。撰写和修改毕业论文,准备论文答辩

8、。2、主要措施:(1)通过有效途径查阅相关文献资料,引证参考已有的研究成果,确定论文研究主题。(2)与指导老师和同学进行多层次多方面的交流探讨,提炼观点,吸收建议。主要参考文献:1 白俊梅,张世磊,张树武,徐波.噪声环境下的鲁棒性说话人识别J.合肥:中国科技大学博士论文,2007:1-22 高端声纹识别技术的研究与应用.3 S.B.Davis and P.Mermelstein,Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences.

9、IEEE Trans. ASSP,1980(28):357-3664 陶利.说话人识别技术的研究D.北京:华北电力大学,2007.5 李经智.说话人识别系统的研究及DSP实现.哈尔滨:哈尔滨工程大学.20097 董恩清,万东辉,周亚同,蔡毓.基于短时能量和噪声谱自适应估计的语音激活性检测方法J.模式识别与人工智能,2004,17(2):227-231.8 甄斌,吴玺宏,刘志敏,迟惠生.语音识别和说话人识别中各倒谱分量的相对重要性.北京大学学报(自然科学报),第37卷,第3期,2001年5月.9 李昱,林志谋,黄云鹰,卢贵主.基于短时能量和短时过零率的VAD算法及其FPGA实现J.电子技术应用,

10、2006,9:110-113.10 F.K.Soong,A.E.Rosenberg,B.H.Juang,L.R.Rabiner.Vector quantization approach to speaker recognition.AT&TTECH.J.,1987.指导教师意见:指导教师签名: 教研室意见:签 名: 年 月 日开 题 报 告 会 纪 要时间2011.12.25地点三教610与会人员姓 名职务(职称)姓 名职务(职称)姓 名职务(职称)李春树教授谭永宏副教授廖朝阳副教授杨熙讲师李小武讲师李艳芳副教授会议记录摘要:问题一、论文的研究意义是什么?答:利用语音信息可以进行身份鉴定,例如

11、缉拿电话诈骗案罪犯,法庭中根据电话录音信息做身份确认,电话语音跟踪,为用户提供防盗门开锁功能。同时在互联网可用于声音拨号,电话银行,语音E-mail,数据库访问等。总体来说,说话人识别应用非常广泛,给社会带来了很大的经济效益,所以,说话人识别的研究具有很好的应用前景。问题二、说话人识别和语音识别有什么区别?答:说话人识别本质是特殊的一类语音识别,但其目的不是识别说话人讲的内容,而是识别该说话人的身份。它不关注语音信号的语义内容,而是从语音信号中提取出说话人的个性因素。问题三、论文会提取什么特征参数?答:论文将会选用美尔倒谱系数(MFCC)作为特征参数,它是说话人识别算法中最常用的参数,它能反映

12、的是美尔频率与赫兹频率的非线性的对应关系。这个参数利用了人耳的感知特性,对不同频率的语音具有不同的感知能力。会议主持人:记 录 人:年 月 日指导小组意见负责人签名: 年 月 日系部 意 见负责人签名:年月日湖南科技学院毕业论文(设计)中期检查表毕业论文(设计)题 目基于MFCC的说话人识别的研究学生姓名熊冰峰学 号200906002324系 别电子工程系专 业电子信息工程指导教师谭永宏检查日期2013年4月3日指导教师检查情况记载及修改意见:1. 论文的基本思路比较清晰,但逻辑性不强。2. 全文的目录、摘要、内容没有协调一致。3. 论文中的表格和流程图要按照格式来排版。4. 仿真实验分析不够

13、清楚,要抓取主要内容。5. 参考文献要按照格式来标注,在正文中引用的位置上做好标记。6. 图和表在文章正文中一定要有说明,而且图表要在文字分析的下面,表题在表上面,图题要在图下面。签名: 注:此表用于指导教师在学生毕业论文(设计)初稿完成后对学生执行任务书情况进行中期检查时用,由指导教师填写。湖南科技学院毕业设计(论文)指导过程记录表毕业论文(设计)题目基于MFCC的说话人识别的研究学生姓名熊冰峰学号200906002324专业班级电子信息工程电信0903班指导教师谭永宏职称副教授系(教研室)电子信息工程指导过程记录指导内容记录(一)选题、查阅资料指导:根据自己所学专业和特长,选一实用性强,能

14、做简易模型且有一定深度,能学以致用的题目。1、到图书馆查找和借阅与选题有关的文献和资料;2、从网上检索和下载与选题有关的文献和资料。学 生 签 名: 20 年 月 日 指导教师签名: 20 年 月 日指导内容记录(二)论文开题指导:1、题目应该简短、明确、有概括性;2、摘要是各个章节内容的浓缩,应做到简练、准确;3、关键词应采用能覆盖论文主要内容的通用词条;4、正文一般应包括绪论、论文主体及结论等部分;5、结论是毕业论文的总结,要求精炼、准确地概述全文的主要观点。学 生 签 名: 20 年 月 日 指导教师签名: 20 年 月 日指导内容记录(三)设计指导:1、根据自己的设计要求,编写程序,在

15、网上多查相关的资料;2、做说话人识别仿真实验前,确认系统设计的正确性;3、进行仿真实验结果分析,要有清晰的思路和详细叙述。学 生 签 名: 20 年 月 日 指导教师签名: 20 年 月 日指导内容记录(四)设计指导:明确系统实现功能,设计总体框图,进行说话人识别仿真实验。学 生 签 名: 20 年 月 日 指导教师签名: 20 年 月 日指导过程记录指导内容记录(五)论文写作指导:主体的内容应包括以下几个方面:1、毕业论文总体方案设计与选择的论证;2、对本研究内容进行较全面、客观的理论阐述,应着重指出本研究内容中的创新、改进与实际应用之处; 3、论文应推理正确,结论清晰,无科学性错误。学 生

16、 签 名: 20 年 月 日 指导教师签名: 20 年 月 日指导内容记录(六)论文中期检查指导:1、加强对选题核心思想的理解;2、规范论文文句,减少主观语句的使用;3、图片的大小要规范。4、框图文字太小。学 生 签 名: 20 年 月 日 指导教师签名: 20 年 月 日指导内容记录(七)论文修改指导:1、字数太多,将器件说明类语句压缩;2、按照毕业论文的标准格式排版。3、参考文献按照学校的毕业论文撰写规范写,同时在正文中出现的位置以上标的形式标出,要有1篇以上外文参考文献。4、结论部分要精简,减少主观语句。学 生 签 名: 20 年 月 日 指导教师签名: 20 年 月 日指导内容记录(八

17、)论文答辩指导:1、制作一个能反映论文主要内容,可放映510分钟的PPT演示文稿,作答辩陈述用;2、掌握研究内容的实际意义、创新、改进和特色之处,设计原理、工作过程等主要内容。3、演示实物突出自己的设计创新点。学 生 签 名: 20 年 月 日 指导教师签名: 20 年 月 日答辩小组组长意见(对情况是否属实做出意见)组长(签名): 20 年 月 日注:本表与毕业论文一起装订存档。湖南科技学院本科毕业论文(设计)评审表论文题目基于MFCC的说话人识别的研究作者姓名熊冰峰所属系、专业、年级电子工程 系 电子信息工程 专业 2009年级指导教师姓名、职称谭永宏、副教授 字 数10000定稿日期20

18、13.05.08中文摘要本文实现的说话人识别系统,主要是对说话人识别的特征参数的提取和识别模型的匹配,进行深入的研究。首先,对说话人识别进行了概述,给出了说话人识别的系统框架。然后就是如何实现说话人识别的问题,这个过程可分为两个部分:第一个是语音特征参数美尔倒谱系数(MFCC)的提取,主要包括了对语音信号进行预处理过程,特征参数求取过程,而且重点分析了双门限端点检测。第二个就是矢量量化(VQ)模型匹配的过程,主要包括训练阶段和识别阶段:训练阶段主要是生成每一个说话人一一对应的码本,采用经典的LBG算法,识别阶段的任务是把输出矢量利用有色图表现出来,每个矢量元素数值大小转化为不同的颜色,那么就可

19、以直观地看出最相似的有色图,即可以辨别出待识别人是谁。在MATLAB软件这个平台下,获得了较好的实验仿真效果。实验表明,MFCC参数具有很好的鲁棒性,能够达到准确识别说话人身份的目的。关键词(3-5个)MFCC;说话人识别;特征提取;MATLAB英文摘要The implementation of speaker recognition system mainly discusses the feature extraction of the speaker recognition and recognition models. First of all, this paper has a br

20、ief introduction of speaker recognition and brings a system frame of speaker recognition. Then the issue is how to carry out the system of speaker recognition. This process contains two sections: the first one is the feature extraction of speech parameter MFCC. It contains the process of preprocessi

21、ng, feature extraction and also has a emphasis of the accurate endpoint detecting algorithm of double threshold. Then the second work is the process of VQ models matching. It consists of train phase and recognition phase. Train phase is to create the special codebook for each speaker with adopting L

22、BG algorithm. Recognition phase is to represent the output vector with a colorful image so that we can recognize which is the most similar image from codebook, so we achieve the purpose of identification. Under the platform of MATLAB,this experiment has obtained perfect simulation effect. As a resul

23、t of the experiment, the parameter MFCC has a wonderful robustness which can reach the purpose of speaker recognition identification accurately. 关键词(3-5个)MFCC;Speaker recognition;Feature extraction; MATLAB.指导教师评定成绩评审基元评审要素评审内涵满分指导教师实评分选题质量25%目的明确符合要求选题符合专业培养目标,体现学科、专业特点和教学计划的基本要求,达到毕业论文(设计)综合训练的目的。理

24、论意义或实际价值符合本学科的理论发展,有一定的学术意义;对经济建设和社会发展的应用性研究中的某个理论或方法问题进行研究,具有一定的实际价值。选题恰当题目规模适当,难易度适中;有一定的科学性。能力水平40%查阅文献资料能力能独立查阅相关文献资料,归纳总结本论文所涉及的有关研究状况及成果。综合运用知识能力能运用所学专业知识阐述问题;能对查阅的资料进行整理和运用;能对其科学论点进行论证。研究方案的设计能力整体思路清晰;研究方案合理可行。研究方法和手段的运用能力能运用本学科常规研究方法及相关研究手段(如计算机、实验仪器设备等)进行实验、实践并加工处理、总结信息。外文应用能力能阅读、翻译一定量的本专业外

25、文资料、外文摘要和外文参考书目(特殊专业除外)体现一定的外语水平。论文质量35%文题相符较好地完成论文选题的目的要求。写作水平论点鲜明;论据充分;条理清晰;语言流畅。写作规范符合学术论文的基本要求。用语、格式、图表、数据、量和单位、各种资料引用规范化、符合标准。论文篇幅10000字左右。实评总分 成绩等级 指导教师评审意见: 指导教师签名: 说明:评定成绩分为优秀、良好、中等、及格、不及格五个等级,实评总分90100分记为优秀,8089分记为良好,7079分记为中等,6069分记为及格,60分以下记为不及格。评阅教师评定成绩评审基元评审要素评审内涵满分评阅教师实评分选题质量25%目的明确符合要

26、求选题符合专业培养目标,体现学科、专业特点和教学计划的基本要求,达到毕业论文(设计)综合训练的目的。理论意义或实际价值符合本学科的理论发展,有一定的学术意义;对经济建设和社会发展的应用性研究中的某个理论或方法问题进行研究,具有一定的实际价值。选题恰当题目规模适当,难易度适中;有一定的科学性。能力水平40%查阅文献资料能力能独立查阅相关文献资料,归纳总结本论文所涉及的有关研究状况及成果。综合运用知识能力能运用所学专业知识阐述问题;能对查阅的资料进行整理和运用;能对其科学论点进行论证。研究方案的设计能力整体思路清晰;研究方案合理可行。研究方法和手段的运用能力能运用本学科常规研究方法及相关研究手段(

27、如计算机、实验仪器设备等)进行实验、实践并加工处理、总结信息。外文应用能力能阅读、翻译一定量的本专业外文资料、外文摘要和外文参考书目(特殊专业除外)体现一定的外语水平。论文质量35%文题相符较好地完成论文选题的目的要求。写作水平论点鲜明;论据充分;条理清晰;语言流畅。写作规范符合学术论文的基本要求。用语、格式、图表、数据、量和单位、各种资料引用规范化、符合标准。论文篇幅10000字左右。实评总分 成绩等级 评阅教师评审意见: 评阅教师签名: 说明:评定成绩分为优秀、良好、中等、及格、不及格五个等级,实评总分90100分记为优秀,8089分记为良好,7079分记为中等,6069分记为及格,60分

28、以下记为不及格。湖南科技学院本科毕业论文(设计)答辩记录表论文题目基于MFCC的说话人识别的研究作者姓名熊冰峰所属系、专业、年级电子工程系 电子信息工程专业 2009年级指导教师姓名、职称谭永宏、副教授答 辩 会 纪 要时间2012年05月18日地点3教610答辩小组成员姓 名职务(职称)姓 名职务(职称)姓 名职务(职称)李春树教授谭永宏副教授李艳芳副教授杨熙讲师李小武讲师廖朝阳副教授答辩中提出的主要问题及回答的简要情况记录:问题一、为什么选择MFCC作为特征参数?答:Mel频率倒谱系数MFCC是说话人识别算法中比较常用的参数,这个参数利用了人耳的感知特性,人耳对不同频率的语音具有不同的感知

29、能力。利用MFCC,作出说话人识别系统,可以较好的反映说话人的行为特征和生理特征。问题二、为什么选择VQ识别模型?答:VQ是一种极其重要的信号压缩方法,广泛应用于图像信号压缩、语音信号压缩等领域。在语音信号数字处理的许多重要研究课题中,特别是低速语音编译码器和语音识别的研究中,VQ都起着非常重要的作用。问题三、仿真是如何实现识别功能的?答:实验一共选择三个说话人参与说话人识别系统的实验,分别为说话人甲,说话人乙,说话人丙。把每个人说话者所提取的特征训练生成码本。选择一人去进行语音识别测试,用同样的方法从待识别的语音中提取矢量序列,与先前生成码本进行模型匹配,以最小失真的参考模型作为判决对象,从

30、而判断说话人是谁会议主持人:记 录 人:年 月 日答辩小组意见评语:评定等级: 负责人(签名): 年 月 日系学位委员会意见评语:论文(设计)最终评定等级:负责人(签名): 系部(公章) 年月 日校学位委员会意见评语:评定等级: 负责人(签名): 年月 日目 录1 绪论12 说话人识别概述22.1 说话人识别和语音识别的联系22.2 说话人识别技术的分类22.3 说话人识别的原理32.3.1 语音信号产生模型32.3.2 说话人识别系统框架42.4 语音信号预处理42.5 特征提取53 说话人识别设计63.1 提取美尔倒谱系数(MFCC)63.1.1 信号的预处理63.1.2 语音的端点检测7

31、3.1.3 信号快速傅里叶变换83.1.4 信号通过美尔滤波器组83.1.5 离散余弦变换(DCT)93.2 VQ模型匹配94 说话人识别仿真实验及分析114.1 说话人识别仿真实验114.1.1 仿真任务要求114.1.2 仿真操作步骤114.2 仿真结果分析11结论16参考文献17附录:MFCC提取源程序18致 谢20基于的说话人识别的研究摘要说话人识别作为生物特征识别技术的一种,因其应用的方便灵活的特点,逐渐被人们所重视,并对其理论进行了深入的研究。无论是在说话人识别领域还是在语音识别领域,说话人特征的识别一直是人们研究的热点。本文将采用语音特征提取和模式匹配的方法实现说话人识别技术。

32、本文实现的说话人识别系统,主要是对说话人识别的特征参数的提取和识别模型的匹配,进行深入的研究。首先,对说话人识别进行了概述,给出了说话人识别的系统框架。然后就是如何实现说话人识别的问题,这个过程可分为两个部分:第一个是语音特征参数美尔倒谱系数(MFCC)的提取,主要包括了对语音信号进行预处理过程,特征参数求取过程,而且重点分析了双门限端点检测。第二个就是矢量量化(VQ)模型匹配的过程,主要包括训练阶段和识别阶段:训练阶段主要是生成每一个说话人一一对应的码本,采用经典的LBG算法,识别阶段的任务是把输出矢量利用有色图表现出来,每个矢量元素数值大小转化为不同的颜色,那么就可以直观地看出最相似的有色

33、图,即可以辨别出待识别人是谁。在MATLAB软件这个平台下,获得了较好的实验仿真效果。实验表明,MFCC参数具有很好的鲁棒性,能够达到准确识别说话人身份的目的。【关键词】MFCC 说话人识别 特征提取 MATLABThe Research of Speaker Recognition Based on MFCCAbstract As a kind of biologic feature identification technology, speaker recognition technology has been more valued by people because of its c

34、onvenient and flexible features. People have a deep research in its theories. Whether in speaker recognition or speech recognition field, voice recognition features have been a hot topic. This paper will adopt the method of voice feature extraction and model matching to speaker recognition technolog

35、y. The implementation of speaker recognition system mainly discusses the feature extraction of the speaker recognition and recognition models. First of all, this paper has a brief introduction of speaker recognition and brings a system frame of speaker recognition. Then the issue is how to carry out

36、 the system of speaker recognition. This process contains two sections: the first one is the feature extraction of speech parameter MFCC. It contains the process of preprocessing, feature extraction and also has a emphasis of the accurate endpoint detecting algorithm of double threshold. Then the se

37、cond work is the process of VQ models matching. It consists of train phase and recognition phase. Train phase is to create the special codebook for each speaker with adopting LBG algorithm. Recognition phase is to represent the output vector with a colorful image so that we can recognize which is th

38、e most similar image from codebook, so we achieve the purpose of identification. Under the platform of MATLAB,this experiment has obtained perfect simulation effect. As a result of the experiment, the parameter MFCC has a wonderful robustness which can reach the purpose of speaker recognition identi

39、fication accurately. 【Key words】MFCC Speaker Recognition Feature Extraction MATLAB1 绪论 研究背景。在人类生活的这样一个信息高度交互的社会里,判定人的身份是一个十分重要的问题。传统的身份鉴别方法已经不能满足社会的需要,而利用生物特征的身份鉴别技术为我们提供了一种更加方便的方法。多年来,各国研究者对于各种特征参数在说话人识别中有效性进行了大量的研究,并且取得了许多有意义的结论。早期的工作主要集中在人耳听辨实验和探讨听音识别可能性方面。随着研究手段和工具的改进,研究工作逐渐脱离了单纯的人耳听辨。1962 年,Bel

40、l实验室用目视观察语谱图的方法进行识别,提出了“声纹”(Voiceprint)的概念。语谱图直观明了,经过专门训练的人可以直接看出不同说话人之间语谱图的差别,然而语谱图难以量化描述,计算机无法直接用语谱图进行说话人识别。随着数字信号处理技术在语音识别领域应用,1969 年Luck JE 首先将倒谱技术应用于说话人识别,得到了比较好的识别结果。在80 年代后,Steven B. Davis 最早提出了美尔频率倒谱系数(MFCC)的概念,MFCC考虑到了人耳的听觉感知机理,具有较好的识别效果和噪声鲁棒性,成为说话人识别中使用的主流参数。 研究现状。说话人识别在近十几年得到了迅速发展。从模板模型到VQ模型,再到高斯混合模型,隐马尔可夫模型,人工神经网络模型。识别环境由无噪声环境少数人说话人识别,到复杂噪声环境大量说话人的识别。我国的说话人识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号