毕业设计中期答辩PPT.pptx

上传人:牧羊曲112 文档编号:6585968 上传时间:2023-11-15 格式:PPTX 页数:13 大小:214.04KB
返回 下载 相关 举报
毕业设计中期答辩PPT.pptx_第1页
第1页 / 共13页
毕业设计中期答辩PPT.pptx_第2页
第2页 / 共13页
毕业设计中期答辩PPT.pptx_第3页
第3页 / 共13页
毕业设计中期答辩PPT.pptx_第4页
第4页 / 共13页
毕业设计中期答辩PPT.pptx_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《毕业设计中期答辩PPT.pptx》由会员分享,可在线阅读,更多相关《毕业设计中期答辩PPT.pptx(13页珍藏版)》请在三一办公上搜索。

1、毕业论文中期工作汇报,刘迪源,混淆网络在语音检索中的应用,完成主要工作:,1.语音信号处理知识学习 语音信号处理 Spoken Language Processing2.熟悉语音识别基本流程 perl语言入门 结合HTK工具,完成WSJ0_baseline中语音 识别各项操作3.分析语音识别输出结果文件lattice和混淆 网络(CN)4.结合SRILM工程,完成混淆网络生成程序,1.语音信号处理知识学习,语言模型学习,语言模型,基于规则LM,基于统计LM,短语结构文法,上下文相关文法,上下文无关文法(CFG),正则文法,PCFG,n-gram,2.熟悉语音识别基本流程,按照科大讯飞提供的语音

2、识别Easytraining步骤,在WSJ_baseline上跑通整个语音识别的流程,语音识别具体步骤:模型训练:1 用CompV 估计全局方差 2 用ModelGen 克隆monophone 3 HERest 训练monophone 模型 4 校正训练数据 5 用校正后的数据训练模型识别与测试:1 HParse 生成语法网络2 HVite 识别3 HResults 计算识别率,程序:EasyTrainingDTM.pl run_test.pl,3.分析语音识别输出结果文件lattice和混淆网络(CN),识别句子:I like its color,lattice结构:,混淆网络结构:,语音关

3、键词识别技术的研究语音关键词识别技术的研究及应用语音识别中的后处理技术研究汉语大词汇量连续语音识别中混淆网络算法的研究基于Lattice分段的高质量混淆网络快速生成方法基于KL散度的最大后验弧主导的混淆网络生成算法,Finding consensus in speech recognitionMangu 2000 Indexing Confusion Networks for Morph-based Spoken Document Retrieval Turunen 2007,目前国内外有关混淆网络技术的研究:,4.混淆网络生成程序,1)在lattice上利用前向,后向算法计算节点的后验概率。

4、每个节点后验概率=前向概率后向概率;2)概率剪枝。剪枝后再重新计算每个节点的后验概率。3)在lattice上寻找一个概率最大的节点,利用维特比算法生成一条包含起始和结束节点的one-best路径,作为构建混淆网络的参照路径。4)在剩余弧中寻找一个概率最大的节点,利用维特比算法生成一条最佳路径。5)对于最佳路径中的所有弧节点,与混淆网络中的每个集合进行比较,计算删除、插入、替代三种代价。取代价最小的一种方式将弧引入参照路径中。6)迭代执行4和5,直至所有弧都加入到混淆网络中。,I,Iike,Its,is,Iittle,Iate,It,is,yellow,color,Its,car,CN,latt

5、ice-tool工具生成混淆网络,SRILM工程中提取混淆网络c+程序,主函数:lattice-tool.ccHTK格式的lattice文件读取和存储:HTKLattice.cc计算词后验概率:LatticeAlign.cc混淆网络生成:Wordmesh.cc,完成代码中应用到的前后向算法,维特比算法,动态规划算法,MED分配混淆网络等数学证明,index.cc建立关键词的倒排索引,提高检索速度,应用混淆网络进行关键词检索的实验结果:,采用2006年NIST组织的STD评测系统,共284个测试词,74个测试短语,测试集上以0.9进行概率剪枝获得最高ATWV:0.6词的识别正确率:73.5%,剩余工作安排:,1.改进混淆网络程序,提高关键词的检出率2.完成毕业论文写作,Thank you!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号