语音增强算法的实现ppt课件.pptx

资源描述

《语音增强算法的实现ppt课件.pptx》由会员分享，可在线阅读，更多相关《语音增强算法的实现ppt课件.pptx（22页珍藏版）》请在三一办公上搜索。

1、,语音增强算法的实现,The Realization of the Speech Enhancement Algorithm,目录,CONTENTS,PARTONE,4,01,语音增强,02,语音增强的目标,目前国内外抗噪声技术的的研究成果大体分为以下三类解决方法,5,1. 采用语音增强算法，提高语音识别系统前端预处理的抗噪声能力，提高输入信号的信噪比,2. 寻找稳健的语音特征作为特征参数，实验证明，这类参数对宽带语音具有较好的抗噪性,3. 基于模型参数自适应的噪声补偿算法,PARTTWO,一、语音特性,7,二、人耳感知特性,8,人耳对语音的感知主要是通过语音信号频谱分量幅度获取的，对各分量相

2、位则不敏感，对频率高低的感受近似与该频率的对数值成正比。人耳具有掩蔽效应，人耳除了可以感受声音的强度、音调、音色和空间方位外，还可以在两人以上的讲话环境中分辨出所需要的声音，这种分辨能力是人体内部语音理解机制具有的一种感知能力。人类的这种分离语音的能力与人的双耳输入效应有关，称为“鸡尾酒会效应”。语音增强的最终效果度量是人耳的主观感觉，所以在语音增强中可以利用人耳感知特性来减少运算代价。,三、噪声特性,9,根据与输入语音信号的关系，噪声可分为加性噪声和非加性噪声两类。对某些非加性噪声而言，可以通过一定的变换转换成加性噪声。语音处理中的加性噪声大体上可以分为周期性噪声、脉冲噪声、宽带噪声和同声道

3、其他语音的干扰等。,PARTTHREE,目前语音增强算法大致可以分为以下四种,11,一,参数方法,二,非参数方法,三,统计方法,四,其他方法,一、参数方法,12,此类方法主要依赖于使用的语音生成模型（例如AR模型），需要提取模型参数（如基音周期、LPC系数），常常使用迭代方法。,二、非参数方法,13,非参数方法不需要从带噪信号中估计模型参数，因此这种方法的应用范围较广。但由于没有利用可能的语言统计信息，故结果一般不是最优化的。这类方法包括自适应噪声抵消法、谱减法等。,14,自适应噪声抵消法,15,实际应用第三方面,由于该方向的应用原理和上面两个有所不同，所以改变了排版形式以区分这一特点。这段话

4、原文中是三行，所以我在这里也得尽力把它编成三行的形式，这样排版才会好看些。,实际应用第四方面,由于该方向的应用原理和上面两个有所不同，所以改变了排版形式以区分这一特点。这段话原文中是三行，所以我在这里也得尽力把它编成三行的形式，这样排版才会好看些。,设带噪语音输入为y(n)=s(n)+d(n), s(n)为语音信号，d(n)为未知噪声信号，r(n)参考噪声输入，也即自适应滤波器的输入，v(n)是该滤波器的输出。 r(n)与s(n)无关，而与d(n)相关。图自适应噪声抵消原理图,自适应噪声抵消法,16,自适应滤波器通常采用FIR滤波器，系数采用最小均方误差(MMSE)准则来迭代估计。判断标准是

5、使误差信号e(n)能量最小：,其中，wk是滤波器系数，N是滤波器抽头数。MMSE准则要求噪声和语音相互独立，这时，误差信号e(n)能量最小，可保证v(n)与d(n)最接近。,自适应噪声抵消法,17,谱减法,原理：利用噪声的统计平稳性以及加性噪声与语音不相关的特点而提出的一种语音增强方法。此类语音增强方法将估计的对象放在短时谱幅度上。,谱减法,18,比较简单，只需要进行正反傅立叶变换，而且实时实现较容易。,适用的信噪比范围较窄，在信噪比较低时对语音的可懂度损伤较大。所以实际应用时除了要降低噪声外，还要兼顾语音的可懂度和自然度。,三、统计方法,19,统计方法较充分地利用语音和噪音的统计特性，一般要建立模型库，需要训练过程获得初始统计参数，它与语音识别系统的联系很密切。如最小均方误差估计(MMSE)、利用听觉掩蔽效应等。对于特定的失真准则和后验概率不敏感的估计方法是很有用处的。,MMSE算法,20,达到了语音可懂度和清晰度的折衷，适用信噪比的范围较广,由于需要统计各种参数，算法运算量大，实时性不好。,四、其他方法,21,其他方法包括小波变换、卡亨南-洛维变换(KLT)、离散余弦变换（DCT）、人工神经网络等。这些方法不像前三类方法那样成熟，可以概括地称为非主流方法。,THANKS,

展开阅读全文