《数字通信技术》PPT课件.ppt

上传人:小飞机 文档编号:5519172 上传时间:2023-07-16 格式:PPT 页数:58 大小:798KB
返回 下载 相关 举报
《数字通信技术》PPT课件.ppt_第1页
第1页 / 共58页
《数字通信技术》PPT课件.ppt_第2页
第2页 / 共58页
《数字通信技术》PPT课件.ppt_第3页
第3页 / 共58页
《数字通信技术》PPT课件.ppt_第4页
第4页 / 共58页
《数字通信技术》PPT课件.ppt_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《《数字通信技术》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《数字通信技术》PPT课件.ppt(58页珍藏版)》请在三一办公上搜索。

1、2.3 语音的产生模型和LPC声码器,3,人的发声系统由声带(声门)、声道以及次声门组成,次声门又由肺和气管等组成,是语音的激励源。,次声门系统产生的气流作用于声带,通过声道后就产生声音。根据发音机理,声音信号可分为清音和浊音。,一、语音信号的基本特性,4,一、语音信号的基本特性,当声带震动产生一个准周期空气脉冲激励声道时就产生浊音。浊音具有明显的准周期性。声带震动的频率称为基音频率,周期为基音周期。基音频率一般在70450Hz范围内,相当于周期为215ms。基音周期是语音信号的主要特征之一。,5,一、语音信号的基本特性,6,一、语音信号的基本特性,如果声道在某处发生收缩,迫使空气以高速冲过这

2、一收缩部位而产生湍流,就得到清音。发清音时声带不振动,是由湍流建立的宽带噪声源激励声道而发声。清音波形类似于白噪声。,7,一、语音信号的基本特性,8,一、语音信号的基本特性,9,一、语音信号的基本特性,语音信号的基本特性语音信号是非稳态信号,特征随时间变化;但在一个很短的时间段内(约5ms-50ms)具有相对稳定的特征,称为准平稳信号。语音信号通常可以分为浊音、清音和混合音。浊音在时域上具有准周期性,在频域上,精细谱具有周期性起伏的谐波特性,谱包络具有共振峰结构。清音类似于随机噪声,其频带较宽。浊音段的信号能量要比清音段的能量高,这一特点可用于判断区分清、浊音。,10,一、语音信号的基本特性,

3、11,激励源等效为基音频率的周期性脉冲或具有平坦频谱的白噪声,声道等效为时变线性数字滤波器。当激励源采用周期脉冲源时,声道输出的是浊音,采用白噪声源时,声道输出的是清音。,二、语音信号的产生模型,12,二、语音信号的产生模型,13,二、语音信号的产生模型,14,产生语音信号s(n)的参量 清/浊音类型;基音周期TP;代表声道的时变滤波器的系数aj及滤波器阶数p;增益系数G;,说明:根据语音信号慢变化的特点,可以每隔10-30ms左右预测一次上述各参数的值。即以每10-30ms为一帧传送一次参数样值的编码,并不传送话音样值的编码,因此比特速率低得多。,二、语音信号的产生模型,15,三、LPC声码

4、器的工作原理,16,1、全极点数字滤波器参数的确定阶数P 模型阶数P的选择,应该从频谱估计精度、计算量、存储量等多方面综合进行考虑。P取很大值时,可以获得很好的信号谱估计,但增加的计算量和存储量代价太大。语音谱估计时主要关心的是声道的谐振特性,P值过大,估计的谱中保留许多信号谱细节,反而使共振峰分析效果变坏。阶数P的经验值在8-12之间。通常采用10个极点的滤波器,模型就能正确描述共振峰特性和谱的基本形状。,三、LPC声码器的工作原理,17,滤波器系数aj,三、LPC声码器的工作原理,设计的滤波器系数 aj就是使得误差e(n)在某个预定的准则下最小,通常是根据最小均方误差准则求解aj,在LPC

5、模型中,信号s(n)的估计误差e(n)为:,18,三、LPC声码器的工作原理,根据最小均方误差准则通过求解P个方程来得到P个未知数aj,19,三、LPC声码器的工作原理,2、基音检测根据语音信号的特性检测基音周期的方法有:利用时域特性检测;利用频域特性检测;同时利用时域和频域特性检测;,这里只介绍利用时域特性检测,20,基本原理:利用语音信号的时域波形的相似性,通过比较原始信号和它的移位信号的相似程度来寻找基音周期。如果移位的距离等于基音周期,则两个信号之间将具有最大的相似性。常用方法:短时自相关函数和短时平均幅度差函数AMDF。,利用时域特性检测,三、LPC声码器的工作原理,21,三、LPC

6、声码器的工作原理,基于求短时自相关函数的基音周期估计,22,三、LPC声码器的工作原理,sw(n)的自相关函数称为语音信号s(n)的短时自相关函数,用Rw(l)表示。,如果s(n)是浊音,其短时自相关函数Rw(l)呈现出明显的周期性,其周期等于s(n)的基音周期。基音周期就是第一个峰值点到零点之间的距离。,23,三、LPC声码器的工作原理,24,设sw(n)是一段加窗的语音信号,它的非零区域为:n=0 N-1。sw(n)的短时平均幅度差函数rw(l)定义为:,三、LPC声码器的工作原理,基于短时平均幅度差函数(AMDF)的基音周期估计,25,三、LPC声码器的工作原理,如果s(n)是浊音,其A

7、MDF也呈现出明显的周期性,其周期等于s(n)的基音周期。与Rw(l)不同的是在基音周期的各个整数倍点上,rw(l)具有谷值而非峰值,要通过寻找最深谷值点的位置来确定基音周期。,26,三、LPC声码器的工作原理,27,两种基音周期估计方法比较AMDF方法计算简单,只需减法和取幅度运算,不需要乘法运算。AMDF的动态范围较小,易于算法的定点实现。AMDF在基音周期点上,它的谷点锐度较之短时自相关函数的峰点锐度更尖锐,估值精度更高、更稳健。但信号不够平稳时,这个特点不明显。短时自相关函数法的特点是对相位不敏感,在信号有相位失真时能较好地检测基音。,三、LPC声码器的工作原理,28,窗长 为了使较好

8、地反映sw(n)的周期性,窗长 N 至少应大于两个基音周期,一般取长度为10-30ms。克服共振峰特性造成的干扰 由于共振峰的干扰,会出现Rw(l)的第一最大峰值点或rw(l)的第一最深谷值点与基音周期不一致的情况,当基音周期性和共振峰周期性混在一起时,检测出来的周期可能是NpNf(Np是基音周期,Nf是第一共振峰的周期)。,三、LPC声码器的工作原理,讨论,29,克服上述干扰有两种方法:用低通滤波器(60Hz900Hz)对语音信号进行滤波,去除大部分共振峰的影响,基音频率最高约450Hz,滤波后可以保留其一、二次谐波。先对语音信号进行非线性变换(例如“中心削波”),然后再求Rw(l)或rw(

9、l),这样可以明显地改善基音估计的效果,基音周期点上,峰值点或深谷值点比削波前得到的要尖锐、突出。,三、LPC声码器的工作原理,30,中心削波中,为了保证表征基音周期的峰值不被削掉,削波电平CL的选择很重要。由于语音信号的电平变化很大,不宜选择固定电平,通常是找到语音帧的前1/3和最后1/3内的最大幅度,选取二值中较小的幅值,削波电平取其60%80%即可,通常定为68。,三、LPC声码器的工作原理,31,对于加窗的语音信号sw(n),当窗的起点 n=0 时,语音信号sw(n)的短时能量用E 表示,短时平均幅度用M 表示,计算公式如下:,三、LPC声码器的工作原理,3、浊音、清音及无声的判别 根

10、据语音信号的短时能量、短时平均幅度和短时过零率来判断当前帧的语音信号是浊音、清音,还是无声。,32,语音信号的过零率用Z 表示,它表示一帧语音信号中波形穿过横轴(零电平)的次数。它可以用相邻两个取样改变符号的次数来计算:,三、LPC声码器的工作原理,33,浊音(V)的M 最大而Z 最低,当采样率为8kHz,帧长为 20ms 时,Z 的平均值约为20;清音(U)的M 居中而Z 最高,当采样率为8kHz,帧长为20ms时,Z 的平均值约为70;无声(S)的M 最低而Z 居中。,判断当前帧是浊音、清音、无声的依据如下:,三、LPC声码器的工作原理,34,三、LPC声码器的工作原理,在S、U、V三种情

11、况下,短时平均幅度M 和短时过零率Z 的条件概率密度函数示意图,35,四、LPC10声码器,复习:LPC声码器的工作原理,36,1、LPC10声码器概况 LPC-10声码器采用10阶线性预测分析滤波器,编码速率为2.4kb/s,被美国在1981年作为联邦标准FS-1015用于窄带保密通信。其语音质量清晰可懂,但抗噪声的能力和自然度尚有欠缺。,四、LPC10声码器,37,四、LPC10声码器,2、LPC10编码器,38,LPC-10编码器的特点(1)采样 采样率8kHz,每个样本量化为12bit得到数字化语音,每180个样点分为一帧(22.5ms),以帧为处理单元。,四、LPC10声码器,预加重

12、的目的是加强语音谱中的高频共振峰,使语音短时谱以及线性预测分析中的余数(残差)频谱变得更为平坦,从而提高了谱参数估值的精确性。,(2)预加重 在提取声道参数之前,先进行预加重(高频提升)处理,预加重滤波器的传输函数Hpw(z)为:,39,传输函数Hpw(z)的幅频和相频特性,四、LPC10声码器,40,(3)声道滤滤器参数RC 该编码方案中采用协方差法计算预测系数ai,i=1,P,P=10。预测系数不适于直接量化,因为它的微小变化会导致LP综合滤波器极点位置很大的变化,很可能造成滤波器不稳定,为了保证滤波器的稳定性,要求有相当高的量化精度(每个系数需要810bits)。,四、LPC10声码器,

13、41,四、LPC10声码器,为了降低量化比特数,采用了在数学上完全等价的P个反射系数(RC:Reflection Coefficient)ki,i=1,P代替预测系数进行量化编码。滤波器稳定的条件是参数ki满足下式:,此条件在量化时容易保证。可以通过Levinson-Durbin算法求得部分相关系数(Partial Correlation),部分相关系数与RC在理论上是互为相反数。,42,(4)增益RMS 增益RMS由下式计算:,Si是经过预加重后的数字语音信号样本,N是分析帧长度。对于浊音帧,其分析帧长取为130个样本以内的基音周 期整数倍值;对于清音帧,其分析帧长取为长度为22.5ms的整

14、个帧的中点为中心的130个样点。,四、LPC10声码器,43,清/浊音判决是利用模式匹配技术,基于低带能量、AMDF函数的最大值与最小值之比、过零率三个因素判别。最后对基音值、清浊音判决结果用动态规划算法,在三帧范围内进行平滑和错误校正,从而给出当前帧的基音周期、清浊音判决参数V/U。,(5)提取基音周期和检测清/浊音 采用基于短时平均幅度差函数(AMDF)法提取基音周期。,四、LPC10声码器,44,(6)参数编码 对10个反射系数RC、增益RMS、基音周期、U/V判决标志以及同步信号共编码成每帧54bits,帧长22.5ms,因此编码速率为2.4kb/s。各比特分配如下表:,四、LPC10

15、声码器,45,四、LPC10声码器,46,四、LPC10声码器,3、LPC10译码器,47,LPC-10声码器的缺点(1)采用过分简化的二元激励,合成的语音自然度较低;(2)稳健性(Robustness)差。(3)LPC-10的语音谱共振峰的位置以及带宽估值有时会产生很大的失真,从而影响语音的质量。当浊音的基音频率接近谱包络中的第一共振峰时,LPC谱估计在共振峰位置上出现极其尖锐的峰值(估计失真),使得相应得在合成语音中会出现尖峰或较大的毛刺,影响语音质量。,四、LPC10声码器,48,采用混合激励代替简单的二元激励,使合成语音的质量得到改善。激励脉冲加抖动:对每个基音周期的长度乘上一个0.7

16、51.25之间均匀分布的随机数以改善语音的自然度。,4、LPC-10e声码器 LPC-10e声码器采用针对LPC-10声码器的缺点加以改进的算法,并能与LPC-10声码器兼容,用于美国第三代保密电话。,四、LPC10声码器,(1)激励源的改善,49,(2)基音提取方法的改进LPC-10提取基音采用的是AMDF,它的显著特点是不需要乘法,计算较小。LPC-10e中采用LPC的残差信号或语音信号的短时自相关函数,利用动态规划的平滑算法来更准确地提取基音周期。,四、LPC10声码器,50,(3)声道滤波器参数量化的改进 线谱频率LSF(Line Spectrum Frequency),或称为线谱对(

17、Line Spectrum Pair)是数学上与线性预测系数ai(i=1,P)和反射系数ki(i=1,P)完全等价的另一种表示方式。LSF参数集i(i=1,P)都在单位圆上,它们在频域描述全极点滤波器H(Z)。LSF在数学上有良好的量化特性。,四、LPC10声码器,51,四、LPC10声码器,在求取LSF参数及量化过程中,如果保持LSF参数的有序有界性质,即:,就可以保证全极点滤波器H(Z)是稳定的。,LSF参数有序有界性,52,LSF误差相对独立性某个频率点的LSF偏差只对该频率附近的语音频谱产生影响,而对其它LSF频率上的语音频谱影响不大,这有利于LSF的参数量化和插值。,四、LPC10声

18、码器,53,LSF参数的量化 在标量量化时,通过设计最佳的LSF参数的非均匀标量量化器,可以用较少的量化比特达到较高的量化精度。例如:对10个LSF参数,根据每个参数所起的作用,分配的量化比特数为:3、4、4、4、4、3、3、3、3、3,共34bits。所得的合成语音质量与用41bits对反射系数k参数量化得到的合成语音质量相比较,在听觉上没有任何差别,两者的波形完全吻合,计算量化畸变约为1dB。,四、LPC10声码器,54,四、LPC10声码器,LSF参数的量化(续)在矢量量化时,将10个LSF合并成(4,6)两个矢量,每个矢量量化为12bits,共24bits,可以得到平均谱畸变为1dB的“透明”矢量量化。,55,总结,本节课主要讲解了以下内容语音的产生模型LPC声码器,56,教材:P50,2.8 2.9 2.10 2.12,作业与思考题,谢 谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号