语音压缩编码培训定稿.ppt

上传人:sccc 文档编号:5665082 上传时间:2023-08-07 格式:PPT 页数:47 大小:1.17MB
返回 下载 相关 举报
语音压缩编码培训定稿.ppt_第1页
第1页 / 共47页
语音压缩编码培训定稿.ppt_第2页
第2页 / 共47页
语音压缩编码培训定稿.ppt_第3页
第3页 / 共47页
语音压缩编码培训定稿.ppt_第4页
第4页 / 共47页
语音压缩编码培训定稿.ppt_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《语音压缩编码培训定稿.ppt》由会员分享,可在线阅读,更多相关《语音压缩编码培训定稿.ppt(47页珍藏版)》请在三一办公上搜索。

1、2023/8/7,长沙理工大学现代通信技术实验室,语音压缩编码培训讲义-1、概述,长沙理工大学通信工程系,胡双红hu_,2010-12-20,长沙理工大学现代通信技术实验室,培训进度安排,课题介绍PCMDPCMADPCM每两周一次课,一周上课,一周答疑,2010-12-20,长沙理工大学现代通信技术实验室,内容提要,课题背景国内外研究现状常用编码算法简介,2010-12-20,长沙理工大学现代通信技术实验室,语音编码发展方向,极低速率语音编码比特率低于2400bps的编码保密通信、语音邮件、网络通信、IP电话变速率语音编码在合成语音质量和系统容量中灵活折中CDMA通信系统中,且前景广阔不压缩语

2、音编码压缩费用超过传输费用光纤通信、微波通信,2010-12-20,长沙理工大学现代通信技术实验室,压缩的意义,为什么需要压缩编码技术PCM编码占用带宽大8000Hz采样速率,每样本8位码数码率:64kbps有线传输中可以找到大容量传输介质:光纤无线接入侧的频谱资源相当紧张,2010-12-20,长沙理工大学现代通信技术实验室,GSM频点分配,2010-12-20,长沙理工大学现代通信技术实验室,理论基础,定义:低于64kbps的编码方案称为语音压缩编码压缩依据语音信号中存在的冗余人类的听觉感知机理,2010-12-20,长沙理工大学现代通信技术实验室,信号冗余,采样数据之间的相关8kHz速率

3、时,相邻样值相关系数高达0.85周期相关:浊音的准周期性幅度的非均匀分布小幅度概率高,信息集中在低功率语音间隙的存在声道的形状及其变化速率有限,2010-12-20,长沙理工大学现代通信技术实验室,听觉感知机理,人耳对不同频段的声音敏感度不同低频比高频更敏感人耳对语音信号的相位不敏感人耳有掩蔽效应(masking effect)强音抑制弱音,2010-12-20,长沙理工大学现代通信技术实验室,语音编码的极限速率,语音最基本元素-音素:大约128256个通常说话速度:每秒平均发10个音素信息率:I=log2(256)10bps=80bps把发音看成是以语音速率传送,则语音编码的极限速率为80b

4、ps从数字化标准的编码速率64kbps,到极限速率80bps之间的距离,对于理论研究和实践有着极大的吸引力,2010-12-20,长沙理工大学现代通信技术实验室,压缩编码方法分类,波形编码原理简单,失真小数码率高参数编码数码率低音质较差,复杂度高混合编码较低的比特率上获得较高的语音质量,2010-12-20,长沙理工大学现代通信技术实验室,语音信号压缩编码的评价系统,语音质量(1)广播级:宽带(0-7000Hz)高质量的语音,感觉不出噪声存在(2)网络或电话级:200Hz-3200Hz,信噪比大于30db。(3)通信级:完全可以听懂,但和长途电话相比,有明显失真。(4)合成级:80%-90%可

5、懂度,音质较差,听起来像机器讲话,失去了讲话者的个人特征。,2010-12-20,长沙理工大学现代通信技术实验室,语音信号压缩编码的评价指标,编码质量MOS(Mean Opinion Score)编码速率适当选取编解码复杂度不影响实时处理编解码时延不能超过100ms若超过必须采取回声抵消或回声抑制等措施,2010-12-20,长沙理工大学现代通信技术实验室,2010-12-20,长沙理工大学现代通信技术实验室,内容提要,课题背景国内外研究现状常用编码算法简介,2010-12-20,长沙理工大学现代通信技术实验室,ITU-T的正式标准,G.711(1972)64kbps PCM 用于固网G.72

6、1(1984)32kbps ADPCM 用于卫星、海缆、VRCG.728(1992)16kbps LD-CELP 低延迟-码激励线性预测无绳电话、SCSC卫星、海事卫星、DSI设备、录音、移动系统等G.729(1996)8kbps CS-ACELP(共轭结构-代数数码激励线性预测技术)可与32kbps的ADPCM同质量用于个人移动通信、低C/N卫星、高质量移动无线通信,分组语音G.722.2AMR-ACELP(自适应多速率)用于WCDMA和TD-SCDMA系统,2010-12-20,长沙理工大学现代通信技术实验室,2010-12-20,长沙理工大学现代通信技术实验室,现状,主流:CELP4.8

7、kbps的数码率上获得较高质量的语音,2010-12-20,长沙理工大学现代通信技术实验室,发展方向,中低速率的语音编码的实用化降低复杂度减少时延提高抗干扰、抗噪声能力进一步降低编码速率目前5-6kbps的速率-较高质量重建语音目标4kbps得到短时延、高质语音,2010-12-20,长沙理工大学现代通信技术实验室,发展方向,中长延时编码400-1200bps得到高质语音新算法正弦变换编码(STC)混合激励线性预测编码(MELPC)时频域插值编码(TFI)基音同步激励线性预测编码(PSELP)新分析技术非线性预测多精度时频分析高阶统计分析,2010-12-20,长沙理工大学现代通信技术实验室,

8、内容提要,课题背景国内外研究现状常用编码算法简介波形编码技术参数编码技术,2010-12-20,长沙理工大学现代通信技术实验室,一、PCM编码,PCM:Pulse Coded Modulation抽样:8000Hz量化:非均匀A律87.6/13折线压扩特性编码:8位码极性码:第1位段落码:第2-3位段内码:第4-7位,2010-12-20,长沙理工大学现代通信技术实验室,二、DPCM编码,差分PCM编码对相邻样本的差进行PCM编码由于样本差值的动态范围远小于样本动态范围,因此达到相似性能可以减小编码位数技术实现关键问题编码位数的选取预测器系数选取:LMS,2010-12-20,长沙理工大学现代

9、通信技术实验室,DPCM框图,2010-12-20,长沙理工大学现代通信技术实验室,DPCM(含预测器内部结构),2010-12-20,长沙理工大学现代通信技术实验室,三、ADPCM,自适应DPCM自适应预测系数调整自适应编码位数调整技术实现关键自适应预测器自适应量化器,2010-12-20,长沙理工大学现代通信技术实验室,2010-12-20,长沙理工大学现代通信技术实验室,2010-12-20,长沙理工大学现代通信技术实验室,内容提要,课题背景国内外研究现状常用编码算法简介波形编码技术参数编码技术,2010-12-20,长沙理工大学现代通信技术实验室,语音生成机构,声源:声带共鸣机构:声道

10、(鼻腔、口腔与舌头)放射机构:嘴唇或鼻孔,2010-12-20,长沙理工大学现代通信技术实验室,2010-12-20,长沙理工大学现代通信技术实验室,2010-12-20,长沙理工大学现代通信技术实验室,2010-12-20,长沙理工大学现代通信技术实验室,语音产生机理,浊音气流通过声门时,声带的张力刚好使声带产生张弛振荡式振动,产生一股准周期脉冲气流,激励声道产生浊音轻音声带不振动,而在某处收缩,迫使气流高速通过这一收缩部分产生湍流就产生清音 爆破音声道完全闭合的情况下突然释放产生爆破音,2010-12-20,长沙理工大学现代通信技术实验室,语音信号产生模型,2010-12-20,长沙理工大

11、学现代通信技术实验室,清音/浊音示意图:,2010-12-20,长沙理工大学现代通信技术实验室,a1,语音输出x(n),线性预测分析基音频率清/浊音判别,参数合成,a2,ap,基音频率,输入语音x(n),清/浊音标志,G,2010-12-20,长沙理工大学现代通信技术实验室,模型中的参数,清浊音判决基音周期时变滤波器增益常数G数字滤波器参数ai特点:随时间缓慢变化,2010-12-20,长沙理工大学现代通信技术实验室,优点,能够用线性预测分析方法对滤波器参数ai和增益常数G进行非常直接和高效的计算,2010-12-20,长沙理工大学现代通信技术实验室,LPC模型阶数p的选择,保证有足够的极点模

12、型化声道响应的谐振结构通常10kHz时有5个共振峰,一对极点对应一个共振峰,取p=10弥补鼻音中存在的零极点和其他因素的偏差取p=1214,2010-12-20,长沙理工大学现代通信技术实验室,二、,LPC-10编码器,美国确定LPC-10作为2.4kb/s速率上的推荐编码形式,用于第三代保密电话中发送端,原始语音信号采用8kHz采样,然后每180个采样值分为一帧(22.5ms),提取语音特征参数并加以编码传送。每帧总共编码为54bits,每秒传输44.4帧,因此总传输速率为2.4kb/s,2010-12-20,长沙理工大学现代通信技术实验室,s(n),采样(8kHz),基音检测(AMDF),

13、清/浊音检测,预加重,线性预测分析,反射系数,增益G,参数编码,c(n),LPC-10编码器发送端,2010-12-20,长沙理工大学现代通信技术实验室,预加重:,提高语音谱中的高频共振峰,使语音频谱较为平滑,从而提高谱参数估计的精确度预加重滤波器的传递函数为:,2010-12-20,长沙理工大学现代通信技术实验室,基音周期,利用短时平均幅度差函数(AMDF)计算,2010-12-20,长沙理工大学现代通信技术实验室,增益G,S(i)为经过预加重的数字语音N为分析帧的长度,2010-12-20,长沙理工大学现代通信技术实验室,c(n),解码,清/浊音开关,反射系数转换为预测系数,基音,增益G,合成器,去加重,噪声产生,s(n),LPC-10编码器接收端,2010-12-20,长沙理工大学现代通信技术实验室,课后需要自学补充的知识,ADPCMLMS算法语音信号产生模型LPC-10编码器,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号