《毕业设计(论文)GSM移动通信系统的语音编码技术研究.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)GSM移动通信系统的语音编码技术研究.doc(20页珍藏版)》请在三一办公上搜索。
1、GSM移动通信系统的语音编码技术研究Speech Coding Techniques of GSM Mobile Communication System 专 业:电子信息科学与技术学 号:姓 名:指导教师: 目录内容摘要IAbstractII第一章 引言1第二章 GSM移动通信系统22.1 GSM移动通信系统简介22.2 GSM移动通信系统的总体结构22.2.1 移动台(Mobile Station)22.2.2 基站子系统BSS(Base Station Sub-system)22.2.3 网络子系统NSS(Network Sub-system)22.2.4 操作支持子系统OSS(Oper
2、ations Sub-system)3第三章 GSM系统的语音编码简介4第四章 语音编码的发展现状5第五章 语音编码质量的评定75.1 客观评定方法75.2 主观评定方法76.1 语音编码技术的分类86.1.1 波形编码86.1.2 声码器96.1.3 混合编码106.2 分析GSM系统中的语音编码技术多脉冲激励LPC106.2.1 多脉冲激励LPC编码器的组成116.2.2 编码过程116.2.3 多脉冲激励LPC译码器的组成11第七章 语音编码芯片12第八章 语音编码技术进展13结束语14参考文献15致谢16内容摘要由于GSM系统的技术成熟、管理灵活、完善的技术规范,在欧洲取得很大的成功之
3、后,在世界上许多国家更是得到广泛的应用,已成为陆地公用移动通信系统的主要系统。而GSM系统中语音编码是很重要的,因为语音编码往往决定了接受到的语音质量和系统的容量。在移动通信系统中,信道带宽始终是一个突出的问题。因此,业务提供商面临的问题是:如何在有限的可分配的带宽内容纳更多的用户?由此可见GSM移动电话系统中语音编码技术仍然有广泛的前景。现代通信的重要标志是实现数字化,而要实现数字化首先得把模拟信号变换成为数字信号,这种变换对语音信号来说就是语音编码。为了提高语音编码和语音信号数字传输的有效性,通常还要进行语音压缩编码,这就是本文要讨论的中心课题。关键词: GSM,编码技术,语音编码,参量编
4、码AbstractBecause of its technical maturity, flexible management and good technical norms, the GSM system has been used widely in many countries after it achieved great success in Europe. And now it has become a common system for mobile communications system all over the world. GSM voice-coding syste
5、m is very important because voice-coding often sees the decision of voice quality and system capacity. In the mobile communication system, channel bandwidth is a prominent problem. Therefore, the business providers face a problem is that how can the limited distribution of the bandwidth satisfy more
6、 customers? So GSM mobile telephone system voice coding technology is a broad prospect. An important indicator in modern communications is digital. In order to transform analog signals into digital signals, which transformation of the speech signal example is called speech code .To improve speech co
7、ding and voice signals in the validity of digital transmission, voice must be coded, which is the central issue in the paperKey words: GSM,Coding technology,Voice coding,Parameter coding 第一章 引言移动通信发展到现在,经历了由模拟到数字的变化,早期的移动通信系统是 AMPS和ETACS为代表的模拟移动通信系统。90年代,随着移动通信拥护数量的增加,用户对跨地区,跨国漫游以及各种增值服务要求也随之增加,同时数字
8、通信技术发展也日趋成熟,欧洲的移动通信运营商开始考虑发展一种新型的数字移动通信系统,由于数字通信系统的优点,如:频谱效率高、容量大、业务种类多、保密性好、话音质量好、网络管理能力强等,使得数字通信网得到迅猛发展。特别是GSM系统,技术成熟、管理灵活、有完善的技术规范,在欧洲取得很大的成功之后,在世界上许多国家更是得到广泛的应用,已成为陆地公用移动通信的主要系统3。在移动系统中,语音编码是很重要的,因为语音编码往往决定了接受到的语音质量和系统的容量5。由于大容量通信信道的引入,一段时间内曾认为语音压缩技术已经没有研究的必要,因为语音压缩相对于光纤信道容量来说已经微不足道。实际上,光纤信道目前也只
9、是在骨干网上得到应用,在接入网及支线的大规模应用仍需要一定的时间。另外,在移动通信系统中,信道带宽始终是一个突出的问题。因此,业务提供商面临的问题是: 如何在有限的可分配的带宽内容纳更多的用户。由此可见GSM移动电话系统中,低速率语音编码技术仍然有广泛的应用前景。在编码器能够传送高质量语音的前提下,如果比特率低,就能够在一定的带宽内容纳更多的语音通道。第二章 GSM移动通信系统2.1 GSM移动通信系统简介GSM全称数字蜂窝移动通信系统(Global System for Mobile Communication ),俗称“全球通”, 目前我国的移动通信网就是以GSM系统为基础的移动网络系统。
10、它依照欧洲通信标准化委员会(ETSI)制定的GSM规范研制而成,是第二代移动通信技术(2G)。其开发目的是让全球各地可以共同使用一个移动电话网络标准,让用户使用一部手机就能行遍全球。2.2 GSM移动通信系统的总体结构GSM移动通信系统是一种典型的基于TDMA的数字蜂窝移动通信系统,总体结构由以下功能单元组成10:2.2.1 移动台(Mobile Station)它包括移动设备(ME)和用户识别模块(SIM)。根据业务的状况,移动设备可包括移动终端(MT),终端适配功能(TAF)和终端设备(TE)等功能部件。2.2.2 基站子系统BSS(Base Station Sub-system)1) 基
11、站(BTS):为一个小区服务的无线收发信设备。2) 基站控制器(BSC):具有对一个或多个BTS进行控制以及相应呼叫控制的功能,BSC以及相应的BTS组成了BSS(基站子系统)。BSS是在一定的无线覆盖区中,由移动业务交换中心(MSC)控制,与MS进行通信的系统设备。a. 接口管理b. BTSBSC之间的地面信道管理c. 无线参数及无线资源管理d. 测量和统计e. 切换3) 基站发信台(BTS):受控于基站控制器(BSC),属于基站子系统(BSS)的无线部分,服务于某小区的无线收发信设备,实现BTS与移动台(MS)空中接口的功能。BTS主要分为基带单元、载频单元和控制单元三部分。基带单元主要用
12、于话音和数据速率适配以及信道编码等;载频单元主要用于调制/解调与发射机/接收机间的耦合;控制单元则用于BTS的操作与维护。 BTS中存储编码算法A5和密钥Kc,用于解密接收到的密文形式的用户数据和信令数据(包括解密)。2.2.3 网络子系统NSS(Network Sub-system)1)移动业务交换中心(MSC):对于位于它管辖区域中的移动台进行控制交换的功能实体。2)拜访位置寄存器(VLR):MSC为所管辖区域中MS的呼叫接续,所需检索信息的数据库。VLR存储与呼叫处理有关的一些数据,例如用户的号码,所处位置区的识别,向用户提供的服务等参数。 3)归属位置寄存器(HLR):管理部门用于移动
13、用户管理的数据库。每个移动用户都应在其归属位置寄存器注册登记。HLR主要存储两类信息,有关用户的参数和有关用户目前所处位置的信息。 4)设备识别寄存器(EIR):存储有关移动台设备参数的数据库。主要完成对移动设备的识别、监视、闭锁等功能。 5)鉴权中心(AUC):认证移动用户的身份和产生相应鉴权参数(随机数RAND,符号响应SRES,密钥Kc)的功能实体。2.2.4 操作支持子系统OSS(Operations Sub-system)操作维护系统中的各功能实体。依据厂家的实现方式可分为无线子系统的操作维护中心(OMC-R)和交换子系统的操作维护中心(OMC-S)。GSM系统可通过MSC实现与多种
14、网络的互通,包括PSTN、ISDN、PLMN和PSPDN。以上是GSM的四个分系统,各分系统之间都有定义明确且详细的标准化接口方案,保证任何厂商提供的GSM 系统设备可以互连。同时,GSM 系统与各种公用通信网之间也都详细定义了标准接口规范,使GSM 系统可以与各种公用通信网实现互连互通。GSM 系统除了可以开放基本的话音业务外,还可以开放各种承载业务、补充业务以及与ISDN 相关的各种业务。GSM 系统采用 FDMA/TDMA 及跳频的复用方式,频率重复利用率较高,同时它具有灵活方便的组网结构,可满足用户的不同容量需求。GSM 系统具有较强的鉴权和加密功能,能确保用户和网络的安全需求,系统抗
15、干扰能力较强,通信质量教高2。GSM系统工作频段分配为:GSM900MHz频段为:890915MHz(移动台发,基站收),935960MHz(基站发,移动台收);DCS 1800MHz 频段为:17101785MHz(移动台发,基站收),18051880MHz(基站发,移动台收)。第三章 GSM系统的语音编码简介语音编码就是对模拟的语音信号进行编码,将模拟信号转化成数字信号,从而降低传输码率并进行数字传输,语音编码的基本方法可分为波形编码和参量编码,波形编码是将时域的模拟话音的波形信号经过取样、量化、编码而形成的数字话音信号,参量编码是基于人类语言的发音机理,找出表征语音的特征参量,对特征参量
16、进行编码1。欧洲GSM系统用的是剩余激励性预测编码/长期预测(RELP/LPT)。这种方法把来自送话器的话音信号经过8kHz抽样,13bits均匀量化变为104kbps的数据流,数据流进入话音编码器进行规则脉冲激励-长期预测(RPE-LTP)编码。PRE-LTP编码属于中速率混合型编码,为提取特征参数而作的语音分析利用了语音信号的准平稳性,即在1020ms的短时间内可认为语音的特征参数不变。因此可将实际语音信号分成短时间段,在各个段内分别进行参量提取。GSM系统的编码处理是按帧进行的,每帧20ms,含160个语音样本,经话音编码后为260bits的编码块,即话音编码后的信号速率为13kbps。
17、同时GSM标准(PHASE2+)要求移动台对语音进行检测,将每个时间段分为有声段和无声段。在有声段,进行语音编码产生编码语音帧;在无声段,对背影噪声进行估计,产生SID帧(静寂描述帧)。发射机采用不连续发射方式,即仅在包含语音帧的时间段内才开发射机。SID帧是在语音段结束时发射的。接收端根据受到的SID帧的信息在无声期内插入舒适噪声。13kbps的话音信号进入信道编码进行编码。RELP/LPT编码后每帧长20ms,编码速率为13kbps,有希望降到6.5kbps,这是一种既简化编码又能使合成波形失真较小的方法。第四章 语音编码的发展现状按照不同使用要求,目前已研究出不同的语音编码方法,并制定了
18、相应的标准,在表1中对这些标准作了归纳。由此表可见,64和32kbps编码技术已经成熟,早已制定出国际标准算法。16kbps编码方法,CCITT也已于前面发布了建议(G .728),其基本要求是:语音质量足以适应多级编译码、处理时延低,足以克服回声影响,以及处理音频的非语音信号的能力。CCITT的建议采用一种后向自适应低延迟码激励线性预测(Low Delay-Code Excited Linear Prediction . LD-CELP)算法15。 表1编码速率(kbps)6432161384.82.46.4标准制定年代1972198619911988198919891975标准制定组织CC
19、ITTCCITTCCITTGSMCTIANSANSA海事卫星编码方法PCMADPCMLD-CELPRPE-LTPVSELPCELPLPCMBE语音质量MOS4.34.143.73.0+2.5*DRT959494*93+93+90DAM736870*68*67-54主要用途通 信 网移动通信语音邮件保密电话移动通信注:CCITT-Consulatative Communicate for Telephone and Telegraph GSM-Group Special Mobiale CTIA-Celuar Technology Industry Association NSA-Nationa
20、l Security Agency*估计值 , 上界, + 下界由上述可见,自64kbps至16kbps的语音编码质量,目前已可达到近于透明(MOS分4.0以上)的质量标准。13kbps及8kbps的语音编码都是为移动通信制定的。13kbps是欧共体国家制定的标准,它采用规则脉冲激励长时线性预测(Regular Pulse Excited-long Term Prediction,RPE-LTP)方案。8kbps是美国CTIA制定的标准,它采用矢量和激励线性预测(Vector Sum Excited Linear Prediction,VSELP)方案。它们的质量仅达到了“通信质量”(MOS3
21、.5以上)尚未达到透明或近于透明。这一级的语音编码方法还有待于进一步研究,提高语音质量。海事卫星组织(Inmarsat)制定的6.4kbps标准采用多带激励(Multi-Band Excited,MBE)线性预测算法。6.4kbps中仅4.15kbps用于语音编码,其余2.25kbps用于纠错编码。更低速率的语音编码标准速率为4.8kbps和2.4kbps。2.4kbps的语音编码信号由于可以通过2.4kbps的全双工调解器进入PSTN,使用价值极大,一直是人们研究和关注的重点。美国国防部国家安全局已于1975年制定了一个标准(LPC-10),采用典型参量编码线性预测方案,语音质量不能另人满意
22、。因此,美国国防部在新的标准LPC-10e,它是在原方案基础上改进的。新方案的语音质量有所提高,但是对于非语音(例如,咳嗽、口哨、脉冲噪声等)信号的处理还不另人满意。因此,1988年12月美国国防部又颁布了1.8kbps标准。它的语音质量教好,抗干扰和环境噪声能力强,清晰度测试得分高于16kbps连续变斜率增量调制CVSD)的性能,达到DRT93%,可以和32kbps的CVSD质量相比较。这个4.8kbps标准采用的是一种混合编码算法(CELP),这种方案具有今后扩展的可能,并具有抗信道误码和环境噪声的能力。目前,这一方案可以用单片新一代的DSP实现,它将用于美国地面移动通信网中。NASA表示
23、将采用它于移动卫星通信网中,NATO也将要规定其作为NATO的标准。第五章 语音编码质量的评定在语音编码技术中,对语音质量的评价是一个很重要的问题。如何评价语音编码质量归纳起来大致可以分为两类,即客观评定方法和主观评定方法11。5.1 客观评定方法用客观测量的手段来评价语音编码的质量,常用的方法有信噪比,加权信噪比,平均分段信噪比等。它们都是建立在度量均方误差的基础上,其特点是计算简单,但是不能完全反应人对语音质量的感觉。这个问题对于速率为16Kbits/s以下的中、低速率语音编码尤为突出,因此主要适用于速率较高的波形编码类型。5.2 主观评定方法该方法符合人类听话时对语音质量的感觉,因而目前
24、得到广泛应用。最主要的主观评定方法是主观评定等级(Subjective Opinion Scale),或称平均评价得分(Mean Opinion Score)MOS等级。MOS得分采用五级评分标准,其方法是,由数十名视听者在相同信道环境中视听并给予评分,然后对评分进行统计处理,求出平均得分。由于主观和客观上的种种原因,每次视听所得的评分会有波动。为了减小波动的误差,除了试听者人数要足够多之外,所测语音材料也要足够丰富,视听环境也应尽量保持相同12。另外,试听者对语音质量的主观感觉往往是何其注意力集中程度相联系的,因而,对应于主观评定等级,还有一个收听注意力等级(Listening Effect
25、 Scale)。表2给出主观评定等级的质量等级,分数和相应的收听注意力等级。从用户角度看,通常认为MOS分4.04.5分为高质量语音编码,达到长途电话网的质量要求。MOS分3.5分左右称为通信质量,这时听者能够感觉到语音质量有所下降,但不影响正常的通话,可以满足多数通信系统的使用要求。MOS分3.0分以下常称为合成语音质量,这种语音一般只有足够高的可懂度,但是自然度教差,不容易识别讲话者,这样话音质量不超过3分13。质量等级分数收听注意力等级优5可完全放松,不需要注意力良4需要注意,但不需明显集中注意力满意(正常)3中等程度的注意力差2需要集中注意力劣1即使努力去听,也很难听懂表2 第六章 语
26、音编码技术6.1 语音编码技术的分类语音编码主要有三种方式: 波形编码、声码器和混合编码, 通常把编码速率低于64 kbps 的语音编码方式称为语音压缩编码技术. 下面分别介绍这三种编码方法。6.1.1 波形编码波形编码是将时间域信号直接变换为数字代码,力图使重建语音波形保持原语音信号的波形形状。波形编码的基本原理是在时间轴上对模拟语音按一定的速率抽样,然后将幅度样本分层量化,并用代码表示。解码是其反过程,将收到的数字序列经过解码和滤波恢复成模拟信号。可以看出,波形编码的设计基本上是与信号源分离的,因此对各种各样的信号进行编码均可以达到很好的效果。波形编码包括时域编码和频域编码。时域编码. 时
27、域编码主要有脉冲编码调制( PCM) 、增量调制(M) 、自适应差分脉码调制(ADPCM) 、自适应增量调制(ADM) 、自适应预测编码(APC) 等.线性PCM 是用同等的量化级进行量化, 没有利用声音的性质, 所以信息没有得到压缩, 对数PCM 利用了语音信号幅度的统计特性, 对幅度按对数变换压缩, 将压缩的结果作线性编码, 在接收端解码时, 按指数扩展, 这种方法在数字电话通信中得到了广泛的应用, 现有的PCM 采用编码速率为64 kbps 的A 律律对数压扩方法. 由于对数PCM 广泛应用于通信系统中, 而线性PCM 可以直接进行二进制运算, 所以一般速率低于64 kbps 的语音编码
28、系统多是先进行对数PCMO线性PCM 变换后, 再采用信号处理器进行语音信号数字处理. PCM 最大缺点是数码率高, 在传输时所占频带较宽.差分脉码调制(DPCM) 是根据相邻采样值的差值信号进行编码, ADPCM 是在DPCM 的基础上发展起来的, 其量化器与预测器的参数能根据输入信号的统计特性自适应于最佳或接近于最佳参数状态. ADPCM 是语音编码中复杂程度较低的一种方法.增量调制是根据信号的瞬值是否增大或减小, 即根据增量编码, 用一位二进制码序列对模拟信号进行编码. 这种方法简单, 实现容易, 但由于量阶固定, 量化噪声功率固定, 所以当信号下降时, 信噪比(SNR) 下降. 为了改
29、进这种方法的动态范围, 引进了自适应技术, 让量阶的大小随输入信号的统计特性变化而变, 这种方法称为自适应增量调制(ADM) . CVSD 是让量阶的大小随音节时间间隔(520 ms) 中信号平均斜率变化, 信号的斜率是通过输出连“0”或连“1”来检测的. ADM 编码器简易, 同步简单, 成本低, 是数字移动通信中较好的一种语音编码方法. APC 是根据语音的统计特性, 由过去的采样值精确预测出当前样值的一种编码方法, 它是通过自适应预测器来提高预测精度的, 预测得越精确, 编码速率越低, 这种方法可以做到低速率(10 kbps 以下) , 并且音质与电话音质相似.6频域编码. 频域编码方式
30、主要有子带编码(SBC) 和自适应变换编码(ATC)SBC 是利用带通滤波器将语音频带分成若干子带, 并且分别进行采样、编码, 编码方式可以用ADPCM 或ADM , SBC 速率可以达到9. 6 kbps . 可变SBC 可使子带的设计不固定, 而是随共振峰变化, 使编码速率进一步提高, 这种方式在速率为4. 8 kbps 时可具有相当于7. 2 kbps 的固定SBC 的语音质量.ATC 是先将语音信号在时间上分段, 每一段信号一般有64512 个采样, 再将每段时域语音数据经正交变换转换到频域, 得到相应的各组频域系数, 然后分别对每一组系数的每个分量单独量化、编码和传输, 在接收端解码
31、得到的每组系数再进行频域至时域的反变换, 恢复时段信号, 最后将各时段连接成语音信号, ATC 编码在速率为1216 kbps 可得到优质语音.脉冲编码调制(PCM) 、差分脉冲编码调制(DPCM) 、自适应差分脉冲编码调制(ADPCM) 、增量调制(M) 、自适应增量调制(ADM) 、连续可变斜率增量调制(CVSDM) 、自适应预测编码(APC) 、自适应变换编码(ATC) 、子带编码(SBC)等,都属于波形编码技术。波形编码器从64Kbit/s到16Kbit/s的比特率,如果速率在16Kbit/s以下,语音波形编码的话音质量通常迅速下降8。波形编码适用于很宽范围的语音特性,以及在噪音环境下
32、,它们都保持稳定。因此,它具有适应能力强、语音质量(64kbpsPCM的MOS一般为4.3分)好等优点。但是所用的编码速率高,在对信号带宽要求不太严格的通信中得到应用,而对于频率资源相对紧张的GSM系统来说,这种编码方式显然不合适。6.1.2 声码器所谓声码器是根据发音模型, 分析并提取语音信号的特征参数, 且只传送能够合成语音信息的参数, 不需要再现原语音的波形, 典型的声码器有谱带式、共振峰式和按线性预测分析(L PC) 所组成的声码器等.( 简单的说,声码器是以发声机制的模型为基础,确定了 一套模拟声带频谱特性的滤波系数和若干声源参数,把这一套滤波器系数和声源参数传送到接受机,在接收机里
33、合成话音。)谱带式声码器在发送语音信号的三种信息, 其中一种信息是使语音信号通过1020 个并联带通滤波器, 通过检波得到信号的包络值, 再用50 Hz 或30 Hz 的帧频传送, 另一种信息是声带音调, 通过音调控制器从语音中分析出基音频率, 并送出相应的电压信号, 第三种信息是语音中的“浊”音、“清”音, 将上述信息通过采样、量化、编码, 合成发送出去, 在接收端设置蜂音, 噪声发生器, 产生周期脉冲, 其频率与基音相等, 发生器的输出由浊音、清音检测控制开关的交替通断, 再被发送端送来的相应信息调制, 就得到合成的语音, 其速率可压缩到2. 4 kbps .共振峰声码器是利用语音频带中的
34、共振峰信息进行编码, 它的速率可压缩到1. 2 kbps , 这种方法存在的问题是要准确地提取共振峰的频率比较困难.线性预测声码器(L PC) 是一种比较有实用价值的声码器, 典型的方法如美国国家安全局于1975 年及1986 年选定的线性预测编码(L PC 10) 及改进型线性预测编码(L PC 10E) , 数码率为2. 4 kbps , 用10 阶线性预测的方法提取声道参数, 采用区分浊音和清音的二元激励, 清音用白噪声和浊音用周期为基音周期的脉冲序列合成语音, 用这种方法传输, 还原出来的语音的清晰度、可懂度仍很高.LPC为线性预测分析,是声源编码技术之一。它供一组语音信号模拟参数,该
35、参数教精确地表征了语音信号的频率幅度。线性预测由过去的样本值来预测或估计当前信号的结束值,该值为线性预测值。线性预测误差是信号值与线性预测值之差。设计一个预测误差滤波器,使得在某个预定的准则条件下误差最小,这个过程称为线性预测分析(LPC) 。LPC模型中的所有模型参数都必须随时间不断修正,对于不同的音素(如声母、韵母可分为辅音、单元音、复元音、复鼻尾音等)控制参数时刻的选取也不同。采用这种编码技术可实现低速率语音编码,比特率可压缩到2Kbit/s4.8Kbit/S,甚至更低,但语音质量(MOS为3分)只能达到中等,往往清晰度可以而自然度没有,很难辨认讲话人是谁,其次是复杂度比较高。6.1.3
36、 混合编码混合编码是近年来出现的一种新的编码方法, 这种方法在保留参数模型技术精华的基础上, 应用波形编码准则去优化激励信号, 从而在4. 89. 6 kbps 的数码率上获得了较高质量的合成语音(简而言之,混合编码就是将波形编码和参量编码组合起来,保留了声码器的滤波,但改善了”激励”参数的信息,克服了原有波形编码和参量编码的低速率,在416Kbit/s速率上能够得到高质量(MOS)的合成语音), 其代表是一类称之为“按分析合成” (ABS) 的方法, 采用听觉加权技术, 在闭环的基础上寻找主观意义上失真最小的激励矢量. 由于采用的激励信号模型不同, 这类方法派生出多种新的编码方法, 都能在9
37、. 6 kbps 码率上获得较高的话音质量. 典型的方法有剩余激励线性预测编码(REL P) , 多脉冲激励线性预测编码(MPC) , 码激励线性预测编码(CEL P) . MPC 采用数目有限, 非均匀间隔的冲激序列作为激励, 在REL P 中信号同样为冲激序列, 但其间隔为常数, 所以REL P 除需指明序列的起始位置外, 无需对每一个脉冲位置进行描述, 而MPC 需用脉冲的位置与幅度来描述. CEL P 采用矢量量化技术, 将代表语音段的矢量构成一庞大的码本中的地址, 而不是传送N 维样值序列, 再用矢量去激励声道. CEL P 能高效地压缩数码率, 但是, 建立码本搜索码字的运算量也比
38、较大.多脉冲激励线性预测编码(MPLPC),规划脉冲激励线性预测编码(KPELPC),码本激励线性预测编码(CELP)等都是属于混合编码技术。很显然,混合编码是适合于数字移动通信的语音编码技术。其中,多脉冲激励线性预测编码(MPLPC)就应用在GSM系统中。6.2 分析GSM系统中的语音编码技术多脉冲激励LPC为了有效利用信道带宽,数字无线通信系统都依赖于语音编码技术来去除语音中几乎所有的冗余,来提供速率远小于PCM的高质量数字化语音通信。通常解决的方法是采用信源编码技术,如多脉冲激励LPC或其规则脉冲激励方式,以及CELP,它们以低于16kbps的比特率维持了高质量的合成语音。多脉冲激励LP
39、C技术利用了合成分析原理,即在编码器的设计中包括了译码器的副本。在语音编码中,编码过程常称为语音分析,它功能是将语音信号转换为低速率的数字信号;解码过程通常称为语音合成,其功能是将低速率的数字语音信号合成为模拟语音信号。6.2.1 多脉冲激励LPC编码器的组成(1)语音预测模型的合成滤波器这种滤波器由一个用来模型化语音的短期频谱包络的全极点(即滤波器的转移函数只含极点)构成。其中短期是指滤波器参量是基于语音信号的当前样值计算得到的。其中,语音信号的当前值由816个先前的样值预测得到的。合成滤波器还可能包含一个用长期预测器来模型化语音频谱的精细结构。在这种情况下,合成滤波器的功能都是为了提供原始
40、语音的高质量的合成4。(2)产生激励的激励发生器此激励由515ms周期内数量一定的脉冲组成。多脉冲激励(MPE)的设计思想是:只对激励信号的重要部分抽样编码,忽略其它部分抽样,以此降低编码比特率。(3)差错最小化用来最优化原始语言与合成语音之间可感知的加权错误。进行最小化的目的是为了最优化激励中采用的脉冲幅度和相位。最小化中通常采用均方差准则。6.2.2 编码过程(1)合成滤波器的自由参数采用实际语音样本作为输入计算得到的。此计算是在最优化回路之外进行的,持续时间为1030ms(这段时间内语音信号被视为是静止的) 。(2) 合成滤波器的最优激励通过最小化图(下图a所示)的闭环可察觉加权误差得到
41、。因此,语音样本分不同帧(1030ms)来计算滤波参数,每个帧又进一步分为子帧(515ms)来最优化激励。量化的滤波器参数和量化的激励构成了发射信号。这里允许帧与帧之间的滤波器参数和量化的激励各不相同,也允许了子帧与子帧之间的激励各不相同,因此编码器能够跟踪语音的非稳态特性,尽管是在分批基础上进行的。6.2.3 多脉冲激励LPC译码器的组成译码器位于接收机的内部,由两部分组成:激励发生器和合成滤波器(如上图b所示),两个部分与编码器中的对应部分相同。译码器的作用是为了利用接收信号来得到原始语音信号的合成信号,这是由译码激励通过(参数设置与编码器中一致的)合成滤波器获得的。为了减少编译码器的计算
42、复杂度,激励的单个脉冲之间的间隔限制为一个相同值。得到的分析合成编译器具有规则脉冲激励。第七章 语音编码芯片实现ADPCM 的芯片有MC145532 , 全双工, 可提供速率为32 kbps ; 实现CVSD 有MC3417 , MC3418 , MC3517 , MC3518. 单片可调速声码器Q4401 是具有20世纪90 年代国际先进水平的VLSI 单片声码器14, 它包括QCEL P 编码器、QCEL P 解码器、帧定时发生电路、输入净音、音调产生以及PCM 接口电路和微处理器接口等, 其中编码器和解码器是Q4401的核心. Q4401 具有速率可调(8009 600 bps) , 编
43、码延迟较小(小于50 ms) , 语音质量较高5。第八章 语音编码技术进展从目前语音编码技术发展来看, CEL P 比MPL PC 的复杂度更高, 码速率更低, 可以在4. 8 kbps左右的码速率获得较高质量的语音,是当今中、低速率语音编码的主流技术之一,在对其改善质量,降低复杂度,减少编码延迟等方面都提出了不少新方法,使CEL P 在实践中得到广泛应用,许多国际标准化组织及机构纷纷将这一编码方案作为语音编码标准,语音编码今后的研究重点将逐步转向更低速率的编码方法.CEL P 类算法是目前中低速语音压缩编码的主流算法之一,许多国际标准化组织及机构将这一方案纳为语音编码标准,目前已形成的标准有
44、:美国政府标准FS1016 (4. 8 kbps CEL P ) , 北美数字蜂窝语音编码IS54 (8 kbps VSRL P) , 日本数字蜂窝语音编码JDC (6. 7 kbps CEL P ) 等7,9。结束语在移动通信系统中,语音编码的设计和主观测试是相当困难的。只有在低速率语音编码情况下,数字调制方案才有助于提高语音业务的频谱效应。为了使语音编码有实用性,语音编码必须消耗的功率少和提供可直接接受直至很好的语音质量。语音编码的目的实在保持一定的算法复杂程度和通信时延的前提下,运用尽可能少的信道容量,传送尽可能高质量的语音。通常,编码器的效应和获得此效率的算法复杂度之间有正比关系。算法
45、越复杂,时延与费用就会越高。因此就必须在这两个矛盾的因素之间寻求一个平衡点,是平衡点向更加低的比特率方向移动。相信随着移动通信等重要应用的蓬勃发展,低速率语音编码技术必将继续前行,为现代数字社会化发挥更重要的作用。参考文献1 曹志刚, 钱亚生. 现代通信原理M . 北京: 清华大学出版社, 1992.2 谢希仁. 计算机网络M . 北京: 电子工业出版社, 1999.3 朱光华. 移动通信技术M . 杭州: 浙江科学技术出版社, 1991.4 吴乐南. 数据压缩的原理与应用M . 北京:电子工业出版社, 1995.5 付世友. 语音编码与语音芯片J . 电生技术, 1995 (3) : 8 1
46、2.6 . 李文海,石方文. 数字通信原理M. 北京:人民邮电出版社,2001.7 Rappaport S Theodore . 无线通信原理与应用M. 北京:电子工业出版社,1999.8 赫金 . 通信系统(第四版)M.北京:电子工业出版社,2003.9 彭新光,佘雪丽,王华奎,等M.数字移动电话机M.北京:人民邮电出版社,1999.10 秉钧,孙学军,沈保锁,等.现代移动通信系统原理.M.天津:天津大学出版社,1993.11 Written by Analyzer Expert Team,Motorola Electronics Ltd.Analyzer training Project LevelI. 2000.12 Zhao Jun. Lossless compechniques In: Proceeding of the 36th Midwest Symposium, 1993.12681270.16 Denecker K. An experimental comparison of several. : lossles