第4章矢量量化课件.ppt

上传人:小飞机 文档编号:3836754 上传时间:2023-03-24 格式:PPT 页数:66 大小:1.26MB
返回 下载 相关 举报
第4章矢量量化课件.ppt_第1页
第1页 / 共66页
第4章矢量量化课件.ppt_第2页
第2页 / 共66页
第4章矢量量化课件.ppt_第3页
第3页 / 共66页
第4章矢量量化课件.ppt_第4页
第4页 / 共66页
第4章矢量量化课件.ppt_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《第4章矢量量化课件.ppt》由会员分享,可在线阅读,更多相关《第4章矢量量化课件.ppt(66页珍藏版)》请在三一办公上搜索。

1、24.03.2023,1,第四章 语音信号的矢量量化,4.1 概述4.2 矢量量化的基本原理4.3 失真测度4.4 最佳矢量量化器和码本的设计4.5 降低复杂度的矢量量化系统4.6 语音参数的矢量量化4.7 人工神经网络与VQ4.8 遗传矢量量化,24.03.2023,2,4.1 概述,量化分为两大类:一类是标量量化,另一类是矢量量化。标量量化:用若干个离散的数字值来表示每一个幅度具有连续取值(模拟值)的离散时域信号(采样信号)。,24.03.2023,3,矢量量化的定义:矢量量化(Vector Quantization)是将若干个取样信号分成一组,即构成一个矢量,然后对此矢量一次进行量化。将

2、某一范围内的矢量归为某一类,即所谓的矢量量化,24.03.2023,4,矢量量化研究的基础是信息论的一个分支:“率畸变理论”,其中有两项理论研究成果对于矢量量化算法的发展起关键作用。第一,该理论指出,对于一定的量化速率R(以每个采样信号平均所用的量化比持数衡量,用比特采样表示),量化畸变D(以量化信号与原信号之间的误差均方值和原信号均方值之比来衡量)是一定的。第二,无论对于何种信息源,即使是无记忆的信息源(即各个采样信号之间相互统计独立的情况),矢量量化总是优于标量量化,且矢量维数越大优度越高。,24.03.2023,5,矢量量化的应用:进入80年代以后,矢量量化技术引入语音处理领域,使之又有

3、长足的进步。目前这项技术已经用于语音波形编码,线性预测编码、语音识别与合成、图像压缩等。矢量量化的研究目的:针对待定的信息源和矢量维数,找到一种最优的矢量量化器,它能够在R一定时给出最低的畸变。,24.03.2023,6,上图的两维矢量空间里,存在6类矢量,每一类都有一个中心,称为室心,每一室心对应一个码字矢量。从量上来表征第i类矢量。集合 称为码本。,什么是矢量量化(VQ),24.03.2023,7,任意一个矢量V应该归为哪一类,要看它是“靠近”哪一类矢量,或者说它离哪一个室心最“近”。例如上图中虚线画出的矢量V最靠近V1,则将其规定为V1类,并用V1表示V,或者说V被量化为V1。这样作可以

4、把本来无限多的矢量只用有限个码字矢量来表示(此处为6个)。假如码本中的码字矢量是有序的,则被量化的矢量可用码字序号来表示。因此,可以大大压缩信息量。,24.03.2023,8,4.2 矢量量化的基本原理,矢量量化的过程是:将语音信号波形的A个样点的每一帧,或有k个参数的每一参数帧,构成k维空间中的一个矢量,然后对这个矢量进行量化。标量量化和矢量量化的区别:在标量量化时,在一维的零至无穷大值之间设置若干个量化阶梯,当某输入信号的幅度值落在某相邻的两个量化阶梯之间时,就被量化为两阶梯的中心值。而在矢量量化时,则将A维无限空间划分为M个区域边界,然后将输入矢量与这些边界进行比较,并被量化为“距离”最

5、小的区域边界的中心矢量值。,24.03.2023,9,下面以K=2为例进行说明。,24.03.2023,10,相关概念:若要对一个矢量X进行量化,首先要选择一个合适的失真测度,而后用最小失真原理,分别计算用量化矢量Yi替代x所带来的失真。其中最小失真值所对应的那个量化矢量,就是矢量X的重构矢量(或称恢复矢量)。通常把所有M个量化矢量构成的集合Yi称为码书或码本(Codebook)。把码书中的每个量化矢量Yi(i=1,2,M)称为码字或码矢。不同的划分或不同的量化矢量选取就可以构成不同的矢量量化器。,24.03.2023,11,矢量量化系统的组成:,矢量量化系统的组成框图,24.03.2023,

6、12,矢量量化的特点:矢量量化的两个问题:,有高度保密的优良性能;用于传输时,其传输速率可以进一步降低;稳定性能好。,如何划分M个区域边界。这个过程称为“训练”或建立码书,方法是:将大量的欲处理的信号的波形帧矢量或参数帧矢量进行统计划分,进一步确定这些划分边界的中心矢量值来得到码书。如何确定两矢量在进行比较时的测度。这个测度就是两矢量之间的距离,或以其中某一矢量为基准时的失真度。它描述了当输入矢量用码书所对应的矢量来表征时所应付出的代价。,24.03.2023,13,选择了失真测度以后,就可以进行矢量量化器的设计了。矢量量化器最佳设计的两个条件是:对给定的码本,(为码本尺寸),在矢量空间,中,

7、找出所有码本矢量的最佳区域边界,使平均失真最小。2)对给定的区域边界,,找出最佳码本矢量,使平均失真最小,也就是得到码本,。,24.03.2023,14,矢量量化器的性能指标:码书大小M、平均信噪比。矢量量化器的设计:,平均信噪比:定义为 方括号中的分子是一秒内信号矢量的平均能量,而分母是一秒内输入信号矢量与码书矢量之间的平均失真(即量化噪声)。从大量信号样本中训练出好的码书,从实际效果出发寻找到好的失真测度定义公式,设计出最佳的矢量量化系统,以便用最少的搜索和计算失真的运算量,来实现最大可能的平均信噪比。,24.03.2023,15,4.3 失真测度,失真的定义:失真测度必须具备的特性:,将

8、输入信号矢量用码书的重构矢量来表征时的误差或所付出的代价。必须在主观评价上有意义,即小的失真应该对应于好的主观语音质量。必须是易于处理的,即在数学上易于实现,这样可以用于实际的矢量量化器的设计。平均失真存在并且可以计算。,24.03.2023,16,失真测度的方法:,均方误差(即欧氏距离)、加权的均方误差、ItakuraSaito(板仓-斋藤)距离,似然比失真测度等。,24.03.2023,17,4.3.1 欧氏距离均方误差,设输入信号的某个k维矢量X,与码书中某个k维矢量Y进行比较,xi、yi分别表示X和Y的元素(1ik),则定义均方误差为欧氏距离,即有,24.03.2023,18,几种其他

9、常用的欧氏距离:,24.03.2023,19,4.3.2 线性预测失真测度,直接用由线性预测系数所描述的信号模型的功率谱来进行比较,采用板仓斋藤(ItakuraSaito)距离,简称IS距离。但是,这两种失真测度也有其局限性,它们都仅仅比较了两矢量的功率谱,而没有考虑其能量信息。,24.03.2023,20,4.3.3 识别失真测度,24.03.2023,21,4.4最佳矢量量化器和码本的设计4.4.1 矢量量化器最佳设计的两个条件,定义:所谓最佳设计,就是使失真最小。由于码书就是在这个设计过程中产生的,所以这也就是码书的设计过程。重要问题:划分量化区间和确定量化矢量。,24.03.2023,

10、22,1最佳划分,对给定的码书yM=Y1,Y2,.,YM(M为码书的尺寸),找出所有码书矢量的最佳区域边界Si(i=1,2,.,M),以使平均失真最小,即寻找最佳划分。由于码书已给定,因此可以用最近邻近准则NNR(Nearest Neighbor Rule)得到最佳划分。这个条件实际上是叙述了最佳矢量量化器的设计。由于给定码书共有M个码字,所以可以把矢量空间分成M个区间Si(i=1,2,.,M)。这些Si称为胞腔。,24.03.2023,23,下图给出了K=2的最佳划分示意图。,24.03.2023,24,2最佳码书,对于给定的区域边界Si,找出最佳码书矢量,使码书的平均失真最小,也就是得到码

11、书yM。这里,使平均失真最小,码字Yi必须为给定的Si(i=1,2,.,M)的形心。形心就是该区域空间的几何中心。这些形心就组成了最佳码书中的码字。这个条件实际上叙述了码书的设计方法。,24.03.2023,25,4.4.2 LBG算法,24.03.2023,26,4.4.3 初始码书的生成,1随机选取法定义:从训练序列中随机地选取M个矢量作为初始码字,从而构成初始码书,就是随机选取法。优点:不用初始化计算,从而可大大减少计算时间缺点:可能会选到一些非典型的矢量作为码字,即被选中的码字在训练序列中的分布不均匀。这样码字就没有代表性,导致码书中有限个码字得不到充分利用,使矢量量化器的性能变差。这

12、种方法带有一定的“盲目性”。,24.03.2023,27,2分裂法,方法原理:先认为码书尺寸为M=1,即初始码书中只包含一个码字。计算所有训练序列的形心,将此形心作为第一个码字(i=0)。然后,将它分裂为 此时码书中包含有两个元素,一个是i=0,另一个是i=1;并按M=2用训练序列对它设计出M=2的码书。接着,再分别将此码书的两个码字一分为二,这时码书中就有了4个码字。这个过程重复下去,经过log2M次设计,就得到所要求的有M个码字的初始码书。特点:初始码书性能较好,以此码书设计的矢量量化器性能也较好;但是随着码书中码字的增加,计算量也迅速增加。,24.03.2023,28,3乘积码书法,这种

13、码书初始化的方法,是用若干个低维数的码书作为乘积码,求得所需的高维数的码书。比如说,要设计一个高维数的码书,可简单地用2个低维数的码书作乘积来获得。即维数为k1,大小为M1的码书乘以维数为k-k1,大小为M2的码书,得到一个k维码书,其大小为M=M1M2。,24.03.2023,29,4.5 降低复杂度的矢量量化系统,方法分类:无记忆的矢量量化、有记忆的矢量量化器。4.5.1 无记忆的矢量量化系统1树形搜索的矢量量化系统 分类:二叉树、多叉树。,24.03.2023,30,如图:码本尺寸M=8的二叉树,它的码本中共包含有14个码字。输入信号矢量为X,先与Y0与Yl比较,计算出失真d(X,Y0)

14、和d(X,Y1)。如果后者较小,则走下面支路,同时送“1”输出。类似地,如果最后到达Yl0l,则送出的输出角标就是101。这个过程也就是矢量量化的过程。,24.03.2023,31,优点:可以减少运算量。缺点:存储容量增大且性能会有所降低。,24.03.2023,32,2多级矢量量化系统,24.03.2023,33,24.03.2023,34,4.5.2 有记忆的矢量量化系统,概念:有记忆的矢量量化在量化每一个输入矢量时,不仅与此矢量本身有关,而且也与其前面的矢量有关。也就在量化时,它通过“记忆”,利用了过去输入矢量的信息,利用了矢量与矢量之间的相关性,从而提高了矢量量化的性能。优点:在语音编

15、码中,引入记忆后,还可利用音长、短时的非平稳统计特性,清音、浊音和无声区域的特性,短时频谱特性等信息。意味着在相同维数条件下大大提高了矢量量化系统的性能。,24.03.2023,35,预测矢量量化(Predictive VQ),自适应矢量量化(Adaptive VQ),APVQ是它们的结合。下图是APVQ的系统框图。,24.03.2023,36,4.6 语音参数的矢量量化,语音参数矢量量化的定义:将语音信号经过分析,得到各种参数,然后再将这些按帧或按段分析所得的参数组构成矢量,进行矢量量化。,语音参数的矢量量化:是在生成码本的基础上,对作为矢量的语音参数序列进行编码的过程。这个定义含有两个过程

16、:先要生成码本,这是将语音参数序列作为矢量空间分类的形成码本的过程;将语音参数序列作为矢量,参照码本归类的过程;,24.03.2023,37,举例分析,矢量量化前,每秒44.4帧,用54bit量化(其中,十个线性预测系数用41 bit,基音周期用6bit,增益参数5bit,清浊音判决用1 bit,同步用1bit)。而在VQ LPC声码器中,线性预测系数是Ai,基音周期是Bi,增益参数Gi和浊清音识别参数Vi。,24.03.2023,38,VQ LPC声码器特点:对线性预测系数采用了矢量量化,而其余参数均采用差值标量量化。编码速率明显地比原来的LPC声码器低。,语音编码的目的:力求用尽可能低的编

17、码速率,以传输尽可能高的语音质量(尽可能地减小重建信号与原始信号之间的失真),而希望设备简单,成本尽可能低。,24.03.2023,39,采用与能量和增益无关的对数似然比失真测度作为VQ的距离测度。码书尺寸为1 024,即用10bit来表示其角标。码书的产生是用10个人(其中7人为男子,3人为女子)的大约30分钟的随机对话的声音来进行训练产生的。并将训练序列分为浊音和清音两类。因此,对应的码书也分为浊音码书和清音码书两类,都用LBG算法训练。,VQ LPC声码器的设计方法,24.03.2023,40,由于采用了矢量量化,所以VQ LPC声码器编码速率明显降低了。在这种声码器中,仅对线性预测系数

18、采用了矢量量化,对其他参数均采用差值标量量化。这种混合编码方式是解决矢量量化系统复杂度过高的一个方法。,意义:,24.03.2023,41,4.7 人工神经网络与VQ,人工神经网络的一项非常重要的功能是通过学习实现对于输入矢量的分类。即每输入一个矢量,人工神经网络输出一个该矢量所属类别的标号,从这一点看它与VQ的功能是十分相近的。人工神经网络与普通VQ不同而独具特色之处在于:(1)它是由大量神经元构成的并行分布处理系统来实现的,因此较之普通VQ的串行搜索而言,它可以用并行搜索方法由输入矢量求得其输出标号。因此,它的运行速度比前者高得多。(2)人工神经网络依托于这套并行分布处理机构,可以建起高效

19、的学习算法(与VQ码本的建立算法相对应,也可称之为训练算法)。,24.03.2023,42,学习算法可以分成无监督和有监督两大类。无监督学习算法又称为自组织学习算法,它对输人矢量所做的类别划分,无需依赖于外界事先已建立的对这些矢量类别的约定,从这点看自组织学习算法与普通VQ码本建立算法十分相似。有监督的学习算法则需在学习之前就建立训练矢量集合中各个矢量所属类别的约定,通过学习使神经网络能够完成这种约定;并且推而广之及于所有末参加训练的输人矢量。这样有监督学习算法可以直接或间接地用于完成各种模式识别任务。(3)对于普通VQ,各个输出标号之间不存在空间关系上的关联(拓朴关系)。而对于像Kohone

20、n自组织特征映射人工神经网络等类型的网络,各个输出之间存在空间拓扑关联。这对于进一步利用这些输出是很有价值的。,24.03.2023,43,有三种人工神经网络与这一章讨论的VQ有密切关系,它们是:(1)前向多层人工神经网络(采用有监督学习算法);(2)ART(自适应谐振理论)人工神经网络(采用自组织学习算法);(3)TKohonen自组织待征映射人工神经网络(自组织和有监督学习算法都被采用)。,24.03.2023,44,4.7.1 Kohonen神经网络简介,在对人类的神经系统及脑的研究中,人们发现:人脑的某些区域对某种信息或感觉敏感,如人脑的某一部分对视知觉的处理特别有效,而另一部分则对听

21、知觉的处理特别有效。这种情况使人们对大脑的作用的整体性与局部性特征有所认识。对大脑的研究表明,大脑是由大量协同作用的神经元群体组成的。大脑的神经网络是一个十分复杂的反馈系统,在这个系统中含有各种反馈作用,有整体反馈,局部反馈;另外,还有化学交互作用。在大脑处理信息的过程中,聚类是其极其重要的功能。大脑通过聚类过程从而识别外界信号,并产生自组织过程。,24.03.2023,45,具有二维网格的自组织特征映射网络模型,24.03.2023,46,自组织特征映射神经网络学习算法的步骤如下:,采用随机扰动法生成一组初始权值:式中N为输入节点数,它对应着输入矢量的维数;M为输出节点的个数,同时将M个输出

22、节点排列成二维阵列,每一个节点表示一个聚类中心。,(2)每次输入一个N维的训练矢量,采用欧几里德距离测度,计算各输入节点到每一输出节点j的距离:,,,24.03.2023,47,(3)选择最佳匹配的输出节点。即选出最小 对应的输出节点。(4)调整相邻近节点 的权值:式中j是包含在 内的与相邻的输出节点。(t)是一个大于0而小于1的增益函数,其值是随迭代次数逐渐递减的。以节点为中心的邻近区域的大小(以邻域函数来表示)也是随迭代次数逐渐缩小的。,24.03.2023,48,(5)其它神经元的权值保持不变,即:(6)如果已经达到预定的迭代次数,停止迭代,否则转向(2)继续迭代,或象矢量量化那样根据相

23、对失真值观察收敛的情况,决定是否结束。,24.03.2023,49,4.7.2 二进树码本形成算法在kohonen神经网络中的应用,24.03.2023,50,24.03.2023,51,24.03.2023,52,24.03.2023,53,24.03.2023,54,4.8 遗传矢量量化(GAVQ)算法,求取VQ码本的传统的方法是LBG算法。但该算法是一种局部优化算法,得到的码本质量往往不高。本节采用的遗传矢量量化算法(Genetic Algorithms Vector Quantization,GAVQ),是一种全局优化算法,将遗传算法的全局优化特性和VQ建模技术巧妙地结合起来,通过科学

24、的编码方案及对初始群体中的VQ码本进行有效的遗传操作从而搜索出训练矢量空间中的全局优化VQ码本。,24.03.2023,55,4.8.1 遗传算法,遗传算法(Genetic Algorithm-GA)由美国J.Holland教授提出的,是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局优化概率搜索算法。它模拟物种从低级到高级的演化过程,从一个称之为群体的随机初始解的集合开始,采用优胜劣汰,适者生存的自然法则,通过对群体施加遗传操作实现群体内个体结构重组的迭代过程,每一次迭代获得一组解答,每个解答由一个适应度函数来评估,这一过程不断重复,直到达到某种形式上的收敛。,24.03.2023

25、,56,遗传算法尤其适用于处理传统搜索方法难以解决的复杂和非线性问题,可以广泛用于组合优化、机器学习、自适应控制和人工生命等领域。而且,遗传算法作为一种新的全局优化搜索方法,具有简单通用、鲁棒性强、适于并行处理和应用广泛的优点,近些年得到了迅速的发展,已广泛用于最优控制、图像编码、发现博弈策略等许多实际问题的求解。它比盲目的搜索效率高得多,又比专门针对特定问题的算法通用性强,是一种与问题无关的求解模式。,24.03.2023,57,遗传算法包括三个基本操作:选择、交叉和变异。1)选择选择运算又称为繁殖、再生或复制运算,用于生物界优胜劣汰的自然选择。它从第代种群中选择出优良的某些染色体,放入匹配

26、池(缓冲区,match pool),为染色体交叉和变异运算产生新种群做准备。适应度越高的染色体被选择的可能性越大,遗传基因在下一代种群中的分布就越广,其子孙在下一代出现的数量就越多。选择的方法有多种,较常用的是赌轮盘选择法,应用该方法个体被选中并遗传到下一代群体中的概率与该个体的适应度大小成正比。,24.03.2023,58,2)交叉将群体内的各个个体随机搭配成对,对每一个个体,以某个概率交换它们之间的部分染色体,这样可以创造出新的个体。3)变异变异运算模拟生物在自然的遗传环境中由于各种偶然因素引起的基因突变,它以某一概率随机地改变遗传基因(表示染色体的符号串的某一位)的值。它随机地将染色体的

27、某一个基因由1变成0,或由0变成1。若只有选择和交叉,而没有变异操作,则无法在初始基因组合以外的空间进行搜索,使进化过程在早期就陷入局部解而中止进化,从而使解的质量受到限制。通过变异操作,可确保种群中遗传基因类型的多样性,以便搜索能在尽可能大的空间中进行,避免丢失有用的遗传信息而陷入局部解,获得质量较高的优化解。,24.03.2023,59,遗传算法的步骤如下:第1步:初始化。设置进化代数计数器,设置最大进化代数,随机产生初始种群,个体数目一定,每个个体表示为染色体的基因编码;第2步:个体评价。计算群体中个体的适应度,并判断是否符合优化准则,若符合,输出最佳个体及其代表的最优解,结束计算,否则

28、转向第3步;第3步:选择运算。依据适应度选择再生个体,适应度高的个体被选中的概率高,适应度低的个体可能被淘汰;,24.03.2023,60,第4步:交叉运算。按照一定的交叉概率和交叉方法,生成新的个体;第5步:变异运算。按照一定的变异概率和变异方法,生成新的个体;第6步:终止条件判断。若,则,转到第2步;若,则以进化过程中所得到的具有最大适应度的个体作为最优解输出,终止计算。,24.03.2023,61,4.8.2 遗传矢量量化,其原理如下图所示:,基于遗传算法的矢量量化器框图,24.03.2023,62,遗传算法不能直接处理解空间中的解数据,必须通过编码将它们表示成遗传空间的基因型串结构数据

29、。能否将GA应用于VQ码本的优化设计的关键在于能否将VQ码本的数据结构映射成能用GA进行处理的染色体结构。然后利用特定问题解空间的先验知识来缩小遗传算法的搜索空间,选择一种简便有效的编码方案。,24.03.2023,63,具体做法是:让遗传空间的染色体的每一个基因直接对应VQ码本中的每一个码字矢量。这样染色体的长度(即基因个数)就等于码本的大小,这样一个VQ码本就对应一个个体。遗传算法直接对码本群体中的不同码本进行选择、交叉、变异等遗传操作。GAVQ算法中的每个个体均为VQ码本,因此:个体的适应度函数可以定义为训练矢量序列对该个体(即码本)的平均量化失真的倒数,即:,24.03.2023,64,为了能够对遗传操作的过程进行动态调节,并防止算法出现未成熟收敛,还可以对适应度函数进行动态定标。可以采用幂定标的方式,定标后的适应度函数为:,式中,,为遗传操作的代数,,为取整函数。,24.03.2023,65,由于遗传算法的全局优化特性,因而如何选择初始码字不会影响优化结果,所以,初始码本集中的各个码本可以随机地产生,但采用适当的非随机方法产生初始集可以缩短遗传算法的优化时间。可以采用的方法是进行多次随机初始码字的标准LBG迭代,所得结果可作为初始码本。同时当LBG算法产生的个体数量未达到群体规模时,用交叉的方法产生新的个体来补足。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号