《【教学课件】第六章图像编码.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第六章图像编码.ppt(81页珍藏版)》请在三一办公上搜索。
1、第六章 图像编码,一、引言 因为数字图像的数据量特别大,从而对存储、处理和传输都带来了问题。如何才能有效的减少数字图象的数据量而又不丢失或少丢失图象的信息,就是图象编码问题减少表达信息的数据量。图象信息之所以可被减少或称被压缩,是由于图象信息中有大量的冗余信息。图象压缩就是利用了图像信号中的冗余度,如数据编码冗余度、心理冗余度(利用人眼视觉系统的一些特性忽略掉一些不被人眼所察觉的信号成分)等,进行压缩。,1、数据冗余,如果用n1和n2分别代表相同信息的2个数据集合中的信息载体单位的个数,那么第一个数据集合的相对数据冗余RD(相对于第二个数据集合)定义为:RD=1-1/CR其中CR称为压缩率:C
2、R=n1/n2例如,对同一幅512512点的全白图像,以两种方式表达这幅图像:每点用8位信息表示 n1=5125128每点用1位信息表示 n2=5125121则 RD=1-1/CR11/8=88%CR=n1/n28,2、冗余的形式,编码冗余:没有充分利用编码对象的概率特性而产生的冗余。设定义在0,1区间的离散随机变量sk代表图像的灰度值,每个sk以概率ps(sk)出现:ps(sk)nk/n k=0,1,L-1其中L为灰度级数,nk是第k个灰度级出现的次数,n是图像中像素总个数。若用于表示信息sk的位数是l(sk),那么为表示每个像素所需的平均位数(码长)为:,RD=1-1/CR1-0.91=9
3、%CR=n1/n23/2.7=1.11说明该图像有9%的冗余。像素间的冗余图像的重要特点之一就是像素间具有某种相关性。换言之,就是如果相邻像素值可由本像素值得出,那么像素值原来的表达是多余的。心理视觉冗余如果随着图像信息表达位数的增加,主观视觉效果不在增加,那么多于的信息表达位数就是心理视觉冗余。,自然码和变长码的例子(P136),3、图像保真度和质量,1)、客观保真度原则均方根误差均方信噪比峰值信噪比2)、主观保真度原则优秀很好良好较好可用稍好刚可看相同差较差不能用很差,二、编码模型,汉明码一种纠错码。汉明指出:如果将3位的冗余加到4位码字上,则所有单个位出现的错误都可以发现和校正。编码:例
4、如:01011 0 1 0 0 1 0解码:对汉明码进行校验,错误位置由非零校验字c4c2c1指出;对该位求反即可纠正错误。如果校验字为零,则解码结果为h3h5h6h7。,信道编码、解码器以汉明码为例,一个典型的信源压缩(编码)系统如图所示。,通过时间轴上采样和幅度量化将连续信号变成离散数字信号 并对其进行量化。,将信号中绝大部分能量集中在少数几个变换系数上,去除信号中的相关性,信号压缩真正体现在量化阶段。,一般先是游程编码,然后Huffman编码或算术编码进一步提高压缩比,如果信号已经数字化,最终的“无损”与“有损”编码的区别在于:在编码过程中是否是对全部的“数据”进行编码。,1、设计一个好
5、的图像编码器的步骤要为图像信号选择一个正确合适的模型;在这个给定模型框架中优化编码器。压缩算法的选择;应数据压缩率、失真度和算法的复杂度。2、图像编码算法的分类:1)、一类是无损编码 即在编码过程中信息没有丢失。2)、另一类是有损编码 即在编码过程中没有对所有信息编码。,三、编码器的设计原则,3、图像信息率及编码效率,一般静止灰度图像中每个像素用8比特来表示,那么一幅图像的平均信息率可以用下面的熵值来表示:,其中pini/n i=0,1,L-1表示像素取i级灰度的概率,i的取值范围为028-1。H表示该图像在不失真情况下,每像素编码所需的最小码长;如果对每像素编码的码长小于H,则解码后的图像会
6、产生失真。,4、最佳编码定理,主要内容:若对一幅图像进行编码,将出现概率较高的信息(出现概率较高的像素值)赋予较短的码字;反之,将出现概率较低的信息(出现概率较低的像素值)赋予较长的码字;如果码字长度严格按照所对应信息出现的概率大小逆序排列,则这样编码结果的平均码字长度一定是小于任何其它排列方式。,衡量编码优劣可用编码效率作为一个重要指标。,对最佳编码定理的简单说明,设图像灰度级为w1,w2,wN;各级灰度出现的概率分别为p1,p2,pN(由大到小);编码器赋予各级灰度对应的码字长度分别为t1,t2,tN(由小到大);则编码后图像平均码字长度R应为:令:R1为严格按最优编码定理规定的原则编码的
7、平均码字长度;R2为在编码过程中将任意两个灰度级不按最优编码定理规定的原则编码的平均码字长度。依最优编码定理的结论应有R2R1R。只要证明R0即可,令第m和n个灰度级出现的概率分别为pm,pn,且 pmpn;对应的码字长度分别为tm,tn,且 tmtn(不符合严格逆序的原则)。构造下列运算:,注意:概率和字长均为正数。,不按定理的码长,按定理的码长,说明不按定理编码的平均码长一定大于按定理编码的平均码长,说明运算构造的合理性,5、编码的唯一可译码(单义码)原则,一个能唯一的被译出、不会产生歧义的编码序列称为唯一可译码编码(单义码)。这样的编码序列应满足以下两个条件:编码中的任何一个码字都不是另
8、一个码字的简单续长代码由一个码字简单添加一些码元而构成一个新的码字。注意:非续长码一定是单义码;而单义码不一定是非续长码。编码序列应为单义代码序列,即满足Kraft不等式。,其中:n为编码序列的编码个数;D为编码系统的进制;ti为第i个码字的长度。,编码的唯一可译码原则的解释,某编码序列C=00,10,0(0)11,101对应信息a,b,c,d编码序列C满足Kraft不等式,所以C是单义代码。例:某编码序列C=101,10,00,10 dbab某编码序列C=0,01,1,11对应信息a,b,c,d编码序列C不满足Kraft不等式,所以C不是单义代码。例:某编码序列C=0,1,11,0,11 a
9、cdad bdbc?所有应用于信号的编码,都应满足编码的唯一可译码原则。,四、简单编码方法,哈夫曼编码是一种利用信息符号概率分布特性的变字长的编码方法。对于出现概率大的信息符号编以短字长的码,对于出现概率小的信息符号编以长字长的码。具体步骤:分配码字长度时,首先将出现概率最小的两个符号的概率相加,合成一个概率;第二步把这个合成概率看成是一个新组合符号的概率。重复上述做法,直到最后只剩下两个符号的概率为止。完成以上概率相加顺序排列后,再反过来逐步向前进行编码;每一步有二个分支,各赋予一个二进制码,可以对概率大的编码赋为0,概率小的编码赋为1。,1、哈夫曼编码最优变长编码,哈夫曼编码示例,某图像中
10、的一个子集如图所示,其哈夫曼编码为(逐行a2 a6 a2 a6 a4 a5 a2 a3 a1):1 00 1 00 0100 01011 1 01010 001 共24位如果用每个符号3位自然码编码:共需27位;是唯一可解码编码。,计算上例的编码效率,图像的熵、平均码字长度、编码效率,若按自然码编码:H=2.14 Lavg=3编码效率=71.3%,之所以没有达到H=2.14的水平,是因为字长是整数。,哈夫曼编码在使用中出现的问题,1、编码过程太复杂2、对每个文件的编码是不一样的3、解码器的构造不一致4、压缩文件中必须包含解码信息针对上述问题,常常采用一些亚最优编码只要对文件信息的统计参数已知,
11、可直接用亚最优编码对其进行压缩。从表6.3.1可以看出,哈夫曼(截断哈夫曼、哈夫曼平移码)编码是效率较高的编码。,2、亚最优可变长编码,哈夫曼编码为最优编码。但在使用过程中有不便之处:要对编码对象进行概率统计,不利于快速编码。如果对某一类编码对象的统计统计规律有一定的了解,即可利用一些亚最优变长编码技术得到近似最优的编码结果。常见的亚最优变长编码有:A码(平移码)当被编码信息的概率分布为单调减小时,编码效率较高。B码(对数码)当被编码信息的概率分布服从指数分布时,编码效率较高,接近最优编码。(接续码见P152)截断哈夫曼码对最有可能出现的M个符号进行哈夫曼编码;将其余的符号概率相加,查出对应的
12、哈夫曼编码作为前缀,后跟由0开始的自然码对剩余的信息进行编码。哈夫曼平移码,编码应用举例1图像的差分编码,某卫星图像f为23403240像素,灰度量化为128级。如果采用自然码编码,共需使用23403240750Mbit。若每天接收30幅,则共需使用约50301500Mbit。图像的直方图如图所示。构造差分变换矩阵A,对图像f进行变换。,A为(23403240)(23403240)方阵 f为(23403240)1列向量;g为(23403240)1列向量,图像以堆叠向量表示,直方图的比较,可以看出:由于图像数据的相关性,差分数据的方差(数据的离散程度小)远小于灰度数据的方差。根据最佳编码定理,对
13、差分数据编码所需的平均码长会远小于对灰度数据编码所需的平均码长。,构造编码,构造一种变形的A码(移位码),共16个码字c1 c2 c3c16。c10000,c20001,c30010,c161111将其中的14个码字c2 c3c15分配给差分数据;c1、c16 作为指示位。,图像重构:编码图像 解码 逆变换 f=A-1g压缩后的平均码长为4.3,压缩61;如果用哈夫曼编码平均码长为3.5,压缩50。,对存在大面积等灰度块的图像(可能是直接得到,也可能是通过某种增强方法得到)可采用图像轮廓编码进行压缩。任何一个灰度区域,都可以按照某种规则勾画成一个封闭的等值线。,编码应用举例2图像的轮廓编码,将
14、所有像素标记为I从左上角开始逐行寻找起始点并将该点标记成IP;能够成为起始点的条件为该点标记为I,并且不在已勾画过的轮廓当中。按“向左看”,“顺时针转”的原则,寻找等灰度I点,按标记规则加注标记。完成一个封闭轮廓后,寻找新的轮廓起点。直至标记完所有轮廓。,勾画轮廓及标记,新IP点的确定:从左到右从上到下逐行搜索。构造栈区,搜索新的一行时,将栈区清空。遇A进栈,遇D出栈,遇R不管;如果空栈遇I则为一新的IP点;如果非空栈遇I且该像素的灰度值不同于先前进栈A点的灰度值,则该点为一新的IP点,反之不是。,对于同一像素点上出现两次标记得处理,A,编码方案,轮廓号:自然码轮廓灰度:自然码坐标起点:自然码
15、轮廓码:Flame方向码,Flame方向码,解码:每完成一个轮廓的描绘,将该轮廓内填充为对应的轮廓灰度。该图像如果用自然码编码共用788448bit;采用轮廓编码共用31621692172bit。同灰度面积越大,效果越明显。,可以是8位,编码应用举例3图像的游程编码,图像的每一行可以看成是由i个长度不等,灰度级为k个的像素组成。,灰度级,对每一行像素用(li,gk)表达,选择恰当编码方式对其进行编码(甚至直接保存),即可对图像进行压缩。图像中等灰度的面积越大,压缩效果越好。对上图表示的某一行像素而言:(l1,g1),(l2,g3),(l3,g2),(l4,g5),(l5,g4),g1,g2,g
16、3,g4,g5,编码应用举例4算术编码,特点:递推式编码。编码条件:必须知道各符号信息的概率例:已知符号源a1,a2,a3,a4,已知各符号出现的概率分别为p(a1)=0.2,p(a2)=0.2,p(a3)=0.4,p(a4)=0.2,现需对a1 a2 a3 a3 a4编码。,在最后一个符号的区间内0.06752,0.0688内的任意的一个实数就可以表示整个序列(码长尽可能的短)。如0.068。,(0.04/10)4+0.04=0.056(0.04/10)8+0.04=0.072,算术编码的解码:条件同上,给定编码0.0676059,解码方法:排列概率、选择展开区间去逼近被解码字区间。,解码结
17、果:a1 a2 a3 a3 a4 a1 a2 a3 a3 a4 被编码的信息长度应是已知的,五、二值图像编码,1、二值图像编码跳过白块编码(WBS)二值图像是指只有两个灰度级的图像。例如文字组成的文件扫描图、气象图、工程图、指纹卡、军用态势图。分辨率越高,图像细节越清晰,因而图像质量越高。但是其代价是表示一幅图像的数据量也越大,这使得传输时间、存储容量、处理计算时间都要付出更高的代价。CCITT(国际电话与电报顾问委员会)建议采用两种分辨率:1728象素/行(8取样/mm),3.5行/mm;1728象素/行(8取样/mm),7.7行/mm。,在一般情况下,用主观测试方法确定结果表明,对中等质量
18、要求,如我国常用的公文纸幅面190mm270mm,如果分辨率取5点/mm,直接编码所需bit数:19027052=1282500bit1.3Mbit如果用常用的速率为2.4kbit/s的传真机传送,需要9分钟。如要达到CCITT规定的三类传真机的传输标准,即传输一帧公文约需1分钟,则需将数据压缩9倍。,1)、一维跳过白块编码,基本原理:大多数二值图像中的黑象素只占整个图像的一小部分,若能跳过白色象素,只对黑色象素编码,则表示图像的比特数就能减少,平均比特数就能大大降低。步骤:将图像的每条扫描线分成若干段,每一段的象素个数为n;对全部是白色的象素用0表示;对至少有一个黑象素的线段用n+1个比特表
19、示,第一个比特为1,其余n比特采用直接编码。,举例:黑白白黑 11001 白白白白 0设长度为n的象素段出现全白的概率为Pw,则一维WBS编码每一段的平均码长bn为:,例:某二值图象行有40个黑白象素(40位)。n=4时 0 0 11110 0 11111 0 0 0 共16位n=8时 0 111100000 111110000 0 共20位n=5时 0 100011 110000 101111 0 0 0 0 共23位可见,分段大小的不同,编码效率也不同。,2)、二维跳过白块编码,将一维WBS的象素段推广为象素块。设象素块大小为MN,全白象素块用“0”表示,否则用MN个比特来直接编码,并在编
20、码前加一个1作为标识位。则每块像素的平均码长R为,若按44分块:5位05(16+1)位190位编码。,其中:Pw为象素块出现全白的概率例:某二值图象4行有160个黑白象素。,如果此像素为白,3)、自适应跳过白块编码,根据图像的局部结构或统计特性,改变象素块的大小,进一步提高压缩效果,这就是所谓的自适应WBS编码。改进型的一维WBS编码:对于一维的WBS编码,如果一条扫描线全为白象素时,则用1比特“0”表示,否则用正常的一维WBS编码。自适应的WBS编码可以使得表示图像的bit数下降很多,但是为了自适应增加了译码的复杂性。,2、二值图像编码游程编码,主要思路是将一个连续相同值的串用一个代表值和串
21、长来代替。对于图像编码,可以定义沿特定方向上具有相同灰度值的相邻象元为一组,其延续长度称之为延续的行程,简称为“游程”。游程终点位置由前一游程终点的相对距离确定,这样就可以由游程长度串来表示图像数据。游程编码一般不直接应用于多灰度图像,而比较适合于二值图像的编码,例如传真图像的编码等。为了达到较好的压缩效果,有时游程编码和其它一些编码方法混合使用。,1)、一维游程长度编码(RLC),对二值图像的每一扫描行来看,总是由若干段连着的黑象素段和连着的白象素段组成,分别称为“黑长”和“白长”。黑长和白长总是交替发生。对于不同长度按其发生概率分配以不同长度的码字,这就是游程长度编码(RLC)。设二值图象
22、中有长度为1,2,,N等不同长度的黑长和白长,N为一个扫描行的象素数。步骤:对每一扫描行从左到右按游程长度编码,且每行都由白色游程开始(其长度可以是0)。用最优变长编码或亚最优变长编码对游程长度进行编码。,一维游程长度(RLC)编码举例,各行编码:1,7,4,4,4,122,7,3,12,4,43,7,2,4,1,2,1,4,1,74,7,1,4,4,4,4,4概率统计按大小排列:4,1,7,2,12,3用哈夫曼编码方案编码(P150)00,011,1,1,1,010100100,011,01011,01010,1,101011,011,0100,1,00,0100,00,1,00,0111,
23、011,00,1,1,1,1,1共计:1319271170(直接编码为128位),2)、二维游程长度编码(RAC),RAC编码举例各行编码:第一行:1,7,4,4,4,12RLC编码第二行:1,1,3,4,4,4第三行:2,1,2,4,1,2,1,4,1,3第四行:3,1,1,4,3,4,3,4,编码方案之一如P156。,3)、预测差值量化编码(PDQ),游程长度编码只利用了沿扫描线方向的象素间的相关性。如果进一步利用行间象素相关性则可能达到更高的压缩效率,这就是预测差值量化编码。PDQ实际是RLC基础上改进得到的二维游程编码,它不是对游程长度本身进行编码,而是对扫描线之间的代表两个游程长度变
24、化的差值进行编码,但相应的规则较多。,六、预测编码,预测编码是统计冗余数据压缩理论的三个重要分支之一(直接编码、预测编码、变换编码)。预测编码的理论基础是现代统计学和控制论,它主要减少了数据在时间和空间上的相关性。对于静止图像来说,预测编码将被图像变换编码所取代。而预测编码对于视频信号来说,它充分利用了连续帧之间的统计冗余性,是当今主流技术并且还会流行于未来。,1、预测编码的基本原理,预测编码是根据图像数学模型利用以往的样本值对于新样本值进行预测,然后将样本的实际值与其预测值相减得到一个误差值,对这一误差值进行编码。如果模型足够好且样本序列在时间上相关性较强,那么误差信号的幅度将远远小于原始信
25、号,从而可以用较少的码字对其差值量化得到较大的数据压缩效果。如果能精确地预测数据源输出,那就不存在关于数据源的不确定性。,然而没有一个实际的系统能找到其完整的数学模型,我们能找到的最好预测器是以某种最小化的误差对下一个采样进行预测的预测器。通常预测器的设计不是利用数据源的实际数学模型,因为数据源的实际数学模型是非常复杂,而且是时变的。实验结果表明以最小均方预测误差设计的预测器不但能获得最小均方预测误差,同时在视觉效果上也是比较好的。,预测编码原理线性预测,设时间序列像元如下,XM,XM-1,XM-2,X1,Xn,Xn+1,则对Xn的线性估值可表述为(此时的Xi去掉了X的均值):,为了得到最佳的
26、预测系数,定义均方误差准则:,求使en2最小的ai:,被预测数据,历史数据,看成常数,不可能=0,有:,当i=1,2,M时若定义Xi、Xj的协方差为Rij=EXi,Xj则上式可写为:且可以证明|ai|1。由于Rij是可以求出来的,因此ai也是可以求出来的。求取偏差的方差观察其离散程度。,对称方阵,若Rij=EXi,Xj,定义相关系数:ij=EXi,Xj/EXi20ij1则Rij等式可以写成,如果预测的比较准确则近似等于Xn,显然,M=1时,有:,在前面公式推导时,前提条件是各点的均值为0。但在实际的图像中,图像点的均值不可能等于0,总有一个值m。因此,要保证上式成立应有:,上式称为最佳一维一阶
27、预测公式。其中:,使用预测编码方式可以实现无损编码在预测过程中不进行各种舍入的量化;以及有损编码在预测过程中进行了适当的舍入和量化。实际上,前面推导的公式是不好用的。因为期望值与自相关系数是不容易得到的。,2、无损编码实例一阶DPCM编码,设预测器为一阶预测器:偏差为:用其对给定图像进行编码。,对选择恰当的编码方式进行编码(如前例中的变形移位码)。,令a1=1,3、有损编码实例DM(差值调制)编码,为了进一步提高压缩率,可使用DM编码方案。设预测器为一阶预测器:,其中a1=1;偏差为:用其对给定图像进行编码。,令+c=1,-c=0对进行编码,每像素仅一位(每行的第一个像素用自然码编码)。,DM
28、(差值调制)编码存在地问题,造成颗粒噪声形成亮暗噪声点,噪声的强弱取决于c的选择。当图像的灰度发生剧烈变化时,预测值跟不上变化,解码后会造成边缘的不清晰斜率过载现象。4、最优量化高阶预测(有损编码)如果使用高阶预测,M1,由于|ai|1,则偏差会出现小数,且为各种可能值,如:0.312、0.1237、4.7856。为了对其进行编码,必须要进行量化。最简单的方法是取整运算:当像素间的相关性较强时,误差很大。,量化方案的选择,如何对偏差信息进行量化,需几级量化才能使解码图像更接近原始图像,量化时怎样才能使量化误差最小等问题是我们关心的问题。所谓量化问题,简言之就是为输入按某种规律分配码字的过程。常
29、见的量化方式为均匀量化,如A/D。即给定输入s,如果s落在s0,s1)之间则赋予码字t0;如果s落在s1,s2)之间则赋予码字t1;如果s落在si-1,si)之间则赋予码字ti-1;,重建层,决策层,t0,t1,t2,t3,tk+1,tk-1,tk,输入s,均匀量化的最小量化误差,设想si、ti有同样的量纲,问如何量化si,量化误差最小。设s在其可量化范围内的概率密度p(s)为常数各可能出现值得概率相等。构造均方误差函数:,如果设si、ti都是变化的,问:si、ti如何取值时均方误差最小。,重建层是均匀的,A/D转换恰是如此。,概率密度p(s)不为常数时,有,可见,重建层是不均匀的每个titi
30、+1的宽度取决于s在si,si+1)区间内分布的概率密度。对预测偏差而言,其概率密度为Laplace分布:,由此构造出的量化器称为Lloyd-Max量化器(P165)。,Lloyd-Max量化器,假设预测方程的预测结果足够准,用8级最优量化已能满足要求,也就是说偏差范围在-2.9942.994之间,既便是采用自然码编码,也可以将256级灰度的图像压缩近50。如果采用变长码压缩率会更高。,1100 1011 1010 1001 0000 0001 0010 0011 0100,00111 00011 00000 111 10 110 0101 00001 00110,2级量化,4级量化,表示决策
31、区域,自然码编码,哈夫曼编码,5、二维和三维预测,对一幅图像而言,被预测点的值不仅与本行的点相关,而且也与前一行的邻近点相关,如果将其考虑进来,预测会更加准确。考虑到行间相关性的预测称为二维预测。一个常用的四阶预测公式为:,同理,有时图像帧之间也有相关性。如电视图像的每帧之间具有较高的相关性。考虑到帧间相关性的预测称为三维预测。应用领域:电视图像、可视电话。,编码器,解码器,第1帧,预测帧2,第2帧,偏差帧2,预测帧3,第3帧,偏差帧3,预测帧4,第4帧,偏差帧4,预测帧4,第4帧,偏差帧4,第1帧,预测帧2,第2帧,偏差帧2,预测帧3,第3帧,偏差帧3,预测帧4,第4帧,偏差帧4,预测帧4,
32、第4帧,偏差帧4,第一帧中使用一维或二维预测编码,七、变换编码,1、变换编码中的有损与无损编码“无损”编码:由于经过正交变换后“图像”,都具有能量集中的特点绝大部分“像素”为0或很小,它们占用的码位相对较少,所以,直接对变换“图像”进行编码,会比对原图像进行编码需要的码位少。由于绝大多数图像变换都会产生带有经舍入的小数点的变换矩阵,一般而言,变换编码不可能做到绝对“无损”。有损编码:将经过正交变换后“图像”中能量较集中的“像素”依照某种准则保留,而将其它“像素”置为0,然后对其进行编码,这样会比对原图像进行编码需要的码位少的多。但解码后,图像不可能恢复原来状态。,2、变换编码的基本步骤,选择变
33、换形式;变换编码的一个极其重要的作用是将信号中的能量尽可能集中在少数几个系数上,选择的准则应是集中度较高的变换。几乎所有的图像变换编码器都采用基于分块的DCT变换。对给定图像按某种方案(如分块)进行变换。对这变换系数进行按给定的规则进行量化,这样图像压缩率有明显的提高(如:DCT变换之后通常是均匀量化)。最后按指定编码方式编码(如:哈夫曼编码)。,3、图像压缩为什么选中的余弦变换,实变换,且在给定条件下的重建误差较小。测试方法:对同一幅具有代表性的图像,将其分成nn的子图像,计算各子图像的变换系数(求其变换“图像”),将变换系数由小到大截除75,求取截除系数后的变换“图像”的反变换,计算均方根
34、误差后比较。,傅立叶,余弦,哈达玛,1,3,16,64,4、国际标准简介JPEG标准,JPEG的产生JPEG是“联合图片专家组”(Joint Photograhic Coding Experts Group)的简称。是由ISO(国际标准化组织)和CCITT(国际电话与电报顾问委员会)于1986年联合成立的一个标准起草小组,该小组于1991年提出ISO CD10918标准建议草案,1992年成为国际标准ISO/IEC。后来,通常将该标准称为JPEG。JPEG标准主要涉及连续色调(灰度和彩色)静止图象的压缩编码。它提供了一种适合大多数应用场合的简单高效的图象编码方案。下面,以灰度图象为例介绍JPE
35、G标准。,5、JPEG基本系统,6、编码、解码过程1)、将图象分成88的图象块,以其为基本单位进行编码。2)、对每个88的图象块进行FDCT变换,得到变换系数矩阵。,3)、量化。将每个DCT系数除以各自的量化步长并取整得到量化系数。,4)、将量化后的系数分成直流系数和交流系数,查对应表格对量化系数编码。5)、用Z型扫描的方法形成数据流,对数据流查Huffman表进行编码。,亮度量化表S(u,v),7、JPEG编码应用举例,数据流:79,0,-2,-1,-1,-1,0,0,-1,0,0,0,0,.,0,直流分量,编码示例,对直流分量而言,由于两块之间的直流分量非常接近所以JPEG对量化后的直流系
36、数采用如下方法对F(0,0)编码:F(0,0)=Fi(0,0)-Fi-1(0,0)就本例而言,设F(0,0)2,查直流系数表,形成编码:类型码的编码量化值范围的编码(使用自然码,负数用反码)。有:2 2,2 011 10对交流分量而言,采用游程编码。由若干个0(也可以没有)和一个非0值组成一个编码的基本单位。就本例而言,在 0,-2,-1,-1,-1,0,0,-1,0,0,0,0,.,0中,0,-2为一个编码单位;有3个-1的编码单位;最后为EOB编码单位。每个编码单位下式构成:(游程/类型码)的编码量化值范围的编码(使用自然码,负数用反码),类型:由非0值查直流系数表得到。游程:基本编码单位
37、中0的个数。,直流系数、交流系数量化表,亮度分量直流系数编码表,亮度分量交流系数编码表(负数用反码表示),类型码的形成同亮度分量直流系数编码表,最终编码,对于本例而言,可求其编码的压缩比等参数为:,6)、解码时,对接收到的数据流查Huffman表进行解码,得到和编码器输出相同的量化系数,对其进行反量化恢复出DCT系数。最后,经IDCT恢复图象。,亮度量化表S(u,v),系数量化后图象,JPEG编码过程回顾,数据流:79,0,-2,-1,-1,-1,0,0,-1,0,0,0,0,.,0,最终编码,亮度量化表S(u,v),解码后的图像,反量化后的图象,经IDCT后的解压缩图象,原始数字图象,8、彩
38、色JPEG编码原理,YIQ颜色空间来源于国家电视标准委员会(NTSC)制彩色电视信号的传输。从RGB转换到YIQ颜色空间,9、JPEG文件结构,八、图像文件.GIF文件编码思想,1、字典编码的思想词典编码(dictionary encoding)的根据是数据本身包含有重复代码这个特性。例如文本文件和光栅图像就具有这种特性。字典编码法的种类很多,归纳起来大致有两类。第一类词典法的想法是企图查找正在压缩的字符序列是否在以前输入的数据中出现过,然后用已经出现过的字符串替代重复的部分,它的输出仅仅是指向早期出现过的字符串的“指针”。第二类算法的想法是企图从输入的数据中创建一个“短语字典(diction
39、ary of the phrases)”,编码数据过程中当遇到已经在词典中出现的“短语”时,编码器就输出这个词典中的短语的“索引号”,而不是短语本身。,2、LZ78无损压缩算法的基本思路,1.初始化字典,给定基本符号编码;且将前缀串置为空串:P 空串。2.C(字符串)字符流的下一字符3.P+C(缀-符串)在字典中吗?a.是,则P P+Cb.否,将当前P和C的编码加入到输出码流 将P+C(缀符串)加入字典 P 空串c.字符流还有字符吗?是,goto 2 否,i.输出P的编码,ii.结束,对给定符号序列编码:,基本符号,3、LZ78解压缩算法的基本思路,1.初始化字典、P、C、cW、pW2.cW=
40、码流的第一个码(cW表示正在处理的码字)3.输出string(cW)到字符流(string(cW)表示当前缀符串)4.pW=cW(pW表示先于当前码字的码字)5.cW=码流的下一个码6.string(cW)在字典中吗?a.是。输出string(cW)到字符流;P=string(pW)(string(pW)表示先前缀符串);C=string(cW)的第一个字符;将字符串P+C加入到字典中。b.否。P=string(pW);C=string(cW)的第一个字符;将P+C输出到字符流,并将它加入字典。7.码流中还有编码吗?a.是,goto 4。b.否,解码过程结束,设对给定编码序列解码:,输出解码序
41、列:A B B A B A B A C,编程作业:,1、编制一通用模板处理图像的程序。模板的大小、系数可以更改;图像的处理结果可以直接看到。2、编制一伪彩色图像处理程序。伪彩生成函数可以更改,如三角波函数、正弦函数、梯形函数等;R、G、B三个函数的相位可以任意调整。图像的处理结果可以直接看到。3、编制一个哈夫曼压缩程序,对任意文件进行压缩,观察结果;对压缩文件进行解压缩,保持原文件的特征。4、编制一一维一阶无损PDCM压缩、解压缩程序,令a1=1,压缩一图像,观察压缩率;将其解压缩,观察图像。5、编制一一维一阶有损DM压缩、解压缩程序,令a1=1,c的取值可变,压缩一图像,观察压缩率;将其解压缩,观察随c的不同图像的变化。注:4、5题采用Z型扫描编码。,