第六章编码压缩课件.ppt_三一办公31ppt.com

资源描述

《第六章编码压缩课件.ppt》由会员分享，可在线阅读，更多相关《第六章编码压缩课件.ppt（82页珍藏版）》请在三一办公上搜索。

1、第六章图像编码与压缩,6.1 概述6.2 图像保真度准则6.3 图像编码的基本知识6.4 统计编码方法6.5 预测压缩技术6.6 变换压缩技术6.7 静止图像编码国际标准JPEG,6.1 概述,6.1.1 图像数据压缩的必要性与可行性数据压缩主要研究数据的表示、传输、变换和编码方法，目的是减少存储数据所需的空间和传输所用的时间。图像编码与压缩就是对图像数据按一定的规则进行变换和组合，达到以尽可能少的代码（符号）来表示尽可能多的信息。,1）图像编码压缩的必要性,在现代通信中，图像传输已成为重要内容。采用编码压缩技术，减少传输数据量，是提高通信速度的重要手段。可见，没有图像编码与压缩技术的

2、发展，大容量图像信息的存储与传输是难以实现的，多媒体、信息高速公路等新技术在实际中的应用会碰到很大困难。,目的：节省图像存储容量；减少传输信道容量；缩短图像加工处理时间。,2）图像编码压缩的可行性,从信息论观点看，描述图像信源的数据由有效数据和冗余数据两部分组成。冗余数据有：编码冗余、象素间冗余、心理视觉冗余3种。如果一个图像的灰度级编码，使用了多于实际需要的编码符号，就称该图像包含了编码冗余。图像像素之间、行之间、帧之间有较强的相关性。利用某种编码方法在一定程度上消除这些相关性，就可以实现图像信息的数据压缩。有些信息在通常的视觉过程中与另外一些信息相比并不那么重要，这些信息被认为是心理视觉冗

3、余的，去除这些信息并不会明显降低图像质量。,如果能减少或消除其中的一种或多种冗余，就能取得数据压缩的效果。因此图像信息的压缩是可能的。但到底能压缩多少，除了和图像本身存在的冗余度大小有关外，很大程度取决于对图像质量的要求。广播电视压缩比31 可视电话压缩比15001 目前高效图像压缩编码技术已能用硬件实现实时处理，在广播电视、工业电视、电视会议、可视电话、传真和互连网、遥感等多方面得到应用。,6.1.2图像编码压缩的分类根据解压重建后的图像和原始图像之间是否具有误差，图像编码压缩分为无误差（亦称无失真、无损、信息保持）编码和有误差（有失真或有损）编码两大类。,一般分为两类：无损压缩

4、：在压缩和解压缩过程中没有信息损失，压缩比较低，一般不超过3：1，如在医学图像应用中。有损压缩：主要利用人眼的视觉特性，在允许条件下或一定的保真度准则下，最大限度的压缩图像，能取得较高的压缩比，但压缩后不能通过解压缩恢复原状。,图像压缩,无损编码,有损编码,霍夫曼编码行程编码算术编码,预测编码变换编码其它编码,根据编码作用域划分，图像编码为空间域编码和变换域编码两大类。,压缩比直接编码一幅图像所需比特数取决于幅面大小及分辨率。设C为采用某种方法编码前后的压缩比,6.2 图像保真度准则描述解码图像相对原始图像偏离程度的测度一般称为保真度。常用的准则可分为两大类：客观保真度准则和主观保真度准

5、则。6.2.1 客观保真度准则最常用的客观保真度准则是原图像和解码图像之间的均方根误差和均方根信噪比两种。,6.2.2 主观保真度准则很多解压图最终是供人观看的，一种常用的方法是对一组（不少于20人）观察者显示图像，并将他们对该图像的评分取平均，用来评价一幅图像的主观质量。,主观保真度准则,根据Shannon无干扰信息保持编码定理，若对原始图像数据的信息进行信源的无失真图像编码，压缩后平均码长存在一个下限，这个下限是信源信息熵H。理论上最佳信息保持编码的平均码长可以无限接近信源信息熵H，但总是大于或等于图像的熵H。,6.3 图像编码的基本知识,1）基本概念,2）变长最佳编码定理和唯一可译代

6、码,6.4 统计编码方法 6.4.1 霍夫曼编码 Huffman编码是1952年由Huffman提出的一种编码方法。这种编码方法根据源数据符号发生的概率进行编码。在源数据中出现概率越大的符号，编码以后相应的码长越短；出现概率越小的符号，其码长越长，从而达到用尽可能少的码符表示源数据。它在无损变长编码方法中是最佳的。,设输入编为，其频率分布分别为P(x1)=0.4 ，P(x2)=0.3，P(x3)=0.1，P(x4) =0.1，P(x5)=0.06，P(x6)=0.04。求其最佳霍夫曼编码。,编码方法是：把输入元素按概率从大到小排列起来,然后把概率最小的两个元素概率加起来;把它同其余元素概率

7、由大到小排序,然后把两个最小概率加起来,再重新排队;重复,直到最后只剩下两个概率为止。,在上述工作完毕之后，从最后两个概率开始逐步向前进行编码。对于概率大的消息赋予0，小的赋予1。,元素xi概率P(xi)编码wi,x1,x2,x3,x4,x5,x6,0.4,0.3,0.1,0.1,0.06,0.04,1,00,011,0100,01010,01011,计算该信源的熵、编码后的平均码长，并思考对于同一图象采用Huffman编码，编码是否唯一？,？,Huffman编码讨论（1） Huffman编码是唯一可译码。短的码不会成为更长码的启始部分；（2） Huffman编码的平均码长接近于熵；（3）

8、缺点：需要多次排序，耗费时间。,6.4.2香农编码法（Fano-Shannon）,Fano-Shannon编码讨论（1） Fano-Shannon编码是唯一可译码。短的码不会成为更长码的启始部分；（2） Fano-Shannon编码的平均码长接近于熵；编码效率略低于Huffman编码。,6.4.3 其它不等长码字的熵编码法B码：适用于输入灰度级概率服从幂律分布的图像。,B码是一种非等长码，由两部分组成，一部分叫“延续比特”，一部分叫“信息比特”。延续比特的作用是标注一个码字究竟延续多长，信息比特的作用是表示不同的信息符号。,其中信息码是按二进制的长度及数的顺序排列的，即0，1，00，01，1

9、0，11，000，001，。延续码C是在编码过程中确定的，可将C=0赋予前一个码字，将C=1赋予后一个码字，再将C=0赋予下一个码字。,B1码的编码：设W1,W8,W5分别为0, 001, 10B1码：001010110100 001110000001 两种不同的形式,B1码中的C,以B1码为例,移位码（S码）：对具有单调减小概率的输入信号有效，也易于实现。,S2码由2bit长的码字组成，总共包含四,个不同的码字：C1=00，C2=01，C3=10，,C4=11， C4的个数用来表示该符号的序数,超过3的次数。符号编码：,C1，C2，C3，C4C1，C4C2，C4C3，C4C4C1,，C4C

10、4C2，C4C4C3，,这种编码方法更简单,行程长度编码(Run Length Encoding,RLE) 编码原理：将具有相同值的连续串用其串长和一个代表值来代替，该连续串就称为行程，串长称为行程长度。行程编码适合于二值图像的编码，二值图像的扫描行，是由若干段连着的黑像素和连着的白保素组成，分别称其为“黑长”和“白长”。例：0001001100 w3,b1,w2,b2,w2 假设都以0开始：31222 可用于量化后大量零系数连续的场合，例如JPEG中。,6.5 预测压缩技术,1）基本思想2）预测误差的熵编码3）DPCM预测编码4）最佳线性预测5）有失真预测编码,6.5 预测压缩技术,1）

11、基本思想预测编码是根据图像数学模型利用以往的样本值对于新样本值进行预测，然后将样本的实际值与其预测值相减得到一个误差值，对这一误差值进行编码。如果模型足够好且样本序列在时间上相关性较强，那么误差信号的幅度将远远小于原始信号，从而可以用较少的数据对其差值量化得到较好的数据压缩效果。,6.5 预测压缩技术,2）预测误差的熵编码对比一幅图像和其差分图像的标准差和熵。,6.5 预测压缩技术,基本原理：设为一行上的相邻的n个象素则用对进行预测，预测误差为：例：, lena=imread(lena.bmp,bmp); lena(132:140,32) ：118，120，115，114， 115， 11

12、3，114，114，118 n = -1 0 1 2 3 4 5 6 7预测器：X(n+1)=0.5*X(n-1)+0.5*X(n)，X(-1)=118, X(0)=120;预测值： 119, 117.5, 114.5,114.5, 114, 113.5, 114误差： -4, -3.5, 0.5, -1.5, 0, 0.5, 4,预测法分类预测编码就是要对误差进行编码。目前用得较多的是线性预测方法，全称为差值脉冲编码调制(DPCM:Differential Pulse Code Modulation)，简称为DPCM。本节讨论线性预测法DPCM的基本原理：,6.5 预测压缩技术,3）DPC

13、M预测编码预测器的阶数对当前像素进行预测的像素集合中的像素个数，称为预测器的阶数。理论上预测器的阶数越大越好，当阶数大于3时其性能的改变非常有限。预测器的系数如一个3阶预测器中，各像素的权重称为预测器的系数。其既可以固定不变，也可以变化。,如何预测?,6.5 预测压缩技术,最常用的一阶DPCM编码器在实际中最常用的是一阶DPCM编码器，此时有唯一的一个预测系数1。,6.5 预测压缩技术,采用同一扫描行中前几个像素值进行预测，称为一维预测；采用同一行或前几行像素值进行预测，称为二维预测；采用前几行和前几帧像素值进行预测，称为三维预测。,4 预测压缩技术,为实现无失真编码，通常对差分图像进行熵编码

14、（通常是Huffman编码）；预测误差熵编码的步骤：建立码表和编码。通常采用一个通用码表，节省建立专用码表时间，由此带来压缩比损失较小；编码：若对差分图像所有灰度建立码表，则项数较多。通常对1616采用Huffman编码，其他直接用前缀实际灰度值。,6.5 预测压缩技术,4）最佳线性预测目的：寻找使预测器的某种误差函数为最小的线性预测器；准则：均方预测误差最小化。,6.5 预测压缩技术,5）有失真预测编码由于预测误差的方差远比像素取样值小，因此需要对预测误差重新量化。,6.5 预测压缩技术,由于量化器存在量化误差，因此带量化器的DPCM系统是有失真预测编码。,6.6 变换压缩技术,1）基本概念

15、图像变换编码的基本概念：指将给定的图像数据变换（如正交变换）到另一个数据域（如频域）上，然后进行量化、编码和传输，使得大量的信息能用较少的数据来表示。在变换域里，首先降低了图像的相关性；以傅氏变换为例，变换后的大的频谱系数90集中在低频，可以压缩低频，忽略高频。其次通过某种图像处理（如频域的二维滤波）以及熵编码，则可进一步压缩图像的编码比特率。,6.6 变换压缩技术,2）变换压缩原理框图,3）常用图像变换傅氏变换WalshHadamard变换正弦变换余弦变换应用最广斜变换哈尔变换KL变换,6.6 变换压缩技术,4）常用图像变换技术讨论傅立叶变换和余弦变换傅立叶变换及频谱移中后，其能量集中在中心

16、附近。中心数据又称为直流分量，代表全图数值的算术平均值。其编码误差来源有：变换系数经过量化器而引起的量化误差。常使高频分量为0，导致图像模糊。,二维付立叶变换编码,Lena图的FFT变换,在理论上，K-L变换是最优的正交变换，但不确定性使得K-L变换使用起来非常不方便，所以一般只将它作为理论上的比较标准。 DCT变换是在实际中用的最多的变换编码，其性能接近于K-L变换，是变换法的主流。傅立叶变换是应用最早的变换之一，也有快速算法，但它的不足之处在于子图像的变换系数在边界处的不连续而造成恢复的子图像在其边界也不连续。沃尔什变换与DCT变换相比，其算法简单（只有加法和减法），因而运算速度快，适

17、用于高速实时系统，而且也容易硬件实现，但性能比DCT变换要差一些。变换块大小的选择也十分重要，一般图像典型变换块大小为88或1616。,5）变换编码的方法变换区域编码：根据变换系数集中在变换域左上角低频区域的特点，对该区域的变换系数进行量化、编码、传输，对右下角高频区域既不变换也不传输。变换阈值编码：实现设定一个阈值，只对变换系数的幅值大于此阈值的编码，不仅低频保留，某些高频成分也保留。如能根据子象块自动调整阈值，就属于自适应。,由国际标准化组织和CCITT联合发起的联合图像专家组（JPEG），建立了静态图像压缩的公开算法。在视觉效果不受到损失的前提下，算法可以达到15到20的压缩比。如果在

18、图像质量上稍微牺牲一点的话，可以达到40：1或更高的压缩比。,6.7 静止图像编码国际标准JPEG,JPEG算法简介,如果处理的是彩色图像，JPEG算法首先将RGB分量转化成亮度分量和色差分量，同时丢失一半的色彩信息（空间分辨率减半）。然后，进行DCT变换，对系数进行量化以减小数据量。最后，使用RLE和Huffman编码来完成压缩任务。,6.7 静止图像编码国际标准JPEG,1）数据分块2）FDCT和IDCT3）量化与反量化4）对量化系数的处理和组织5）熵编码6）应用举例,6.7 静止图像编码国际标准JPEG,JPEG算法过程1）以8*8的图像块为基本单位进行编码；将RGB转换为亮度-色调-饱

19、和度系统，并重新采样；,6.7 静止图像编码国际标准JPEG,YIQ（NTSC制）与YUV（PAL制）Y：指颜色的明视度、亮度、灰度值；I或U：指色调；Q或V：指饱和度。Y=0.299R+0.587G+0.114BI=0.596R-0.247G-0.322BQ=0.211R-0.523G+0.312BU=0.148R-0.289G+0.473BV=0.615R-0.515G-0.1B,6.7 静止图像编码国际标准JPEG,思想：人对亮度比对色彩敏感，在光线不足的情况下，所观察物体都是黑白的。因此可以对色调和饱和度做粗略处理。方法：对8*8图像块矩阵，Y成分采样率不变，U、V成分采样率为原来1/

20、4。称为YUV411系统。除此,还有YUV422, 421, 420等系统.,6.7 静止图像编码国际标准JPEG,2）FDCT与IDCT根据8*8的二维DCT定义,称F（0,0）为直流系数，其他为交流系数。,6.7 静止图像编码国际标准JPEG,3）量化与反量化思想：将每个DCT系数除以各自量化步长并四舍五入后取整，得到量化系数。JPEG系统分别规定了亮度分量和色度分量的量化表，显然色度分量相应的量化步长比亮度分量大。将人类的视觉特性结合进压缩的过程中，人眼对低频分量比对高频分量敏感。对于低频分量量化步长小一点，对于高频分量量化步长大一点。,亮度量化表,色度量化表,6.7 静止图像编码国际标

21、准JPEG,4）对量化系数的处理和组织思想：JPEG采用定长和变长相结合的编码方法。直流系数：通常相邻8*8图像块的DC分量很接近，因此JPEG对量化后的直流分量采用无失真DPCM编码。通常JPEG要保存所需比特数和实际差值。交流系数：经过量化后，AC分量出现较多的0。JPEG采用对0系数的行程长度编码。而对非0值，则要保存所需比特数和实际值。,6.7 静止图像编码国际标准JPEG,ZIG-ZAG排序：为使连续的0个数增多，采用Z形编码。,6.7 静止图像编码国际标准JPEG,5）熵编码对于直流系数的差值，采用Huffman编码。JPEG标准为亮度和色度分量分别拟定了Huffman码表。对于交

22、流0系数的行长，采用Huffamn编码。同样JPEG标准为亮度和色度分量分别拟定了Huffman码表。,6.7 静止图像编码国际标准JPEG,6）应用举例Lenna图像的一个8*8方块,只举亮度块为例.,6.7 静止图像编码国际标准JPEG,经过FDCT后的变换系数矩阵,6.7 静止图像编码国际标准JPEG,根据亮度量化表量化后得到的量化系数矩阵,6.7 静止图像编码国际标准JPEG,假设上一编码块的直流量化系数为77，则直流差值为2。则该图像块编码为,eob 是一个结束标记, 表示后面都是 0 了,6.7 静止图像编码国际标准JPEG,反量化,6.7 静止图像编码国际标准JPEG,反变换,6

23、.7 静止图像编码国际标准JPEG,编码比特率与质量因子通常在图像传输时要求固定比特率，JPEG通过设定一个质量控制因子Q，在量化时用该因子与量化表中的量化步长相乘作为实际的量化步长。则要求较高比特率时，Q取较小值如0.1；否则取大值。Q与比特流一起传送给解码端。,6.7 静止图像编码国际标准JPEG,压缩率9.2,6.7 静止图像编码国际标准JPEG,压缩率18.4,6.7 静止图像编码国际标准JPEG,压缩率51.6,7 图像压缩编码新进展,H.261：用于电视电话和电视会议；码率128kbps384kbps；MPEG1：用于数字存储媒体（如VCD），码率为11.5Mbps，适合通讯网络；

24、MPEG2：用于数字电视和高清晰度电视（如CCTV Ch 5），码率为1.530Mbps；MPEG4：用于64Kbps以下带宽的音视编码，实现基于内容的编码；其他编码方法：子带编码、小波编码JPEG2000、分形编码和基于模型的编码等。,要点总结,掌握基本压缩技术的分类和他们各自的基本原理；掌握熵编码的Huffman和香农编码方法；掌握行程长度编码；了解预测编码技术，及无失真和有失真预测编码的区别；了解变换编码技术；了解JPEG标准的基本步骤，并能解释。,习题,1）设某一幅图像共有8个灰度级，各灰度级出现概率分别为：试对此图像进行Huffman编码和香农编码。并比较两种编码方法的效率。,习题,2）设有一幅88图像，其灰度级分布见图所示。（1）对该图像进行Huffman编码，并计算编码效率和压缩比；（2）对该图像的差分图像进行Huffman编码，并计算编码效率和压缩比；（3）比较（1）（2）的结果。,压缩比直接编码一幅图像所需比特数取决于幅面大小及分辨率。设C为采用某种方法编码前后的压缩比,

展开阅读全文