第八章 图像压缩ppt课件.ppt

上传人:小飞机 文档编号:2133782 上传时间:2023-01-16 格式:PPT 页数:76 大小:2.47MB
返回 下载 相关 举报
第八章 图像压缩ppt课件.ppt_第1页
第1页 / 共76页
第八章 图像压缩ppt课件.ppt_第2页
第2页 / 共76页
第八章 图像压缩ppt课件.ppt_第3页
第3页 / 共76页
第八章 图像压缩ppt课件.ppt_第4页
第4页 / 共76页
第八章 图像压缩ppt课件.ppt_第5页
第5页 / 共76页
点击查看更多>>
资源描述

《第八章 图像压缩ppt课件.ppt》由会员分享,可在线阅读,更多相关《第八章 图像压缩ppt课件.ppt(76页珍藏版)》请在三一办公上搜索。

1、,图像压缩,基本概念图像压缩模型信息论基础无损压缩有损压缩图像压缩标准视频压缩标准,图像压缩,基本概念,概述数据冗余,编码冗余,像素间冗余心理视觉冗余图像保真度和质量,图像压缩的必要性,为什么要压缩?计算机图像处理中的数字图像其灰度多数用8bit来量化,一幅最简单的黑白照片,若按512512点阵取样,表示这幅图像的二进制数据量 5125128=2048Kbit=2Mbit=256KB而医学图像处理和其他科研应用的图像的灰度量化可用到12bit以上,因而所需数据量太大。10241024 12=12Mbit=1536KB=1.5MB遥感图像如SAR图像用8bit量化,100公里*100公里,10m

2、分辨率的图像的大小为1000010000。这样一个地区的图像需108B=100MB以上。这无疑对图象的存储、处理、传送带来很大的困难。,动态视频数据量非常大。数字高清:1080i/50Hz1920*1080*24*50=2 488 320 000=2.5Gb/s视频信号的传输率约为2.5GB/s这样大的数据量不仅超出了计算机的存储和处理能力,更是当前通信信道的传输速率所不及的。因此,为了存储、处理和传输这些数据,必须进行压缩。,传输 存储,主要目的,图像压缩,图像压缩的方法,消除冗余数据,从数学角度看,将原始图像转化为从统计角度看尽可能不相关的数据集,一般分为两类:,无损压缩:在压缩和解压缩过

3、程中没有信息损,失,有损压缩:能取得较高的压缩率,但压缩后不能,通过解压缩恢复原状,其它:如根据需要,即可进行无损,也可进行有,损压缩的技术;准无损技术,图像压缩图像压缩的理论基础,信息论图像处理的概念和技术,压缩方法预测编码方法(对应空域方法)变换编码方法(对应频域方法),图像压缩的可能性,8.1 数据冗余的概念,数据是用来表示信息的。如果不同的方法为表示等量的信息使用了不同的数据量,那么使用较多数据量的方法中,有些数据必然是代表了无用的信息,或者是重复地表示了其它数据已表示的信息,这就是数据冗余的概念。,图像压缩的可能性相对数据冗余的定义(续)如果n1和n2代表两个表示相同信息的数据集合中

4、所携载信息单元的数量,则n1表示的数据集合的相对数据冗余RD定义为:,R D 1,1C R,CR称为压缩率,定义为,C R,n1n 2,图像压缩的可能性相对数据冗余和压缩率的一些特例,n1相对于n2n1=n2,CR1,RD0,对应的情况第1种表达相对第2种表达不含冗,余数据n1 n2 1 第1种数据集合包含相当多的冗余数据n1 n2 0 第2种数据集合包含相当多的冗余数据,图像压缩的可能性三种基本的数据冗余,8.1.1编码冗余8.1.2像素间冗余,8.1.3心理视觉冗余如果能减少或消除上述三种冗余的1种或多种冗余,就能取得数据压缩的效果,图像压缩,什么是编码冗余?,如果一个图像的灰度级编码,使

5、用了多于实际需要的编码符号,就称该图像包含了编码冗余,黑白二值图像编码,如果用8位表示该图像的像素,我们就说该图像存在编码冗余,因为该图像的像素只有两个灰度,用一位即可表示。,8.1.2 像素间冗余什么是像素间冗余?反映图像中像素之间的相互关系因为任何给定像素的值可以根据与这个像素相邻的像素进行预测,所以单个像素携带的信息相对较少对于一幅图像,很多单个像素对视觉的贡献是冗余的。它的值可以通过与它相邻的像素值为基础进行预测例:原图像数据:234 223 231 238 235,压缩后数据:234-11,8,7,-3,像素间冗余,有直方图特征可知,可以用变长编码减少编码冗余。但编码处理不会改变图像

6、像素之间的相关性级别。也就是说用于表示每幅图像的灰度级的编码与像素之间的相关性无关,这些相关来自于图像中对象之间的结构或几何关系。相关性反映了图像中像素间的直接关系。,a)、b)两幅图像c)、d)灰度直方图e)、f)沿着某一条线计算的自相关函数,8.1.3 心理视觉冗余,什么是心理视觉冗余?,人眼感觉到的图像区域亮度不仅取决于该区域的反射光,例如根据马赫带效应,在灰度值为常数的区域也能感觉到灰度值的变化,这是由于眼睛对所有视觉信息感受的灵敏度不同。在正常视觉处理过程中各种信息的相对重要程度不同,有些信息在通常的视觉过程中与另外一些信息相比并不那么重要,这些信息被认为是心理视觉冗余的,去除这些信

7、息并不会明显降低图像质量,心理视觉冗余,a)256灰度级原图像b)量化为16级后图像c)利用人类视觉特性进行量化后图像,原来8bit/像素压缩后4bit/像素压缩率为2:1存在假轮廓效应,改进的灰度级(IGS)量化方法,IGS量化过程:先由当前的8位灰度级值(Gray Level)与前一个 sum(初始值为零)的低4位相加。如果当前值的高4位是11112,则用00002与其相加,保持其不变。将得到的和的高4位的值作为编码像素值。,IGS利用眼睛对边缘固有的敏感性,通过一个伪随机数加到每个像素上将这些边缘拆散。这个伪随机数是在对结果进行量化之前,根据表示相邻像素灰度级的原编码的低位生成的。由于低

8、位完全是随机的,所以这样做等于增加了通常与伪轮廓相关的人工边缘随机性的灰度级。,8.1.4 保真度准则,保真度准则,图像压缩可能会导致信息损失,如去除心理,视觉冗余数据,需要评价信息损失的测度以描述解码图像相对于原始图像的偏离程度,这些测度称为保真度准则,常用保真度准则分为两大类:,客观保真度准则主观保真度准则,保真度准则客观保真度准则当所损失的信息量可以用编码输入图像与编码输出图像的函数表示时,它就是基于客观保真度准则的常用的两种客观保真度准则,均方根误差均方信噪比,均方根信噪比 SNR rms为,4,6,主观保真度准则,评分1235,评价优秀良好可用刚可看差不能用,说明图像质量非常好,如同

9、人想象出的最好质量图像质量高,观看舒服,有干扰但不影响观看图像质量可接受,有干扰但不太影响观看图像质量差,干扰有些妨碍观看,希望改进图像质量很差,妨碍观看的干扰始终存在,几乎无法观看图像质量极差,不能使用,图像压缩模型信源解码器,信道,符号解码器,反向转换器,f x,y,信源解码器符号解码器:进行符号编码的逆操作反向转换器:进行转换器的逆操作为什么没有反向量化器?,图像压缩模型,8.2.2信道编码器和信道解码器,在有噪声的或易产生误差时,信道编码器和信道解码器对整个编解码过程非常重要,信道编码器和解码器通过向信源编码数据中插入预制的冗余数据来减少信道噪声的影响。由于信源编码器几乎不包含冗余,所

10、以如果没有附加这种预制的冗余,它对噪声传送会有很高的敏感性。因此,信道编码是解决可靠性问题,尽量使处理过的信号在传输过程中不出错或少出错,即使出错也要有能力尽量纠正错误。,信道编码技术:比如汉明(Hamming)编码。在编了码的码字后面增加足够的比特位以保证各个正确的码字之间至少有一定数量的比特位不相同,图像压缩模型8.3 信息论基础显示一幅图像需要多大的数据量?有没有描述一幅图像且没有信息丢失的最小数据量?,信息测量对一个随机事件E,如果它的出现概率是P(E),那么它包含的信息:,I E log,1PE,log PE,I(E)称为E的自信息。如果P(E)=1(即事件总发生),那么I(E)=0

11、,图像压缩模型,8.3.2 信息信道,信 源,信 道,信 宿,信道是连接信源和用户的物理媒介。它可以是电话线、无线传播、导线或internet,考虑无记忆信源Z,某个信源符号a j,如果它出现的概率是p(a j),信源熵H(z),a的自信息量,信息理论基础,直观地理解自信息量的概念:一个概率小的符号出现将带来更大的信息量.,每个符号的平均自信息量,单位:比特/符号,一般来讲,事件E的自信息量与E的概率的关系是反向的。如果P(E)=1,则I(E)=0。因为:(a)越不可能出现的字符,它的出现对于消息的信息量的贡献越大。(b)整个消息的信息量是构成它的那些字符中对于信息量有贡献的那部分之和。,信息

12、论基础,信道输出(续),将上式中的条件概率放入一个KJ的正向信,道传递矩阵Q,其元素qkj=P(bk|aj)为条件概率,则输出符号集的概率分布由下式计算,v Qz,J,k,J,K,j,J,K,j,J,K,j,信息论基础条件熵函数H(z|bk)H z|bk P a j|bk log P a j|bk j 1条件概率H(z|v),H z|v,K H z|bk 1,P bk,P aj 1 k 1 P aj 1 k 1,|bk log P a j|bk P bk|bk P bk log P a j|bk,P a j,bk log P aj 1 k 1,|bk,K,信息论基础,因为两个事件C和D的联合概

13、率是,PC,D PC|DPD PD|CPC,P(aj)的变换(下面推导互信息使用),Paj Paj,b1 Paj,b2.Paj,bK,Paj,bK,k1,定义信道传输元素,qkj P bk|a j,J J K,J,K,J,K,Pa j|bk,J,K,Pa j,Pa j|bk Pbk,J,K,Pa j Pbk,J,K,j,k,j,k,j 1 k 1 j k,信息论基础,z和v的互信息定义为,I z,v H z H z|v,Pa j log Pa j Pa j,bk log Pa j|bk,j 1 j 1 k 1,Pa j,bk log Pa j|bk Pa j,bk log Pa j,j 1 k

14、 1 j 1 k 1,Pa j,bk log,j 1 k 1,Pa j,bk log,j 1 k 1,Pa,b log PPaaPbb,P a,b,J,K,j,k,P a P b,P b|a P a,J,K,k,j,j,P a P b,J,K,ki,信息论基础z和v的互信息的另外一种表达I z,v P a j,bk logj 1 k 1 j k P bk|a j P a j logj 1 k 1 j k,P a j qj 1 k 1,kj,log,q kjP bk,J Kj 1 k 1,P a j q kj log,J P bi 1,q kjk|a i P a i,J Kj 1 k 1,P a

15、 j q kj log,q kjJ P a i qi 1,信息论基础,互信息总结,互信息I(z,v)是信源符号概率向量z和信道,矩阵Q的函数,当输入和输出符号统计独立时,I(z,v)取得,最小值0,I(z,v)对所有信源分布u的最大值就是信道,容量 C maxI u,v,u,信道容量定义了能够通过信道可靠地传送信,息的最大传送率,信息论基础,基本编码定理,无噪声编码定理,噪声编码定理(自学)信源编码定理(自学),无噪声编码定理,香农第一定理:当信道和通信系统中不存在噪声的时候,通信系统的主要功能是用尽可能简洁的方法表示信源,在这种情况下无噪声编码定理定义了可以达到的每个信源符号的最小平均码字长

16、度。,这一定理说明了通过对无限扩充的信源进行编码可以令无限接近H(z)。任何编码策略的编码效率可以定义为:,表示对应于非扩充信源的第n次扩充的编码平均码长,信源输出ai是用一个码字表示的,码字的长度为不小于其自信息量的最小整数,图像压缩编码的分类,信息论基础8.4 无损压缩,变长编码霍夫曼(Huffman)编码其它变长编码,算术编码,LZW编码位平面编码无损预测编码,无误差压缩无误差压缩的必要性在医疗或商业文件的归档,有损压缩因为法律原因而被禁止卫星成像的收集,考虑数据使用和所花费用,不希望有任何数据损失X光拍片,信息的丢失会导致诊断的正确性,无损压缩的压缩率一般为2-10,无误差压缩技术减少

17、像素间冗余:建立一种可替代的图像表达方式减少编码冗余:对这种表达方式进行编码,8.4.1 变长编码,无误差图像压缩的最简单方法就是减少仅有的编码冗余。编码冗余通常存在于表示图像灰度级的自然二进制编码过程中。它可以对灰度级进行编码,使表示一个像素的码字的平均比特数最小来消除编码冗余。这样做需要变长编码结构,通常将最短的码字赋予出现概率最大的灰度级。,1.,2.,无误差压缩,变长编码减少编码冗余变长编码,即把最短的码字赋予出现概率最大的灰度级霍夫曼编码将需要考虑的符号概率排序,并将最低概率的符号联结为一个单一符号对每个化简后的信源进行编码,从最小的信源开始,一直编码到原始的信源,霍夫曼编码,霍夫曼

18、编码信源化简,霍夫曼编码,(二)霍夫曼化简后的信源编码,编码的平均长度:,其信源熵为2.14bit/符号。,编码的效率:,霍夫曼编码,其它接近最佳的变长编码:为什么需要?,当对大量符号进行编码,构造霍夫曼编码比较复杂,对J个信源符号,需要进行J-2次信源化简和J-2次编码分配,对256个灰度级图像,需要256-2=254次信源化简和254次编码分配,考虑牺牲编码效率以减少编码构造的复杂性,几种变长编码,截取霍夫曼编码,霍夫曼编码,二进制编码,B2编码,二值移位编码,霍夫曼移位编码,算术编码,算术编码生成的是非块码,在信源符号和码字之间不存在一一对应的关系。算术编码是给整个符号序列分配一个单一的

19、算术码字,这个码字本身定义了一个介于0和1之间的实数间隔。当消息中的符号数目增加时,用于描述消息的间隔变的更小,而表示间隔所需要的信息单元的数目就变得更多了。消息的每个符号根据符号出现的概率减小间隔的大小,这种技术不象霍夫曼方法那样要求每次对一个符号进行编码,所以理论上达到了无噪声编码准则确定的界限。,一个五个符号的序列a1,a2,a3,a3,a4来自一个四符号信源。经过算术编码后,区间被确定为0.06752,0.0688),这个区间的任何数字都可以用来表示这个消息(比如0.068)。,8.4.2 LZW编码,LZW编码:消除像素间冗余的无误差编码方法,是由Lemple和Ziv最早提出,然后由

20、Welch充实的有专利保护的LZW算法.Lempel-Ziv-Welch(LZW)编码,对信源符号的可变长度序列分配固定长度码字,不需要了解有关被编码符号的出现概率的知识。,LZW编码的原理:在编码处理的开始阶段,先构造一个对信源符号进行编码的编码本(字典)。对于8位单色图像,字典中前256个字被分配给灰度值0-255。当编码器顺序地分析图像像素的时候,字典中没有包括的灰度级序列由算法决定其出现的位置。,使用LZW的文件格式包括GIF,TIFF和PDF等。,LZW编码基本思想是这样的:以8位(256个灰度级)图像为例.1.准备一个数据字典(可以看做一个数组).数组的前256项初始化为0,1,2

21、,.,255,后面的项为空白.为方便起见,我们管字典中的每一项叫“条目”.2.开始对图像文件编码,图像文件从左向右、从上到下扫描,把扫描得到的灰度级数据与字典中的条目进行比较.如果相同,就把这个条目的index(在数组中的位置)作为码字输出.如果在字典中找不到与之匹配的条目,则在字典中创建一个新的条目(从第256项开始).,一个512字节的字典,一个44、8位图像,示例 原始码流 35 46 67 35 46 78 90 33 35 46 78 34 开始编码:因为第一个数字是35,我们必然可以从字典中找到与之匹配的条目(也就是第35个),但我们不急着用第35个条目与之匹配,先看看第二个数字是

22、46,希望在字典中 能找到一个更长的模式“35 46”这样的条目,与之匹配,但不幸的是我们没有找到,所以只对第一个数字35编码,结果输出35;同时把“35 46”加入字典的第256项,希望以后能碰到它.同理,对46编码,输出46,同时把“46 67”加入字典的第257项.同理,对67编码,输出67,同时把“67 35”加入字典的第258项.这时注意了:对35编码,是不是现在还输出35呢?当然不是,我们发现35后面跟着 46,扫描字典,可以发现第256个模式与之匹配,输出256.同时,将模式“35 46 78“加入到 字典的第259项.同理,接下来输出 78,90,33,259,34.所以输出的

23、码流为35 46 67 256 78 90 33 259 34.对上面的过程归纳一下:在编码的过程中生成字典;一边从字典中选择长度尽量长的模式 与原始码流匹配.,LZW编码例子,Appear,39-39,126-126,39-39,39-39-126,126-39,39-126,位平面分解灰度编码位平面图像的灰度编码根据下列方法得到:g m 1 am 1,g i ai ai 1,0 i m-2,避免二值图像位平面的问题,连续码字只在1位位置上不同,如亮度127(01000000)和亮度128(11000000)的转换,位平面分界例,8比特单色图像,二值图像,位平面分解例,二值图像位平面,灰度编

24、码位平面,采用不同分层编码方法处理的图像。左侧是第一种方法分层编码的高4位位图右侧是第二种方法编码的高4位位图高阶平面比低阶部分要简单,高比特位平面包含大块的均匀区域,图像细节较少。灰度编码位平面比二值位平面复杂性较少,位平面分解例,二值图像位平面,灰度编码位平面,二值图编码,常数值区域编码CAC一维行程编码二维行程编码,常数块编码,用专门的码字表达全是0或1的连通区域,将图像分成全黑,全白或混合的pq尺寸的块。出现频率最高的类赋予1位码字0,其它2类分别赋予2位码字10和11,压缩二值图或位平面的一种简单有效的方法是使用指定的码字识别大片连续的1或0区域。这样的方法称为区域编码(CAC),W

25、BS编码(White Block Skipping):大多数二值图像中的黑象素只占图像象数总数很少的一部分。因此若能跳过白色区域,对黑色像素编码这样表示这些图像的比特数将减少,每个像素平均比特数也就可以减少 1)一维WBS编码 将图像的每条扫描线分成若干段,每段有N个像素。对全部是白色的像素用lbit“0”表示。对于至少有一个黑色像素的像素段采用N十1个比特编码即第一个比特人为地规定为1其余的N比特采用直接编码(白色为“0”黑色为“1”码字)。,跳过白色块编码,一维WBS编码平均码字长度为 PN:段长为N的全白像素段出现的概率。b41.25-P4。全白概率必须大于14才可能获得压缩效果。段长N

26、不同,全白概率也不同。为了获得最小的平均码字长度,对给定的一幅二值图像应有一个最佳N值,不同图像的最佳段长N值不同。,2)二维WBS编码 一维WBS编码可以方便地推广到二维。一维的像素段 二维中像素块 假设像素块尺寸为MN,全部为白色的像素块用“0”表示,非全白像素块用(MN+1)个比特码表示。其中第一个比特为“1”。其余MN个比特采用直接编码。,最终获得的编码:0100100010101000,位平面编码,一维行程编码,在一个逐行存储的图象中,具有相同灰度值的一些象素组成的序列称为一个行程。在编码时,对于每个行程只存储一个灰度值的码,再紧跟着存储这个行程的长度。这种按照行程进行的编码被称为行程编码(Run Length Encoding)。,是传真编码的标准压缩方法,对从左到右扫描一行时所遇到的1或0的连接组,使用这些连接组的长度进行编码决定行程长度值的常用方法:指定每一行第一次行程的值,假设每一行从白色行程开始,这次行程的长度可能为0,一维行程编码,见p332图8.3,尽管行程长度编码本身是一种压缩图像的有效方法,但其它的压缩方法通常可以通过对行程长度本身进行变长编码实现。这些变长编码是根据他们自身的统计数据特殊制定的。,分析:对于有大面积色块的图像,压缩效果很好对于纷杂的图像,压缩效果不好,最坏情况下,会加倍图像,行程编码,无损预测编码,无损预测编解码系统,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号