《数据压缩技术》PPT课件.ppt

上传人:小飞机 文档编号:5519457 上传时间:2023-07-16 格式:PPT 页数:83 大小:2.30MB
返回 下载 相关 举报
《数据压缩技术》PPT课件.ppt_第1页
第1页 / 共83页
《数据压缩技术》PPT课件.ppt_第2页
第2页 / 共83页
《数据压缩技术》PPT课件.ppt_第3页
第3页 / 共83页
《数据压缩技术》PPT课件.ppt_第4页
第4页 / 共83页
《数据压缩技术》PPT课件.ppt_第5页
第5页 / 共83页
点击查看更多>>
资源描述

《《数据压缩技术》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《数据压缩技术》PPT课件.ppt(83页珍藏版)》请在三一办公上搜索。

1、第5章,多媒体技术,第 5 章,多媒体数据压缩技术,5.1 数据压缩基本原理 5.1.1 信息、数据与编码 5.1.2 数据压缩的条件 5.1.3 数据冗余5.2 数据压缩算法 5.2.1 数据压缩算法分类 5.2.2 预测编码原理 5.2.3 变换编码原理 5.2.4 统计编码原理 5.2.5 霍夫曼编码原理 5.2.6 行程编码原理,5.2.7 算术编码原理 5.2.8 LZW压缩编码5.3 静态图像JPEG压缩编码技术 5.3.1 JPEG标准的由来 5.3.2 JPEG压缩算法 5.3.3 无失真预测编码 5.3.4 有失真DCT压缩编码5.4 动态图像MPEG压缩编码技术 5.4.1

2、 基本原理 5.4.2 MPEG技术标准,数据压缩基本原理,5.1,数据压缩的对象是数据。数据是信息的载体,用来记录和传送信息。真正有用的不是数据本身,而是数据所携带的信息。大的数据量并不代表含有大的信息量。而对于去掉冗余的数据对信息没有本质的影响称为压缩。,数据压缩原理,5.1.1 信息、数据与编码,我们了解的东西,描述它用的信息量少,不了解的东西,描述它用的信息量大。在信息论中,可以说:信息是用不确定的度量来定义的;一个消息的可能性越小,其信息含量越大;消息的可能性越大,则信息含量越小。,自然现象,数据压缩基本原理,5.1,5.1.1 信息、数据与编码,1信息和熵,信息量的大小和消息有一定

3、的关系。在数学上,消息是其出现概率 的单调下降函数。信息量越大,消息的可能性越小,反之亦然。信息量:为了从N个相等的可能事件中挑选出一个事件所需的信息 度量和含量,所提问“是或否”的次数。也就是说,在N个事件中辨 识特定的一个事件要询问“是或否”次数。,例,随着每次询问,有半数的可能事件被取消,这个过程由公式表示:,可看出:对于256个数的询问只要进行8次,即可确定一个具体的数。设:从N个数中选定任意一个数x的概率为p(x),假定选定任意一个数的概率都相等,即p(x)=1/N,则信息量为:,如果将信息源所有可能事件的信息量进行平均,即可得到信息的“熵”(熵是平均信息量),信息源X的符号集为xi

4、(i=1,2,N)。设:xi出现的概率为p(xi),则信息源X的熵为:,信息与数据,2.,信息可以用函数表示,该函数由信息论创始人香农提出,以概率论的观点对信息进行定量描述,具体的信息函数表达式为:,公式中,Pi(i=1,2,r)是随机消息组合Xa1,a2,ar中的消息ai(i=1,2,r)的先验概率。Pi 可以度量ai(i=1,2,r)所含的信息量。而I(ai)(i=1,2,r)在X的先验概率空间Pp1,p2,pr中的统计平均值为信息源X的熵:,信息源X的熵用来度量X中每种消息所包含的平均信息量。信息熵主要表示信息系统的有序程度,而不是热力学中系统的无序程度。,例2-1 设信源有16种符号,

5、其出现的概率相同,即 P(Xi)=1/16。计算其平均信息熵。,例2-2 某信源有8种符号,其出现的概率如下:,信源中含有自然冗余度,这些冗余度既来自于信源本身的相关性,又来自于信源概率分布的不均匀性,只要找到去除相关性或改变概率分布不均匀性的手段和方法,也就找到了信息熵编码的方法。但信源所含有的平均信息量(熵)是进行无失真编码的理论的极限,只要不低于此极限,就能找到某种适宜的编码方法,去逼近信息熵,实现数据压缩。,香侬理论的要点,2.,多媒体信息的数据量,3.,考虑一张 640480 的全彩影像 64048038=7,372,800 Bits调制解调器(Modem)为 36Kbps 7372

6、800/36000=204.8(sec)=3.41(min)假设压缩算法(JPEG)的压缩率为1:12(7372800/12)/36000=17.1(sec)对图片压缩效果较好,但对色彩单纯的图形則效果一般不很理想。,数据压缩的条件,数据冗余度(重复数据、可忽略数据),信息传输与存储的限制(压缩 传输或存储 解压缩),44.1kHz/Stereo 1.3MB,22.0kHz/Mono 0.3MB,Stop,数据冗余,冗余基本概念,冗余 信息所具有的各种性质中多余的无用空间,冗余度 多余的无用空间的程度,音频数据8kHz采样8bit60秒=3840KBit(合480KB/分钟),冗余分类,1 空

7、间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类,1

8、 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类

9、,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余

10、分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,印度金庙泰姬陵,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述

11、7种以外的冗余,声音频率文字组句色彩渐变主观意识:,数据压缩算法,5.2,5.2.1 数据压缩算法分类,压缩比:2:15:1,压缩比:1:100,视频压缩算法结构图,视频压缩,无损压缩,有损压缩,霍夫曼编码行程编码算术编码LZW编码,预测编码变换编码模型编码基于重要性混合编码,DPCMADPCM运动编码,DCT变换小波变换子带编码,分形变换,滤波子采样矢量量化,H.261MPEG,预测编码原理,预测编码 有损压缩编码,主要对统计冗余进行压缩。,1预测编码的基本原理 用原样本值对新样本进行预测,得到新样本的预测值。接着,取新 样本的实际值和预测值进行比较,二者相减得到差值,然后对差值 进行编码。

12、,变换编码原理,变换编码(Transform coding)有损压缩编码,用于对统计冗余(图像数据)的压缩。,工作原理 首先对时域上的信号进行函数运算,并变换到频域上,然后在频域上对变换后的信号进行编码。在频域上,信息是按照频谱的能量和频率分布进行排列的。,例如,声音中的频谱分析实际上是对语音波形进行了快速傅里叶变换(FFT),将时域信号变到了频域中,可以清楚地看到能量集中在哪些频率范围内。,5.2.4 统计编码原理,统计编码 无损压缩编码。根据消息出现的概率分布特性,在消息和码字之间确定严格的对应关系,以便准确无误地恢复数据。一般而言,图像中某些数据出现概率比较高,而另一些出现概率较低。对出

13、现概率高的数据分配短码,对出现概率低的数据分配长码。此种方式不舍弃数据冗余,只改变编码分配的长度,因此总数据流量降低。,霍夫曼编码原理,霍夫曼编码 无损编码。,设信号源为X=、a、e、I、m、t、c、h、r。对应的概率为p=O.22、0.22、0.14、O.07、0.07、0.07、0.07、0.07、0.07,试给出该信源的霍夫曼编码方案。解:若传送一个串字符串“I am a teacher”,共14个字符。若用ASCII传送,每个字符8位,共需112位。该字符串中有9个不同的符号,至少需要4位二进制才能表示,这样传送该字符串也要56位。若用刚计算的Huffman编码,只需要42位。,霍夫曼

14、编码举例,霍夫曼编码过程,可以得到:a的编码00 e的编码 111 I的编码1101 m的编码1100 t的编码1011 c的编码 1010 h的编码1001 r的编码 1000原字符串(二进制)长度:=112(148)位Huffman编码长度:=42位(01 00 111 1101 1100 1011 1010 1001 1000),行程编码原理,行程编码(Run Length Coding)无损压缩编码。,设有数据流“AAABBBBCCCCCDAAAAAA”,试计算该数据的行程编码。解:A重复3次,B重复4次,C重复5次,D不重复,A重复6次,RLC数据流为:“SA3SB4SC5DSA6”

15、,其中S为指示符。总共占用13个字节,而源数据占用19个字节。有时行程编码不用指示符,重复与否相同对待,则相应的RLC为“A3B4C5D1A6”占用10个字节。,例,算术编码原理,算术编码 无损压缩编码,属于统计编码。,20世纪60年代由Elias提出,某些方面优于霍夫曼编码。因此,在JPEG标准的扩展系统中,算术编码已经取代了霍夫曼编码。,LZW压缩编码,LZW(Lempel Ziv Welch)无损压缩编码,用于图像数据的压缩。,LZW(Lempel Ziv Welch)是一种字典式无损压缩编码。1977年两位以色列教授Lempel和Ziv提出了查找冗余字符和用较短的符号标记替代冗余字符的

16、概念。1985年美国人Welch将该技术发展到实际运用阶段,命名为LZW技术。LZW把数据流中复杂的数据用简单的代码来表示,并把代码和数据的对应关系建立一个转换表(“字符串表”)。该转换表是在压缩或解压缩过程中动态生成的表,并用于压缩和解压缩过程中。LZW被广泛用于图像压缩领域。,LZW压缩编码,静态图像JPEG压缩编码技术,5.3,5.3.1 JPEG标准的由来,1991年,联合专家组提出了ISO CD建议草案,后经过国际电子技术委员会ISO/IEC的批准,正式成为第10918号标准,并正式命名为“JPEG高质量静止图像压缩编码标准”,简称“JPEG标准”。,计算机业内人士探寻一种压缩比大、

17、图像质量高的压缩编码。在这种背景下,压缩标准成为急待解决的问题。1986年CCITT和ISO共同成立了JPEG联合图像专家组,从事图像压缩的工业标准和学术意义的研究、探索。提出了ISO CD建议草案、即多灰度静止图像的数字压缩编码标准。,JPEG算法概述,JPEG算法根据人眼对亮度和颜色变化比较敏感的原理,在对图像数据进行压缩时,只保存亮度和颜色变化的数据部分,而舍弃人眼不敏感的成分,以达到压缩的目的。在图像还原时,并不重新建立原始图像,而是生成类似图像,该图像保留了人眼敏感的色彩和亮度。JPEG适合于连续色调、多级灰度、彩色或黑白图像的数据压缩。,JPEG压缩算法,适用于连续色调、多级灰度、

18、彩色或黑白图像的数据压缩。,无损压缩比:大约为4:1。有损压缩比:在10:1100:1之间。不大于40:1时,还原的图像在色彩、清晰度、颜色分布等方面与原始图像相比,误差不大,基本上保持了原始图像的风貌。,JPEG算法更多,无失真预测编码,无失真预测编码 无损压缩,压缩比一般为2:1。,有失真DCT压缩编码,采用DCT(Discrete Cosine Transform)离散余弦变换的压缩算法。,1DCT离散余弦变换,有失真DCT压缩编码,3图像的质量与压缩比,采用DCT算法存在失真,但是,只要量化表中的元素更科学、更 符合人类视觉敏感度,则压缩后的图像不会产生过大的视觉变化。,动态图像MPE

19、G压缩编码技术,5.4,5.4.1 基本原理,1动态图像压缩主要解决的问题,1)正确区分静止图像和动态图像。2)提取动态图像中的活动成分。3)进行帧之间的预测,提供压缩的依据。,图像的分类,3.,MPEG标准根据处理图像的性质,把图像分成以下三类:,1)帧内图像(Intra pictures)又称“I图像”,JPEG标准按照静止图像的模式进行压缩处理。主要利用静止图像自身的相关性进行编码,实现数据压缩的目的。帧内图像的压缩比属于中度压缩,典型的压缩像素编码为2 bit。,MPEG技术标准,MPEG-标准,诞生于1991年,主要特点:,1)以1.5Mb/s的速率传输视频信号,即压缩信号带宽为1.

20、5Mb/s。2)以单通道64kb/s、128kb/s和192kb/s的传输速率传输音频信号。3)可通过差值运算,在352240画面分辨率上显示活动图像。4)分三个组成部分:视频、音频和系统。5)对于帧内图像,采用二维余弦变换、自适应算术编码、行程编码、变字长编码,以及差分脉冲编码(DPCM)进行压缩。6)帧间压缩采用运动补偿预测编码和运动补偿内插编码。,MPEG技术标准,MPEG-标准,主要特点,1)压缩信号带宽为415Mb/s,即信号传输速率为415Mb/s。2)支持NTSC制720480画面分辨率,PAL制720576画面分辨率,画面质量达到广播级,适用于HDTV高质量电视信号的传送与播放

21、。3)解码器同时支持MPEG-和MPEG-两种标准。4)视频信号的传输速率为30帧/s,音频信号的质量达到CD级。5)为了在画面质量、数据量和带宽之间寻求最佳值,允许在一定范围 内调整压缩比。6)最高压缩比为200:1,但由于画面中活动内容的多少和人为调整压缩 比等因素的影响,大多数情况下达不到最高压缩比。7)MPEG-用于DVD视频信号的压缩,DVD音频信号的压缩随制式的 不同而不同:PAL制采用MPEG-;NTSC制采用AC3压缩标准。,第5章 多媒体数据压缩技术,小结,5.1 数据压缩基本原理 5.1.1 信息、数据与编码 5.1.2 数据压缩的条件 5.1.3 数据冗余5.2 数据压缩

22、算法 5.2.1 数据压缩算法分类 5.2.2 预测编码原理 5.2.3 变换编码原理 5.2.4 统计编码原理 5.2.5 霍夫曼编码原理 5.2.6 行程编码原理,5.2.7 算术编码原理 5.2.8 LZW压缩编码5.3 静态图像JPEG压缩编码技术 5.3.1 JPEG标准的由来 5.3.2 JPEG压缩算法 5.3.3 无失真预测编码 5.3.4 有失真DCT压缩编码5.4 动态图像MPEG压缩编码技术 5.4.1 基本原理 5.4.2 MPEG技术标准,习题五,5.1 数据压缩的理由有哪些?5.2 什么是数据冗余?5.3 冗余有多少种?分别是什么?5.4 无损压缩编码指的是什么?5

23、.5 数据压缩具备哪两个过程?5.6 霍夫曼编码的特点是什么?5.7 采用JPEG压缩格式的静态图像具有哪些主要特点?5.8 动态图像压缩主要解决哪些问题?5.9 MPEG-标准具有哪些主要特点?,香农1948年则创立了信息论(information theory)。克劳德香农在公众中并不特别知名,但他是使我们的世界能进行即时通信的少数科学家和思想家之一。他是美国科学院院士、美国工程院院士、英国皇家学会会员、美国哲学学会会员。他获得过许多荣誉和奖励。例如1949年Morris奖、1955年Ballantine奖、1962年Kelly奖、1966年的国家科学奖章、IEEE的荣誉奖章、1978年J

24、aquard奖、1983年Fritz奖、1985年基础科学京都奖。,香农,克劳德香农(Claude Elwood Shannon,1916-2001)1916年4月30日诞生于美国密西根州的Petoskey。2001年2月24日,香农在马萨诸塞州Medford辞世,享年85岁。香农被信息界誉为信息论及数字通信时代的奠基人。,返回,Huffman树的定义构造Huffman树Huffman编码,Huffman(哈夫曼)编码,Huffman树也称为最优树,是一类带权路径最短的二叉树。树的带权路径长度定义为:,其中:n 树中叶结点的个数 wi 第i个结点的权值 li 第i个结点的路径长度,Huffma

25、n树的定义,以下有三棵树:,WPLa=7x2+5x2+2x2+4x2=36,WPLb=7x3+5x3+2x1+4x2=46,WPLc=7x1+5x2+2x3+4x3=35,事实证明按哈夫曼树构造二叉树,可得到很好的特性,应用于实际问题,可提高处理效率。,Huffman树举例,由统计规律可知,考试成绩的分布符合正态分布:,根据正态分布规律,在6090之间的分数占85%,而不及格和优秀是少数。,应用举例,判定树比较:,若输入1万个数据:按A的判定过程进行操作,约需比较3.2万次 而按B比较,则仅需2.2万次。,将百分制转换成五分制,构造Huffman树算法步骤:Step1 将n个带权值wi(in)

26、的结点构成n棵二叉树的集合T=T1,T2,Tn,每棵二叉树只有一个根结点。Step2 在T中选取两个权值最小的结点作为左右子树,构成一个新的二叉树,其根结点的权值取左右子树权值之和;Step3 在T中删除这两棵树,将新构成的树加入到T中;Step4 重复2)、3)步的操作,直到T中只含一棵树为止,该树就是Huffman树。,构造Huffman树,以权值分别为7,5,2,4的结点a、b、c、d构造Huffman树。T=a b c d,(d)T=T1,(c)T=a T2,(b)T=a b T3,(a)T=a b c d,示例,构造Huffman树举例,编码:用二进制数的不同组合来表示字符的方法。前

27、缀编码:一种非等长度的编码(任一个字符的编码都不是另一个字符编码的前缀)。,Huffman编码:一种非等长度的编码。以给定权值的结点构造Huffman树,按二进制前缀编码的方式构成的编码为Huffman编码。,Huffman编码,在某系统的通信联络中可能出现8种字符,其频率分别为0.05、0.29、0.07、0.08、0.14、0.23、0.03、0.11,设权值分别为5,29,7,8,14,23,3,11,n=8,其Huffman树为:,返回,Huffman编码举例,JPEG算法的四种编码模式,1)DCT顺序编码模式 基本操作模式,也称基本系统,所有JPEG 编码解码器都必须支持基本系统,采

28、用二维余弦变换的编码方案。2)DCT递增模式,该模式又叫累进模式。3)无失真编码模式。4)分层编码模式。,基线编码系统。面向大多数有损压缩的应用,采用DCT变换压缩。输入图像精度8位/像素/色,顺序模式,采用Huffman或算术编码;扩展编码系统。为满足更广泛领域的应用而设置的,从低分辨率到高分辨率逐步递进传递的应用。输入图像精度12位/像素/色,累进模式,采用Huffman或算术编码;独立编码系统。面向无损压缩的应用,采用无损预测压缩。输入图像精度2-16位/像素/色,顺序模式,采用Huffman或算术编码。一个产品或系统必须包括对基线系统的支持。,JPEG算法的三种压缩系统,顺序模式和累进

29、模式,有失真DCT压缩编码,采用DCT(Discrete Cosine Transform)离散余弦变换的压缩算法。,1DCT离散余弦变换,正向离散余弦变换(Forward Discrete Cosine Transform,FDCT)把空间域表示的图像变换为频率域表示的图像。量化DCT系数 用加权函数对DCT系数进行量化,该加权函数对于人视觉系统是最佳的。Huffman编码 用Huffman可变字长编码器对量化系数进行编码。,译码或者叫做解压缩的过程与压缩编码过程相反。,有失真压缩三个步骤,DCT变换是数字图像处理中的重要变换。但对于大尺寸的二维数值矩阵,若采用普通DCT变换,其花费的时间将

30、是让人难以忍受甚至无法达到实用。解决方案,关注快速DCT变换的算法研究。目前而言,DCT变换的快速算法有以下两种方式:1快速FFT算法。直接利用FFT来实现DCT变换的快速算法。特点是实现相对较容易,但计算过程会涉及到复数运算。由于DCT变换前后的数据都是实数,而引入复数,显然是增加了运算量,也给硬件存储提出了更高的要求。2直接在实数域进行DCT快速变换。显然,这种方法相比于前一种而言,计算量和硬件要求都要优于前者。鉴于此,一般采用第二种方法来实现DCT变换的快速算法。,DCT变换存在的问题,DCT变换是一种实数域变换,其变换核心为实数的余弦函数。变换实质是将一个空间域上的信号,变换为一个频域

31、上的信号。设一幅图像,或者一幅图像的某个彩色分量经过数字化后存为矩阵A,并设A为MN矩阵,则2维DCT变换定义为:,DCT变换的快速算法,采用快速DCT变换对一幅256灰度的256256的图像进行DCT正变换只需94ms。而如果采用普通DCT变换,所需时间要575,172ms。,举例,例,图像矩阵分块颜色变换零偏置转换频域变换系数量化符号编码,JPEG压缩步骤,量化器,DCT正向变换,构造88的子图,输入图像NN,符号编码器,压缩图像,颜色空间转换,人眼对亮度更敏感,提取亮度特征,将RGB转换为YCbCr模型。对亮度采用特殊编码:Y=0.299R+0.5870G+0.1140BCb=0.178

32、7R 0.3313G+0.5000B+128Cr=0.5000R 0.4187G 0.0813B+128颜色解码:R=Y+1.40200(Cr 128)G=Y 0.34414(Cb 128)0.71414(Cr 128)B=Y+1.77200(Cb 128),颜色空间转换RGB转到YCbCr,YUV是电视系统中采用的颜色模式。Y是亮度信号,U、V是色度信号。转换公式:,RGB与YUV颜色空间的转换,将图像矩阵分为88的子块,对每一块单独进行DCT变换。,根据人眼对亮度信号比对色度信号更加敏感的生理特性,将Y分量划分为88的块,将U、V分量划分为1616的块。U、V分量的每一块舍弃1/2的信息后

33、形成一个88的矩阵。,构造子图像,对变换后的DCT矩阵进行量化处理(用表1和表2的量化矩阵分别对Y分量和U、V分量量化)。量化的原则:低频部分用小值量化,高频部分用大值量化,量化结果使高频部分出现大量“0”。采用阈值作为子图系数位置函数的量化方式。所有子图使用同一个全局阈值模板,但阈值的取值与系数的位置相关,阈值模板给出了不同位置上系数的相应阈值。对于亮度和颜色使用不同的量化阈值模板,并取整。,量化处理,表1 JPEG标准所推荐的亮度量化表,亮度的量化模板系数,17 18 24 479999999918 21 26 669999999924 26 56 999999999947 66 99 9

34、99999999999 99 99 999999999999 99 99 999999999999 99 99 999999999999 99 99 9999999999,表2 JPEG标准所推荐的色度量化表,颜色的量化模板系数,1)正向量化:Squv=round(Suv/Quv)其中:Suv是DCT系数,Quv量化模板系数2)逆向量化:Ruv=Squv Quv例:Sq(0,0)=round-415/16=round-25.9=-26 Ruv(0,0)=-26*16=-416,系数量化公式,-26-3-6 2 2000 0 1-2-4 0 000 0-3 1 5-1-1000 0-4 1 2-

35、1 0000 0 1 0 0 0 0000 0 0 0 0 0000 0 0 0 0 0000 0 0 0 0 0000,量化变换后矩阵样式示意图,低频部分,高频部分,量化结果,为了增加连续“0”系数的个数,重新编排量化后的系数。方法是按照Z字形的式样编排(把一个88的矩阵变成一个164的矢量,频率较低的系数放在矢量的顶部)。,-26-3 1-3-2-6 2-4 1-4 1 1 5 0 2 0 0-1 2 0 0 0 0 0-1-1 EOB 全零结尾用特殊符号EOB,重新编排量化后的系数,在重新对量化数据进行编码后,得到的数据有大量连续的零。对全部数据进行Huffman编码。完成后的编码数组(

36、重排的)是:1010110 0100 001 0100 0101 100001 0110 100011 001 100011 001 001 100101 11100110 110110 0110 11110100 000 1010其中空格是为了可阅读性而插入的。完成编码的重排数组的总位数是92,不压缩需要888=512位。结果的压缩率是 512/92,或 5.6:1。,对量化结果进行编码,解码过程,基于DCT编码过程,彩色图像 像素 645600在计算机中存储为3个矩阵 每个矩阵为645600 各存储R、G、B的3个分量信息。,举例,变换后矩阵的左上角是图像的低频部分,越靠近右下角,频率越高

37、。人的眼睛对高频部分是不敏感的。可以舍弃图像中的高频部分而基本上不影响图像质量。,DCT变换后的图,对应645600的矩阵A,为了舍弃高频部分,将该矩阵的高频部分置为0值。在这令,此时矩阵减小为387360,数据量是原来的(387360)/(645600)=36%,不同压缩比率的图像质量比较,重构后的图像,只保留部分 258240,增大高频部分的舍弃范围(1),数据量是原图的16%,只保留部分 130120,数据量是原图的4%,重构后的图像,增大高频部分的舍弃范围(2),只保留部分 6560,数据量是原图的1%,重构后的图像,增大高频部分的舍弃范围(3),将矩阵A的前15行和列置为0。,去掉少量低频部分对图像的影响,重构后的图像,显然对低频部分的细小修改都会对图像有很大的影响,返回,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号