【教学课件】第3章数字图象处理技术.ppt

上传人:牧羊曲112 文档编号:5658576 上传时间:2023-08-06 格式:PPT 页数:107 大小:323KB
返回 下载 相关 举报
【教学课件】第3章数字图象处理技术.ppt_第1页
第1页 / 共107页
【教学课件】第3章数字图象处理技术.ppt_第2页
第2页 / 共107页
【教学课件】第3章数字图象处理技术.ppt_第3页
第3页 / 共107页
【教学课件】第3章数字图象处理技术.ppt_第4页
第4页 / 共107页
【教学课件】第3章数字图象处理技术.ppt_第5页
第5页 / 共107页
点击查看更多>>
资源描述

《【教学课件】第3章数字图象处理技术.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第3章数字图象处理技术.ppt(107页珍藏版)》请在三一办公上搜索。

1、第3章 数字图象处理技术,3.1 信号处理的基本术语3.2 图象数据压缩基础3.3 图象数据压缩算法3.4 常用图形、图像文件3.5 静态图像压缩标准3.6 动态图像压缩标准3.7 H.26x标准,3.1 信号处理的基本术语,3.1.1 采样和量化采样:信号在时间上的离散化,即按照固定的时间间隔 t在模拟信号x(t)上逐点采取其瞬时值。量化:对信号的幅值进行离散化,即用二进制量化电平来表示幅值。频率混叠:时域波形的信号混叠在频谱上的反映,是因为在时域上选择采样时间间隔不当而导致频域上高低频之间彼此混淆。采样定理:不产生频率混叠的最低采样频率fs 应为信号中最高频率fm的倍。实际采样频率:一般取

2、fs(.)fm,3.1 信号处理的基本术语,3.1.2 采样长度的选择与频率分辨率采样长度:采样时间的长短应该保证能反映信号的全貌,对瞬态信号应该包括整个瞬态过程,对周期信号应包括一个完整周期。频率分辨率:f=fc/nfc被分析信号的频率;n谱线数或者表示为:f=fs/2.56n=1/(2.56nt)=1/(N t)=1/TN=2.56n 为采样点数,一般取值为2的m次方,如1024,2048等。,3.1 信号处理的基本术语,3.1.3 DFT 和IDFT傅立叶分析是将原始信号分解成不同频率成份的正弦波的组合,从而把时域信号转化为频域信号。对于数字化的信号,采用离散傅立叶变换DFT和其逆变换I

3、DFT进行处理。,3.1 信号处理的基本术语,3.1.4 小波变换小波变换用于图象编码的基本思想是,把图象进行多分辨率分解,得到不同空间、不同频率的子图象,然后再对子图象进行系数编码,即对系数进行量化压缩。优点:对信号的低频长时特性和高频短时特性同时处理,能有效克服傅立叶变换在处理非平稳复杂信号时存在的局限性,具有极强的自适应性;能有效解决方块效应和蚊式噪声;能揭示派生信息里的趋势、断开点、非连续性以及自相似等。,3.1 信号处理的基本术语,3.1.4 小波变换小波:在有限周期内的不规则且不对称的波形,其平均值为0。小波分析:将原始信号分解为滑动的与母系小波成比例的各种子波。与傅立叶变换的区别

4、:傅立叶分析得到的是各种频率的正弦波的组合,其正弦波没有限定的周期,是平滑且可以预知的。小波变换也分为连续小波变换和离散小波变换。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念从人的视觉系统来看,色彩可以用色调、饱和度和亮度来描述。色调:由物体表面反射的光线中什么波长的光波占优势决定。可见光谱上不同颜色光波长如下(单位为纳米):红:760610橙:610590黄:590570绿:570500青:500460蓝:460440紫:440400,3.2 图象数据压缩基础,3.2.1 色彩的基本概念亮度:物体表面的光线反射系数。在照射到物体表面的光线强度相等情况下,物体表面反射系数越大,其亮度

5、越大。某种颜色越接近白色,亮度越大。其由大到小顺次为:黄、橙、绿、红、蓝、紫。饱和度:颜色色调的表现程度。某种色调离开白色或灰色越远,其饱和度越大,色彩越艳丽,越鲜明突出,越能发挥其色彩的固有特性。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念图象深度:数字化位图中记录每个象素点所占的二进制位数,它决定彩色图象中可出现的最多颜色数,或者灰度图象中最大灰度等级数。在RGB色彩空间里,图象深度与色彩的映射关系主要有真彩色、伪彩色和调配色。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念真彩色(true color):图象中的每个像素值都分成R、G、B三基色分量,每个基色分量直接决定其

6、基色的强度。计算机表示颜色也是用二进制。16位色的发色总数是65536色,也就是2的16次方;24位色被称为真彩色,它可以达到人眼分辨的极限,发色数是1677万多色,也就是2的24次方。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念但32位色就并非是2的32次方的发色数,它其实也是1677万多色,不过它增加了256阶颜色的灰度,为了方便称呼,就规定它为32位色。少量显卡能达到36位色,它是24位发色数再加512阶颜色灰度。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念至于对于32位色和16位色,肉眼能否分辨出来?其实如果你用两台品牌型号都一样的显示器,分别调不同的色,就能看出区

7、别,而如果只是一台机的反复转换就比较难分辨出来。WINDOWS XP启动时有个“欢迎使用”字样的界面,那里的兰色颜色过度就很容易看出区别,16位色的颜色过度很容易看出被分层了,不自然;而用32位色就相当柔和,过度很自然。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念真彩色图像是一种用三个或更多字节描述像素的计算机图像存储方式。图像每一色光以8位元表示,每个通道各有256(28)种阶调,三色光交互增减,RGB三色光能在一个像素上最高显示24位1677万色(256*256*256=16,777,216),这个数值就是电脑所能表示的最高色彩。普遍认为人眼对色彩的分辨能力大致是一千万色,因此由

8、RGB形成的图像均称做真彩色。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念真彩色图像还包含一个阿尔法通道(透明度通道)。因为有了Alpha通道,在屏幕上描绘半透明图像变得简单了,(这往往是对绘图硬件加速设备的要求)在电脑桌面上能更为轻而易举地实现半透明窗口、菜单渐隐和阴影等效果。虽然阿尔法通道对于显示缓冲来说没有意义,但是在现实系统中仍然使用着 32 位真彩色,这是因为在 32 位的位图中对于像素的寻址更加容易。对 24 位像素寻址需要乘以 3,这样比通过移位就可以实现的乘以 4 的计算量更大。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念伪彩色(pseudo color):

9、每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表(color look-up table,CLUT)的表项入口地址,去查找一个显示图像时使用的R,G,B强度值,用查找出的R,G,B强度值产生的彩色称为伪彩色。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念 彩色查找表CLUT是一个事先做好的表,表项入口地址也称为索引号。例如16种颜色的查找表,0号索引对应黑色,.,15号索引对应白色。彩色图像本身的像素数值和彩色查找表的索引号有一个变换关系,这个关系可以使用Windows 95/98定义的变换关系,也可以使用你自己定义的变换关系。使用查找得到的数值显示的彩色是真

10、的,但不是图像本身真正的颜色,它没有完全反映原图的彩色。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念调配色(direct-color):每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。它的特点是对每个基色进行变换。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念 用这种系统产生颜色与真彩色系统相比,相同之处是都采用R,G,B分量决定基色强度,不同之处是前者的基色强度直接用R,G,B决定,而后者的基色强度由R,G,B经变换后决定。因而这两种系统产生的颜色就有差别。试验结果

11、表明,使用直接色在显示器上显示的彩色图像看起来真实、很自然。这种系统与伪彩色系统相比,相同之处是都采用查找表,不同之处是前者对R,G,B分量分别进行变换,后者是把整个像素当作查找表的索引值进行彩色变换。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念真彩色 好于 调配色 好于 伪彩色图象深度与显示深度关系:A 显示深度大于图象深度,屏幕色彩能真实反映图象色彩;B 显示深度等于图象深度,屏幕色彩基本真实反映图象色彩;B 显示深度小于图象深度,屏幕色彩不能真实反映图象色彩;,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换RGB颜色模式RGB颜色模式是工业界的一种颜色标准,通过对红(R

12、),绿(G),蓝(B)3个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色。RGB即代表红,绿,蓝3个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是目前运用最为广泛的颜色系统之一。电视机和计算机的监视器都是基于这种颜色模式。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换2 Lab颜色模式Lab模式是由国际照明委员会(CIE)于1976年公布的一种色彩模式。是CIE组织确定的一个理论上包括了人眼可见的所有色彩的色彩模式。Photoshop处理图像的内部色彩转换就是采用模式。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换2 Lab颜色模式Lab模式由三个通

13、道组成:第一个通道是明度,即“L”。a通道的颜色是从红色到深绿;b通道则是从蓝色到黄色。明度的变化是0到100,两个分量(a、b)的变化都是从-128到+127。当a=0、b=0时显示灰色,同时L=100时为白色,L=0时为黑色。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换2 Lab颜色模式,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换2 Lab颜色模式Lab模式所定义的色彩最多,且与光线及设备无关并且处理速度与RGB模式同样快,比CMYK模式快很多。Lab模式弥补了RGB和CMYK两种色彩模式的不足。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换3 CMYK颜

14、色模式CMYK色彩模式是一种专门针对印刷业设定的颜色标准,是通过对青(Cyan)、洋红(Mageata)、黄(Yellow)、黑(blacK)四个颜色变化以及它们相互之间的叠加来得到各种颜色的,CMYK即是代表青、洋红、黄、黑四种印刷专用的油墨颜色,具体到印刷上,是通过控制青、洋红、黄、黑四色油墨在纸张上的相叠印刷来产生色彩的,它的颜色种数少于RGB色。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换3 CMYK颜色模式理想状态下,由100%的青,100%的品和100%的黄混合可以形成全黑色,但由于油墨有杂质等原因,实际应用效果不太理想,黑色不黑,而是深棕色,所以又增加了一个黑色通道K

15、来代替三种颜色,当K=100%时,其它三色就不起作用了,这样效果又好又能省油墨。RGB是通过自身发光来呈现色彩,而CMYK则是通过墨点反射光来呈现色彩。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换3 CMYK颜色模式大致上说:在表达色彩范围上,最全的是Lab模式,其次是RGB模式,最窄的是CMYK模式。也就是说Lab模式所定义的色彩最多,且与光线及设备无关。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换3 CMYK颜色模式以色彩为起点,通过从色彩丰富模式到简单模式的转换:,左:模式左:LAB到模式左3:到模式 右:到CMYK模式,3.2 图象数据压缩基础,3.2.2 彩色

16、空间及其变换4 HSB颜色模式HSB模式是基于人类感觉颜色的方式建立起来的,对于人的眼睛来说,能分辨出来的是颜色种类、饱和度和强度,而不是RGB模式中各基色所占的比例。HSB颜色就是根据人类对颜色分辨的直观方法,将自然界的颜色看作由色相(Hue)、饱和度(Saturation)、明亮度(Brightness)组成。色相指的是由不同波长给出的不同颜色区别特征,如红色和绿色具有不同的色相值;饱和度指颜色的深浅,即单个色素的相对纯度,如红色可以分为深红、洋红、浅红等;明亮度用来表示颜色的强度,它描述的是物体反射光线的数量与吸收光线数量的比值。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换5

17、 YUV颜色模式在现代彩色电视系统中,通常采用三管彩色摄像机或彩色CCD(点耦合器件)摄像机,它把摄得的彩色图像 信号,经分色、分别放大校正得到RGB,再经过矩阵变换电路得到亮度信号Y和两个色差信号RY、BY,最后发送端将亮度和色差三个信号分别进行编码,用同一信道发送出去。这就是我们常用的YUV色彩空间。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换5 YUV颜色模式采用YUV色彩空间的重要性是它的亮度信号Y和色度信号U、V是分离的。如果只有Y信号分量而没有U、V分量,那么这样表示的图就是黑白灰度图。彩色电视采用YUV空间正是为了用亮度信号Y解决彩色电视机与黑白电视机 的兼容问题,使

18、黑白电视机也能接收彩色信号。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换5 YUV颜色模式根据美国国家电视制式委员会(NTSC)制式的标准,当白光的 亮度用Y来表示时,它和红、绿、蓝三色光的关系可用如下式的方程描述:Y=0.3R+0.59G+0.11B 这就是常用 的亮度公式。色差U、V是由BY、RY按不同比例压缩而成的。如果要由YUV空间转化成RGB空间,只要进行 相反的逆运算即可。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换各颜色模式应用领域CMYK-印刷业 RGB-crt类监视器 HSB-传统技术工作的画家或设计者YUV Dvd、电视类输入分量,3.2 图象数据压

19、缩基础,3.2.3 图象数据压缩的可能性多媒体数据能被压缩的前提是数据存在冗余,冗余有如下类型:1 统计冗余:对于一串由许多数值构成的数据来说,如果其中某些值经常出现,而另外一些值很少出现,则这种由取值上的统计不均匀性就构成了统计冗余度,可以对之进行压缩。,3.2 图象数据压缩基础,3.2.3 图象数据压缩的可能性冗余有如下类型:2 空间和时间冗余:一幅视频图像相邻各点的取值往往相近或相同,具有空间相关性,这就是空间冗余度。图像的空间相关性表示相邻象素点取值变化缓慢。从频域的观点看,意味着图像信号的能量主要集中在低频附近,高频信号的能量随频率的增加而迅速衰减。时间冗余度表现在电视画面中相继各帧

20、对应象素点的值往往相近或相同,具有时间相关性。在知道了一个象素点的值后,利用此象素点的值及其与后一象素点的值的差值就可求出后一象素点的值。,3.2 图象数据压缩基础,3.2.3 图象数据压缩的可能性冗余有如下类型:3 信息熵冗余:也称编码冗余,如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余(来源于等长度编码)。4 结构冗余:是指图像中存在很强的纹理结构或自相似性。5 知识冗余:是指在有些图像中还包含与某些先验知识有关的信息。,3.2 图象数据压缩基础,3.2.3 图象数据压缩的可能性冗余有如下类型:6 视觉冗余:视觉冗余度是相对于人眼的视觉特性而言的。人眼对于图像的视觉

21、特性包括:对亮度信号比对色度信号敏感,对低频信号比对高频信号敏感,对静止图像比对运动图像敏感,以及对图像水平线条和垂直线条比对斜线敏感等。因此,包含在色度信号,图像高频信号和运动图像中的一些数据并不能对增加图像相对于人眼的清晰度作出贡献,而被认为是多余的,这就是视觉冗余度。,3.3 图象数据压缩算法,评价压缩算法的指标:1 压缩比:压缩编码后的数据量与原始数据大小的比值2 算法的复杂性和运算速度3 失真度数据编码类型:1 无损编码:解码后的数据与编码前的数据完全一致。2 有损编码:解码后的数据与编码前的数据有一定程度的偏差,但不影响其效果。,3.3 图象数据压缩算法,3.3.1 信息熵编码信息

22、熵编码是纯粹基于信号统计特性的编码技术,是一种无损压缩。熵编码的基本原理是给概率较大的符号赋予一个短码字,而给概率较小的赋予一个长码字,从而使得最终的平均码长很小。信息熵编码具体形式包括以下几种:,3.3 图象数据压缩算法,3.3.1 信息熵编码1 行程长度编码(Run Length Encoding):是Windows 系统中使用的一种图像文件压缩方法,其基本思想是:将一扫描行中颜色值相同的相邻像素用两个字节来表示,第一个字节是一个计数值,用于指定像素重复的次数;第二个字节是具体像素的值。主要通过压缩除掉数据中的冗余字节或字节中的冗余位,从而达到减少文件所占空间的目的。例如,有一表示颜色像素

23、值的字符串RRRRRGGBBBBBB,用 RLE 压缩方法压缩后可用 5R2G6B 来代替,显然后者的串长度比前者的串长度小得多。译码时按照与编码时采用的相同规则进行,还原后得到的数据与压缩前的数据完全相同。因此,RLE 是无损压缩技术。,3.3 图象数据压缩算法,3.3.1 信息熵编码行程长度编码特点:RLE所能获得的压缩比有多大,这主要是取决于图像本身的特点。如果图像中具有相同颜色的图像块越大,图像块数目越少,获得的压缩比就越高。反之,RLE对颜色丰富的自然图像就显得力不从心,在同一行上具有相同颜色的连续像素往往很少,而连续几行都具有相同颜色值的连续行数就更少。如果仍然使用RLE编码方法,

24、不仅不能压缩图像数据,反而可能使原来的图像数据变得更大。因此,具体实现时,需要和其它的压缩编码技术联合应用。,3.3 图象数据压缩算法,3.3.1 信息熵编码2 哈夫曼编码(Huffman Ecoding):是一种一致性编码法(又称熵编码法),用于数据的无损耗压缩。这一术语是指使用一张特殊的编码表将源字符(例如某文件中的一个符号)进行编码。这张编码表的特殊之处在于,它是根据每一个源字符出现的估算概率而建立起来的(出现概率高的字符使用较短的编码,反之出现概率低的则使用较长的编码,这便使编码之后的字符串的平均期望长度降低,从而达到无损压缩数据的目的)。这种方法是由发展起来的。,3.3 图象数据压缩

25、算法,3.3.1 信息熵编码2 哈夫曼编码(Huffman Ecoding)例如,在英文中,e的出现概率很高,而z的出现概率则最低。当利用哈夫曼编码对一篇英文进行压缩时,e极有可能用一个位(bit)来表示,而z则可能花去25个位(不是26)。用普通的表示方法时,每个英文字母均占用一个字节(byte),即8个位。二者相比,e使用了一般编码的1/8的长度,z则使用了3倍多。倘若我们能实现对于英文中各个字母出现概率的较准确的估算,就可以大幅度提高无损压缩的比例。,3.3 图象数据压缩算法,3.3.1 信息熵编码2 哈夫曼编码(Huffman Ecoding)哈夫曼编码的具体步骤归纳如下:概率统计(如

26、对一幅图像,或m幅同种类型图像作灰度信号统计),得到n个不同概率的信息符号。将n个信源信息符号的n个概率,按概率大小排序。将n个概率中,最后两个小概率相加,这时概率个数减为n-1个。将n-1个概率,按大小重新排序。重复,将新排序后的最后两个小概率再相加,相加和与其余概率再排序。如此反复重复n-2次,得到只剩两个概率序列。以二进制码元(0.1)赋值,构成哈夫曼码字。编码结束。,3.3 图象数据压缩算法,3.3.1 信息熵编码2 哈夫曼编码(Huffman Ecoding):其不足点:A 需要精确统计出原始文件中每个值出现的频率,造成编码和解码过程慢。B 对数位的增删敏感,因此增加或减少一个数位会

27、使译码结果面目全非。,3.3 图象数据压缩算法,3.3.1 信息熵编码3 算术编码:基本思路是将被编码的信息表示成0和1之间的间隔(interval)。其特点:A 信源符号的出现概率比较接近时,算术编码的效率比哈夫曼编码的高。B 其实现过程比哈夫曼编码复杂。C 按照分数比特逼近熵,哈夫曼编码是按照整数比特逼近熵;算术编码可以有效地从模型中分离出来,哈夫曼编码是与统计模型强相关的。,3.3 图象数据压缩算法,3.3.2 词典编码第一类词典编码的思路是,查找正被压缩的字符系列是否在以前输入的数据中出现过,用已经出现过的字符串代替重复的部分,它的输出是指向早期出现过的字符串的“指针”。典型算法是LZ

28、77,LZSS。第二类词典编码的思路是,从输入的数据里创建一个“短语词典”,编码过程中遇到在词典中存在的“短语”时,编码器输出该“短语”在词典中的索引号。典型算法是LZW。LZW算法特点:A 通用性好,性能优良,压缩效率高。B 算法是可逆的。,3.3 图象数据压缩算法,3.3.3 预测编码图象中局部区域像素通常是高度相关的,可以用先前像素的有关灰度知识对当前像素的灰度进行估计,即预测。有线性预测编码和非线性预测编码,前者又称为差分脉冲编码调制(DPCM:Differential Pulse Code Modulation),图象中的每个像素可以通过与之相关的几个像素来进行预测。预测编码特点:A

29、 实现简单,编码质量高。B 压缩比不高,预测精度依赖于图象特性的大量先验知识,需要进行大量非线性运算。一般与其他方法结合使用。,3.3 图象数据压缩算法,3.3.4 变换编码它是将时域信号变换到频域信号进行处理的编码方式。其典型的有K-L变换编码(Karhun-Loeve)和离散余弦变换(Discrete Cosine Transform,DCT)编码。K-L变换编码压缩比高于离散余弦变换编码,但运算量大,无快速算法。离散余弦变换编码计算复杂度适中,有快速算法。,3.3 图象数据压缩算法,3.3.5 模型编码它是将图象信号看成是三维世界中的目标和景物投影到二维平面的产物,对其评价结果决定于人类

30、视觉系统的特性。它对特定的图象建立模型,由模型确定图象中景物的特征参数。解码时根据参数和已知模型使用图象合成技术重建图象。模型编码引入的误差主要是人眼视觉不太敏感的几何失真,因此重建的图象非常自然和逼真。,3.4 常用图形、图象文件,矢量图:用数学方式描述的一系列点、线弧和其他几何形状,存放这种图使用的格式为矢量图格式,存储的数据主要是绘制图形的数学描述。位映像图:也叫光栅图(raster graphics)由像素组成,存储格式称为位图格式。存放的数据是描述像素的数值。,3.4 常用图形、图象文件,3.4 常用图形、图象文件,3.4.1 BMP(Bitmap-File)文件格式:Windows

31、采用的图象文件存储格式,默认文件扩展名为bmp或BMP。BMP图象文件包括文件头数据结构、位图信息数据结构和位图阵列3部分。,3.4 常用图形、图象文件,3.4.2 GIF文件格式:Graphics Interchange Format是CompuServe公司开发的图象文件存储格式,默认文件扩展名为gif或GIF。GIF图象文件以数据块为单位存储图象的相关信息。GIF文件采用LZW压缩算法存储图象数据,可以在一个文件中存放多幅彩色图象,象演幻灯片那样显示或象动画那样演示。,3.4 常用图形、图象文件,3.4.3 PNG文件格式:Portable Network Graphics(便携网络图形

32、)是一种类似GIF、JPEG和TIFF的位图图象压缩存储格式,使用从LZ77派生的无损数据压缩算法,默认文件扩展名为png或PNG。使用PNG文件格式是为了代替GIF和TIFF文件格式,同时增加一些GIF文件格式不具备的特性。它有以下优点:A 兼有GIF和JPEG的色彩模式,能存储256色以下的索引色彩图象和24位真彩色,最高可存储48位彩色图象。B 图象压缩到极限以利于网络传输,却能保留所有与图象品质有关的信息。C 采用高速交替显示方案,显示速度快。D 提供图象alpha通道的0255级透明,可以使图象的透明区域出现深度不同的层次。E 跨平台显示不失真。,3.4 常用图形、图象文件,3.4.

33、3 PNG文件格式:PNG文件格式缺点:A 和GIF相比,只能存储单张图片。B 不支持CMYK颜色模式,在印刷时需要转换到RGB颜色模式。,3.4 常用图形、图象文件,实例演示SVG(Scalable Vector Graphics)矢量图形SVG的特别之处:SVG真正的用途不是画几个简单的图画或几个动画,最诱人的地方是可以动态访问,也就是可以跟变化的数据动起来,再加上简洁的格式,矢量图形独有的无级无损缩放,精简的空间占用,与XML完美的结合,真正体现它的实用性,SVG有可能是将来网页所有图画的替代品。,3.5 静态图象压缩标准,3.5.1 JPEGJPEG是国际标准化组织(ISO)和国际电报

34、电话咨询委员会(CCITT)关于静止图象编码联合专家组(Joint Photographics Experts Group)名称的缩写。,3.5 静态图象压缩标准,3.5.1 JPEG JPEG已开发三个图像标准。第一个直接称为JPEG标准,正式名称叫“连续色调静止图像的数字压缩编码”(Digital Compression and Coding of Continuous-tone still Images),1992年正式通过。JPEG开发的第二个标准是JPEG-LS(ISO/IEC 14495,1999)。JPEG-LS仍然是静止图像无损编码,能提供接近有损压缩压缩率。JPEG 的最新标

35、准是JPEG 2000(ISO/IEC 15444,等同的ITU-T编号T.800),于1999年3月形成工作草案,2000年底成为正式标准(第一部分)。根据JPEG专家组的目标,该标准将不仅能提高对图像的压缩质量,尤其是低码率时的压缩质量,而且还将得到许多新功能,包括根据图像质量,视觉感受和分辨率进行渐进传输,对码流的随机存取和处理,开放结构,向下兼容等。,3.5 静态图象压缩标准,3.5.1 JPEG JPEG标准制定了四种工作模式:(1)顺序的基于DCT(Sequential DCT-based)模式,由DCT(离散余弦变换)系数的形成、量化和熵编码三步组成。从左到右,从上到下扫描信号,

36、为每个图像编码。(2)累进的基于DCT(Progressive DCT-based)模式,生成DCT系数和量化中的关键步骤与基本顺序编码解码器相同。主要的区别在于每个图像部件由多次扫描进行编码而不是仅一次扫描。每次继续的扫描都对图像作了改善,直到达到由量化表建立的图像质量为止。,3.5 静态图象压缩标准,3.5.1 JPEG JPEG标准制定了四种工作模式:(3)无损(Lossless)模式,独立于DCT处理,用来定义一种达到无损连续色调压缩的手段。预测器将采样区域组合起来并基于采样区域预测出邻系统区域。预测出的区域对照着每一区域的完全无损采样进行预测,同时通过Huffman 编码法或算术熵编

37、码法对这一差别进行无损编码,对较好质量的复制通常可达到2:1的压缩率。(4)分层(Hierarchical)模式,分层模式提供了一种可实现多种分辨率的手段。每个接续层次上的图像编码在水平或垂直方向上的分辨率都被降低二倍。它所传送的数据包括所支持的最低分辨率图像,以及用于解码恢复到原有的全分辨率图像所需的、分辨率以2的倍数递降的相邻图像的差分信息。,3.5 静态图象压缩标准,3.5.1 JPEG JPEG算法的平均压缩比为15:1。当压缩比大于50倍时将可能出现方块效应。JPEG的性能,用质量与比特率之比来衡量,是相当优越的,尤其是它的复杂度之低和使用时间之长,更是给人以深刻的印象。,3.5 静

38、态图象压缩标准,3.5.1 JPEG JPEG编码处理过程如下:,3.5 静态图象压缩标准,3.5.1 JPEGJPEG的基本系统A 通过DCT减少图象数据的相关性。B 利用人眼视觉特性对系数进行自适应量化。C 对每个子块量化后的系数矩阵进行Z形扫描,将系数矩阵变换成符号系列。D 用哈夫曼变长码对符号进行熵编码,3.5 静态图象压缩标准,3.5.1 JPEG2 变换压缩的物理本质A 多位坐标系适当的旋转与变换。B 散布在各坐标轴上的变化幅度较大的数据,在新的坐标系中,集中在几个少数的坐标轴上。C 对变化较小、对图像显示、视觉影响不大的轴上的分量分配较少的编码位。,3.5 静态图象压缩标准,3.

39、5.1 JPEG3 变换系数的量化量化:从集合论的角度多对一的映射 为提高压缩效率,希望把系数的幅值缩小Fq(u,v)=integer round(F(u,v)/Q(u,v)对于不同位置的系数,取不同的Q(u,v)(1)对于低频的系数F(u,v),即u+v较小者,Q(u,v)较小,即幅值缩小的倍数较小。(2)通过心理视觉试验,对视觉效果影响不大的信息尽量丢掉(3)高频部分有较多的0值,即Fq(u,v)为零,3.5 静态图象压缩标准,3.5.1 JPEG4 熵编码huffman编码 JPEG建议中用Huffman 或自适应二进制算术编码。基本系统中用Huffman编码 对出现频率较高的符号,设计

40、较短的码字。反之,用较长的码字。Huffman 编码表事先定义好。对DC,AC 的Huffman编码方法不同,3.5 静态图象压缩标准,3.5.2 JPEG 2000 JPEG 2000 与传统 JPEG 最大的不同,在于它放弃了 JPEG 所采用的以离散余弦变换(Discrete Cosine Transform)为主的区块编码方式,而改采以小波转换(Wavelet transform)为主的多解析编码方式。小波变换的主要目的是要将影像的频率成分抽取出来。,3.5 静态图象压缩标准,3.5.2 JPEG 20001 技术要点 余弦变换是经典的谱分析工具,它考察的是整个时域过程的频域特征或整个

41、频域过程的时域特征,因此对于平稳过程,它有很好的效果,但对于非平稳过程,它却有诸多不足。在JPEG中,离散余弦变换将图像压缩为88 的小块,然后依次放入文件中,这种算法靠丢弃频率信息实现压缩,因而图像的压缩率越高,频率信息被丢弃的越多。在极端情况下,JPEG图像只保留了反映图像外貌的基本信息,精细的图像细节都损失了。,3.5 静态图象压缩标准,3.5.2 JPEG 2000 小波变换是现代谱分析工具,它既能考察局部时域过程的频域特征,又能考察局部频域过程的时域特征,因此即使对于非平稳过程,处理起来也得心应手。它能将图像变换为一系列小波系数,这些系数可以被高效压缩和存储,此外,小波的粗略边缘可以

42、更好地表现图像,因为它消除了DCT压缩普遍具有的方块效应。,3.5 静态图象压缩标准,3.5.2 JPEG 2000主要动作一个经典的JPEG2000编码运算法则包含三个部分:小波变换、画布坐标系统、EBCOT(EmbeddedBlockCodingwithOptimizedTruncation)编码。由DavidTaubman提出的EBCOT算法是一种非常有效的小波系数编码方法,它从本质上说仍然是一种位平面编码,但是它吸收了图像编码算法发展的一些成果,因此性能非常出色,成为JPEG2000中的核心算法。,3.5 静态图象压缩标准,3.5.2 JPEG 20003 JPEG2000的优点(1)

43、、JPEG2000 作为JPEG升级版,高压缩(低比特速率)是其目标,其压缩率比 JPEG 高约 30%左右。(2)、JPEG2000 同时支持有损和无损压缩,而 JPEG 只能支持有损压缩。无损压缩对保存一些重要图片十分有用。,3.5 静态图象压缩标准,3.5.2 JPEG 20003 JPEG2000的优点(3)、JPEG2000 能实现渐进传输,这是JPEG2000的一个极其重要的特征。也就是我们对 GIF 格式影像常说的“渐现”特性。它先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图象由朦胧到清晰显示,而不必是像现在的 JPEG 一样,由上到下慢慢显示。(4)、JPEG200

44、0 支持所谓的“感兴趣区域”特性,你可以任意指定影像上你感兴趣区域的压缩质量,还可以选择指定的部份先解压缩。这样我们就可以很方便的突出重点了。,3.5 静态图象压缩标准,3.5.2 JPEG 2000 对比效果图片 Jpeg jpeg2000,3.5 静态图象压缩标准,3.5.2 JPEG 20004 JPEG2000的应用 JPEG 2000的应用领域可概略分成两部分,一为传统JPEG的市场,像印表机,扫描器,数码相机等,一为新兴应用领域,像网路传输,无线通讯,医疗影像等。目前对 JPEG 2000 热情最大的当然就是那些数字照相机厂商。JPEG 2000 和 JPEG 相比优势明显,且向下

45、兼容,因此取代传统的JPEG格式指日可待。,3.6 动态图象压缩标准,3.6.1 MPEG标准,3.6 动态图象压缩标准,3.6.2 MPEG-1标准 MPEG-1标准于1993年8月公布,用于传输1.5Mbps数据传输率的数字存储媒体运动图像及其伴音的编码。该标准包括五个部分:第一部分说明了如何根据第二部分(视频)以及第三部分(音频)的规定,对音频和视频进行复合编码。第四部分说明了检验解码器或编码器的输出比特流符合前三部分规定的过程。第五部分是一个用完整的C语言实现的编码和解码器。,3.6 动态图象压缩标准,3.6.2 MPEG-1标准MPEG-1的基本目标 在音像质量上,达到VHS/VCD

46、的放像质量 在存储上,可存储在光盘、数字录音带、硬盘等 在传输码流上,为1-1.5Mbps,以1.2Mbps为宜 在网络方面,应适应LAN、ISDN等多种网络 满足对称和不对称应用,3.6 动态图象压缩标准,3.6.2 MPEG-1标准MPEG-1的基本内容 规定电视图象数据、声音数据及其他相关数据的同步。规定电视图象数据的编码和解码 规定电视声音数据的编码和解码 规定一致性测试,说明如何测试数据流和解释器符合前述规定 软件模拟,3.6 动态图象压缩标准,3.6.2 MPEG-1标准:压缩模式 MPEG图像压缩的原理是利用了图像中的两种特性:空间相关性和时间相关性。这两种相关性使得图像中存在大

47、量的冗余信息。如果我们能将这些冗余信息去除,只保留少量非相关信息进行传输,就可以大大节省传输频带。而接收机利用这些非相关信息,按照一定的解码算法,可以在保证一定的图像质量的前提下恢复原始图像。一个好的压缩编码方案就是能够最大限度地去除图像中的冗余信息。,3.6 动态图象压缩标准,3.6.2 MPEG-1标准 MPEG图像编码包含3个成分:I帧,P帧和B帧。MPEG编码过程中,一些图像压缩成I帧,一些压缩成P帧,另一些压缩成B帧。I帧压缩可以得到6;1的压缩比而不产生任何可觉察的模糊现象。I帧压缩的同时使用P帧压缩,可以达到更高的压缩比而无可觉察的模糊现象。B帧压缩可以达到200:1的压缩比,其

48、文件尺寸一般为I帧压缩尺寸的15%,不到P帧压缩尺寸的一半。,3.6 动态图象压缩标准,3.6.2 MPEG-1标准 I帧压缩去掉图像的空间冗余度,P帧和B帧去掉时间冗余度。I帧压缩采用基准帧模式,只提供帧内压缩,即把图像压缩到I帧时,仅仅考虑了帧内的图像。I帧压缩不能除去帧间冗余度。帧内压缩基于离散余弦变换(DCT),类似于JPEG和H.261图像中使用DCT的压缩标准。,3.6 动态图象压缩标准,3.6.2 MPEG-1标准 P帧采用预测编码,利用相邻帧的一般统计信息进行预测。也就是说,它考虑运动特性,提供帧间编码。P帧预测当前帧与前面最近的I帧或P帧的差别。B帧为双向帧间编码。它从前面和

49、后面的I帧或P帧中提取数据。B帧基于当前帧与前一帧和后一帧图像之间的差别进行压缩。,3.6 动态图象压缩标准,3.6.2 MPEG-1标准 MPEG缩减空间冗余度使用与静态图片压缩类似的方法,混合运用变换编码、基于视觉加权的标量量化和行程编码技术。整个过程包括3个阶段:1 基于DCT的正交变换2 对变换系数进行量化,然后按Z形扫描顺序重新组合;3 对系数按行程进行熵编码。,3.6 动态图象压缩标准,3.6.3 MPEG-2标准 MPEG-2是MPEG-1 的扩展。主要内容为:码率为4-9Mbps,最大15Mbps 涵盖MPEG-1全部内容 规定数字存储媒体命令和控制扩展协议,用于管理数据流(D

50、SM-CC)先进的声音编码方案 规定系统解码器实时接口扩展标准,用来适应网络传输 DSM-CC一致性扩展测试 先进声音编码标准修正,3.6 动态图象压缩标准,3.6.3 MPEG-2标准 MPEG-2的标准涉及到如下部分:系统 视频 音频 符合性测试 软件 数字存储媒体的指令和控制 非向后兼容的音频 比特视频和视频接口,3.6 动态图象压缩标准,3.6.4 MPEG-4标准 现代移动通讯和个人通讯业务要求从普通话音扩展到多媒体业务,即提供声音、文字、数据、图形和视频等信息媒体,使用户在移动通讯网络中进行互动信息交流,其中关键技术在于甚低码流音视频压缩。这就是MPEG-4产生的背景。,3.6 动

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号