《图像压缩研究背景意义及现状.doc》由会员分享,可在线阅读,更多相关《图像压缩研究背景意义及现状.doc(4页珍藏版)》请在三一办公上搜索。
1、图像压缩研究背景意义及现状1图像压缩的可能性与必要性2图像压缩方法的分类3静止图像压缩的发展历史与现状4图像压缩的基本原理 图像是对客观事物的一种相似性的、生动的描述,是对客观对像的一种比较直观的表示方式。它包含了被描述对像的有关信息,是人们最主要的信息源。据统计,一个人获得的信息大约有75%来自视觉。进入信息化时代人们将越来越依靠计算机获取和利用信息,而数字化后的多煤体信息具有数据海量性,与当前硬件技术所能提供的计算机存储资源和网络带宽之间有很大的差距。这样,就对信息的存储和传输造成了很大困难,成为阻碍人们有效获取和利用信息的一个瓶颈问题。图像信息作为计算机上最重要的资源,对其进行有效的压缩
2、处理无疑将会给人们带来巨大的好处。静止图像压缩不但是各种动态图像压缩、传输的基础,而且还是影响其效果好坏的重要因素。1图像压缩的可能性与必要性图像数字化后的数据量是很大的,例如,一幅1024*768的24位BMP图像,其数据量约为2.25MB。大数据量的图像信息会给存储器的存储容量,通信干线信道的带宽,以及计算机的处理速度增加极大的压力。单纯靠增加存储器容量,提高信道带宽以及计算机的处理速度等方法来解决这个问题是不现实的,这时就要考虑压缩。数字图像的冗余主要表现在以下几种形式:(1) 空间冗余。在一幅图像中,规则物体和规则背景(所谓规则就是指表面有序而不是完全杂乱无章的排列)等所具有的相关性,
3、应用一些算法提取并减少这些图像素之间的相关性就可以达到数据压缩的目的。(2) 时间冗余。指序列图像(电视图像,运动图像)所包含的相邻图像之间的相关性。(3) 结构冗余。有些图像有着非常强的纹理结构(如草席的图案)或自相似性,称之为结构上的冗余。(4) 信息熵冗余。如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像存在冗余,这种冗余称为信息熵冗余。(5) 视觉冗余。人眼接收信息的能力是有限的,对图像的分辨率也是有限的。去掉或减少人眼不能感知或不敏感的那部份图像信息,从而达到压缩的目的。(6) 知识冗余。指有些图像中包含与先验知识有关的信息,如人脸的固定结构。图像数据的这些冗余信息为图像
4、压缩编码提供了依据。因此针对图像的特点对其数据进行压缩编码,以提高储存、传输和处理速度,节省存储空间。数字图像压缩的主要问题就是数据冗余。这并非一个抽象的概念,在数学上我们也可以对其进行量化。用和表示两个具有相同信息的数据集合中所携载信息单元的数量,则第一个数据集合(表示的集合)的相对数据冗余可以定义为: (1)这里通常称为压缩率,定义为: (2)对于=的情况,=1, =0表示(相对于第二个数据集合)信息的第一种表达方式不包含冗余数据。当时,表示第二个集合中含有的数据大大超过原表示方式的数据量。2图像压缩方法的分类图像压缩编码的方法很多,可以从多种方式对其进行分类。根据编码过程中是否存在信息的
5、损耗可以将图像编码分为有损压缩编码和无损压缩编码。无损压缩编码无信息损失,解压时可以从压缩数据精确地恢复到原始图像;有损压缩编码则有信息丢失不能完全恢复原始图像,存在一定程度失真。根据编码原理可以将传统的图像编码分为熵编码、预测编码、变换编码和混合编码等。(1)熵编码:熵编码是纯粹基于信号统计特性的编码技术,是一种无损的编码。熵编码的基本原理是给出概率较大的符号赋予的一个短码字,而给出现概率较小的符号赋予一个长码字,从而使得最终的平均码长很小。常见的熵编码有行程编码、哈夫曼编码和算术编码。(2)预测编码:预测编码是基于图像数据空间或时间冗余特性,用相邻的已知像素(或像素块)来预测当前像素(或像
6、素块)的取值,然后再对预测误差进行量化和编码。预测编码可分为帧内预测和帧间预测,常用的预测编码有差分脉码调制和运动补偿法。(3)变换编码:变换编码通常是将空间域上的图像经过正交变换映射到另一变换域上,使变换后的系数之间的相关性降低。图像变换本身不能压缩数据,但变换后图像的大部分能量只集中到少数几个变换上,采用适当的量化和熵编码就可以有效地压缩图像。(4)混合编码:混合编码是指综合了熵编码、预测编码或变换编码的编码方法。如JPEG标准和MPEG标准。除了以上介绍的几种编码外,随着图像编码技术的不断发展,一些新颖的压缩方法也已经被人们提出来并应用到实际的操作中。如,利用人工神经网络(ANN)的压缩
7、编码,基于对像的压缩编码(Object Based Coding)、基于模型的压缩编码(Model Based Coding)和分形编码(Fractal Coding)。3静止图像压缩的发展历史与现状图像压缩编码技术可以追溯到1984年提出的电视信号数字,到今天已经有60年的历史了。 Kunt提出了第一代数据压缩编码的概念,他把20世纪40年代中研究的以去除冗余为基础的编码方法称为第一代编码。如PCM、DPCM、亚取样编码法、变换编码法等。直至五十年代和六十年代,图像压缩技术仅仅停留在预测编码、亚采样以及内插复原等技术的研究上,而且还很不成熟.A. Huffman于1952年第一次发表了他的论
8、文“最小冗余度代码的构造方法”,从此,数据压缩开始在商业程序中实现并被应用在许多技术领域。第二代数据压缩编码从20世纪90年代开始,数学家们因为不满足于Huffman编码中的某些致命弱点,设计出另一种更为精确,更能接近信息论中“熵”极限的编码方法算术编码。在算术编码的基础上又发展了变换编码,如金字塔编码法,Fractal编码。其中最具代表性的是LZ77和LZ78,经基于这一思路的编码放大称作“字典”式编码。字典式编码不但在压缩效果上大大超过了Huffman,而且易于实现,其压缩与解压缩的速度也异常惊人。1984年,LZ78算法的一个变种LZW(Lewpel-Ziv&Welch,无损压缩算法)产
9、生了。LZW继承了LZ77和LZ78压缩效果好,速度快的优势,而且在算法描述上更容易被人们接受。70年代末和80年代初,人们逐渐意识到对于很多灰度或彩色图像、乃至声音文件,均未忠实地保留其所有信息,在允许一定的精度损失的情况下,可以实现更为有效地压缩方法。到80年代末,许多人已经在这一领域取得了收获,设计出了一批在压缩效果上让人惊讶不已的声音和图像压缩算法。第三代数据压缩编码技术主要从90年代至今,图像压缩技术的主要成果体现在小波编码、分形编码等。矢量量化编码技术也有较大的发展。由于小波变换理论、分形理论、人工神经网络理论和视觉仿真理论的建立,人们开始突破传统的信源编码理论,例如不再假设图像是
10、平稳的随机场。有关图像编码技术的科技成果和科技论文也与日俱增,图像编码技术开始走向繁华。现代编码技术的特点是:充分考虑人的视觉特性,在恰当地考虑对图像信号进行分解与表达时,采用图像的合成与识别方案压缩数据。压缩编码方法包括像素编码、预测编码、变换编码等其它方法。在数据压缩编码技术发展过程中,取得最大成功,并被广泛应用在各个领域的就是压缩技术中第二代中的JPEG压缩方法。JPEG是1952年ISO国际质量认证组织和国际通信联盟组成的。JPEG组织突出和制定的一种邮政所标准,主要适用于静态图像信号的压缩和编码,JPEG标准结合采用了预测、不定长等多种压缩编码方法,压缩比可以达到10:1100:1,
11、而且压缩比可以在一定范围内由用户进行选择。当压缩比小于40:1时,可以被认为压缩结果是无失真的。但是采用JPEG压缩制定的压缩算法的计算量比较大,如对衣服高精度的真彩色图像使用JPEG压缩时,大约要进行上亿次运算操作,这对于实现JPEG压缩、编码的软件、硬件设备产品提出了较高的要求。早期的JPEG压缩多数做成专用的压缩卡。以专用的高速CPU芯片实现压缩处理、现在通用的计算机CPU速度不断提高的情况下,JPEG压缩也可以用软件来实现,为了解决JPEG中存在的计算复杂和块效应的问题,近年来出现了很多新的压缩编码方法,如使用人工神经元网络的压缩编码算法:分形、小波、基于对象的压缩编码算法、基于模型的
12、压缩编码算法等。4图像压缩的基本原理 去除多余数据,以数学的观点来看,这一过程实际上就是将二维像素阵列变换为一个在统计上无关联的数据集合。图像压缩是指以较少的比特有损或无损地表示原来的像素矩阵的技术,也称图像编码。图像数据之所以能被压缩,就是因为数据中存在着冗余。图像数据的冗余主要表现为:图像中相邻像素间的相关性引起的空间冗余;图像序列中不同帧之间存在相关性引起的时间冗余;不同彩色平面或频带的相关性引起的频谱冗余。数据压缩的目的就是通过去除这些数据冗余来减少表示数据所需的比特数。由于图像数据量庞大,在存储、传输、处理时非常困难,因此图像数据的压缩就显得非常重要。信息时代带来了“信息爆炸”,使数据量大增,因此,无论传输或存储都需要对数据进行有效的压缩。在遥感技术中,各种航天探测器采用压缩编码技术,将获取的巨量信息送回地面。图像压缩数据压缩技术在数字图像上的应用,其目的是减少图像数据中的冗余信息从而用更加高效的格式存储和传输数据。