01拉普拉斯金字塔压缩图像编码.doc

上传人:文库蛋蛋多 文档编号:4200245 上传时间:2023-04-09 格式:DOC 页数:10 大小:448.50KB
返回 下载 相关 举报
01拉普拉斯金字塔压缩图像编码.doc_第1页
第1页 / 共10页
01拉普拉斯金字塔压缩图像编码.doc_第2页
第2页 / 共10页
01拉普拉斯金字塔压缩图像编码.doc_第3页
第3页 / 共10页
01拉普拉斯金字塔压缩图像编码.doc_第4页
第4页 / 共10页
01拉普拉斯金字塔压缩图像编码.doc_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《01拉普拉斯金字塔压缩图像编码.doc》由会员分享,可在线阅读,更多相关《01拉普拉斯金字塔压缩图像编码.doc(10页珍藏版)》请在三一办公上搜索。

1、拉普拉斯金字塔压缩图像编码摘要:我们描述一种图像编码技术,以与多尺度运算相同形状的算子作为基本函数。与已建立的技术不同,该表示方法的代码元素在频域和空域同时建立。像素间的相关性,通过从图像自身减去一个通过了低通滤波器的该图像党的副本而去除。由于差异或误差的存在,结果是一个净数据压缩,图像具有较低的方差、熵,低通滤波过的图像可能代表了减少后的采样密度。进一步的数据压缩是通过对差分图像的量化获得的。重复这些步骤对通过低通滤波器的图象进一步压缩。在迭代的过程适当地对尺度进行扩大就得到了金字塔数据结构。该编码过程相当于对图像进行拉普拉斯多尺度运算抽样,因此,该代码往往加强显著的图像特征。另外一个优点是

2、现在的编码适合许多图像分析任务,对图像压缩同样适用。文中也给出了该算法的快速算法的编解码过程。简介图像一个共同的特点就是相邻像素间具有很强的相关性。因此,用像素值来表示图像效率是非常差的。大部分的编码信息是多余的。首要的任务就是设计一个高效的、压缩编码就是要找到一种表示方,有效地去除图像像素间的相关性。这通过预测编码和变换技术已经达到。在预测编码中,在一个栅格格式里像素采用顺序编码。然而,每一个像素编码之前,先对它的编码值进行预测,而这种预测是通过前述的同一栅格线中先前的预测编码的像素得到的。预测的像素值代表了冗余信息,实际像素减去该预测的像素值,只对差异或者是预测误差进行编码。因为以前只有编

3、码像素用于预测每个象素的值,这个过程被说成是因果关系。限制因果预测解码便捷行的因素是:给定像素其预测像素值是由已经编码了的相邻像素反复计算得到的,增加了存储的预测误差。非因果预测中,基于相邻像素的对称性,每个像素均为中心,应该得到更加准确的预测值和更大的数据压缩量。然而,这种方法不允许简单的顺序编码。非因果预测图像编码方法通常涉及到图像变换或是解决大数量的联立方程。与顺序编码方式不同,该技术采用一次性编码或是分块编码。预测和变换技术都具有自己的优点。前者的实现相对简单,适应当地的图像特征。后者通常适用于大的数据压缩,但是计算量相当的大。这里我们将描述一种新的用于去除图像特征相关性的技术,该技术

4、结合了预测和变换方法的特点。这项技术是非因果的,但计算相对简单一般。每个像素值的预测值的计算由加权平均法计算,该方法集中在像素本身使用单峰类高斯(或双峰相关)权函数。首先对图像和权重函数进行卷积得到了所有像素的预测值。结果得到一个低通滤波图像,然后从源图像中减去。设为原始图像,是应用了适当的低通滤波器后的结果,预测误差可由下式得到:我们不对进行编码,而对和进行编码。结果得到的是净数据压缩原因:a)是大范围不相关的,所以描述像素比所用的比特数少;b)是经过低通滤波的,所以采用了降低了的采样速率来进行编码。数据的进一步压缩是通过迭代过程获得的。通过低通滤波产生g2同时得到第二个误差图像。重复这些步

5、骤,我们获得了一个二维序列。由于采样密度的减小,我们实现的数据每一个都比其前一个减少了1 / 2个尺度因数。现在,如果我们想象这些数组中的数据一个在另一个上面叠加,结果就是一个逐渐变细的金字塔数据结构。金字塔中各节点的值代表两类高斯函数之间的差异或与原始图像相卷积的相关函数。这两个函数的不同之处类似于常用在图像增强中的“拉普拉斯”算子。因此,我们提出了图像压缩拉普拉斯金字塔代码。上面概述的编码方案只适用于可以进行有效的滤波计算的算法中。一个合适的快速算法已经发展完善,将在下一节中进行描述。高斯金字塔拉普拉斯金字塔编码的第一步就是将原始图像进行低通滤波得到图像。因为分辨率和采样密度的降低所以我们

6、说是减少了的版本。类似的我们从得到减少的版本,一次这样下去。滤波相当于一个与一族对称的加权函数进行卷积的程序。这个家族中重要成员与高斯概率分布相似,所以图像序列被称为高斯金字塔。在下一子部分中将会介绍高斯金字塔产生的快速算法。我们在接下来的子部分中对同一算法如何通过采样点插值法来扩展图像序列进行。这种装置在这里用来帮助实现高斯金字塔各层原件的可视化,在下一节里定义了拉普拉斯金字塔。高斯金字塔的产生假设原始图像由C行R列的像素数组组成。每个像素用介于0和K 1之间的整数代表在相应的图像点的光强度。这幅图像成为高斯金字塔底部或零水平。金字塔的一级包含图像,该图像是降低的或通过低通滤波版的图像。每个

7、1级内部的值都是在一个的窗口内经过加权平均计算的值。代表g2图像的2级中,每个值都是由一级的各值采用同样的权重模式获得的。图1给出了这一过程的一维图形表示法。权函数的大小并不统一。我们选出了的模板,因为它以较低的计算代价提供足够的滤波效果。这种由层到层得过程称为REDUCE操作:那么,就可以得到在层中,点,其中,的值为:N代表金字塔的层数,是第层得维数。如图1,在一维中采样点的密度减少了一半,或是说二维中层与层之间减少到了。原始图像的维数与金字塔的结构是相适应的,存在这样的整数满足:(例如,如果都是3,N=5,则图像为97*97像素)。的维数是。高斯金字塔图1 代表高斯金字塔生成过程的一维图形

8、。每一横排点代表在金字塔同一层中的节点。在零层中每个节点的值只是图像相关像素的灰度级。高层中各节点的值是相邻低层中节点值的加权平均。注意,随层数的增加节点间距以2N变化,但是使用同一权重模型或“生成核”来生成所有的层。生成核注意我们使用权重为的模型来生成金字塔,这个权重模型称之为生成核,满足一些限制条件:可分离性:一维,长为5,归一化函数:对称性:另外一个附加条件叫做等值贡献,必须保证给定层的节点会为高一层的节点贡献相同的权重值。设这种情况下等值贡献需要满足。当满足这3个限制条件时:等权值函数金字塔的迭代产生等价于图像与一系列的等权值函数进行卷积:或者图2 高斯金字塔的第1,2,3和无限多层的

9、节点等权值函数。为了增加对比度用因子2对坐标轴范围进行调节。这里的生成核参数a是0.4,产生的等权函数与高斯分布的概率密度函数相似。等权值函数的值每一层都是上一层的2倍,采样间隔也同样每一层是上一层的2倍。图2所示高斯金字塔的等权值函数的1,2,3层。当a=0.4 时,等值函数的图形迅速收敛为一个具有连续更高层金字塔的特征形式,所以只有范围上的变化。然而,这种形状的选择取决于生成核的参数a。图3为4个不同a参数下的特征形状。需要注意的是,尤其Gaussian-like等价权函数当一个= 0.4。当一个= 0.5的形状是三角形;当一= 0.3它就是奉承和更广阔的比高斯。用= 0.6中央的正离子模

10、式正急剧尖顶,两侧是负叶小。当a=0.4时等权值函数的形状与高斯函数最相似;a=0.5时等权值函数是三角形的;a=0.3时它的图形比高斯函数图形宽,胖;a=0.6时中央位置的模型是陡而尖的,两侧只有小的负叶。快速傅里叶变换图像和等价权函数卷积的效果就是对图像进行低通滤波,使图像变的模糊。金字塔算法通过层与层间的八倍频程降低了滤波器的带宽限制和采样间隔。这是一种速度非常快的算法,仅仅需要比用快速傅里叶变换计算单一滤波的图像更少的计算步骤来计算一系列的滤波图像。例:图四展示了当a=0.4时指定高斯金字塔的各级分量。左边第一个的原始图像,可以分为257257的度量形式。这就是第0级金字塔。由于样本灰

11、度的降低,每一个更高层次的数组在大小上都是前者的一半。图3 等权值函数的形状由参数a的值决定。当a=0.5,函数呈三角状;当a=0.4,函数接近高斯图形;当a=0.3,函数比高斯函数更加平缓;当a=0.6,函数呈三峰状。高斯金字塔内插法现在定义一个与压缩函数作用相反的扩展函数。这个函数的作用是通过在给定(M+1)(N+1)矩阵中的任意两个数之间添加新的数值,形成一个新的(2M+1)(2N+1)矩阵。如此一来,对高斯金字塔中的扩展将会得到一个与同样大小的。假设是扩展了n次的结果,那么得到: 通过扩展得到:,其中,这个公式只有在(i-m)/2及(j-n)/2都为整数的情况下才成立。如果对扩张了次,

12、就会得到与初始图像相同尺寸的。虽然在图像编码中不会使用充分的扩展,还是可以在金字塔结构内利用扩展来促使各种不同矩阵的成分变得直观。图5的第一行展示了通过对图四中各级金字塔扩展所得到的图像,高斯金字塔的低通滤波效应在此处得到了很好的体现。拉普拉斯金字塔回顾前文,本文目的是建立能够预测原始图像g0的预测像素值的压缩图像g1。为得到压缩表达式,将误差图像进行编码,该误差图像由扩展的g1减去g0得到,为拉普拉斯金字塔的最底层。由同样方法将g1编码得到下一层。现在定义拉普拉斯金字塔,然后分析其特点。构建拉普拉斯金字塔拉普拉斯金字塔是误差图像L0,L1l,LN的序列,每个值是高斯金字塔两层之间的差值。对于

13、0 = l N,由于不存在gN的预测图像gN+1,所以令等价权重函数拉普拉斯金字塔的每个值是两个等价权值函数与原始图像卷积后的差值,这类似于用一个适当大小的拉普拉斯权重函数与图像卷积。通过这种方法可以直接获得节点值,但计算复杂度较大。我们可以把高斯金字塔看做是原始图像经过低通滤波器的结果,把拉普拉斯金字塔看作是原始图像经过带通滤波器的结果。每一层拉普拉斯算子规模都是上一层的两倍,而带通滤波器的中心频率会逐次减小一个倍频程。为了得到拉普拉斯金字塔的具体内容,可在样本点之间进行插值,这可以由高斯插值得到。设为公式(2)得到的扩展n次的结果。是原始图像的大小。图4中的扩展拉普拉斯金字塔等级显示在图5

14、的底层。注意到如边缘和条状等图形特征出现增强。扩展的特征按照大小分类:突出细节,在更高层的图像中这些特征逐步粗糙。解码可以通过扩展恢复出原始图像,然后将拉普拉斯金字塔各层相加:一个更有效的步骤是扩展LN并将结果与LN-1相加,然后再次扩展并与LN-2相加,重复这步知道第0蹭,g0便得到恢复。该过程是拉普拉斯金字塔产生的逆过程。由公式(3)可得:对于,熵如果我们假设描述图像像素的值在统计上是独立的,那么,图像单位像素精确解码所需的最小比特数就可以通过像素值分布熵给出。该优化可以通过类似变长编码的技术实现。Lady图像像素值的直方图在图6(a)中显示。如果我们设这些观察到的每一灰度级的发生频率是在

15、这个及其他类似的图像中发生概率的估计值,那么改进的熵值可由下式给出: 图6 在编码过程的不同阶段像素的灰度值分布。原始图像的直方图如图(a)。(b)-(e)给出了a=0.6时Laplacian金字塔 0 3级的直方图。量化后每一层的直方图在f-i中显示。注意,拉普拉斯金字塔中的像素值集中在近零区域,允许通过可变长度编码和缩短进行数据压缩。实质性上,进一步压缩通过量化(尤其在金字塔低层)和降低采样密度(金字塔高层)。当原始图像灰度级为256,所有的灰度级基本同等可能的情况下得到图像的最大熵为8。实际的Lady图像的熵略小,为7.57。在拉普拉斯金字塔中,从每个图像像素减去预测值的技术,移除大部分

16、像素间的相关性。去相关同时导致像素值在0范围的集中,因此降低方差和熵。这些措施将在何种程度上减少取决于金字塔产生中参数值a的值(见图7)。我们发现在我们的例子中a=0.6时减少的最多。高斯金字塔的级别在这一直时变得比其他较小的值如0.4时明快。而当a=0.4时能够得到更好的类高斯等权值函数。因此,选择a= 0.6不仅感性上计算上也有优点。前四层拉普拉斯金字塔融合算法和他们的直方图如图6(b)-(e)。每一层的方差和熵也在图中显示。通常,,发现这些物理量逐层增加,如例所示。量化对拉普拉斯金字塔每一层的像素值进行量化可以大幅度降低其熵值。这引入了量化误差,但通过选择合适的量化电平的数量和分布,可以

17、将误差降低到观察者几乎难以察觉出来。这个用统一的量化算法来分析这一过程。像素值的范围分为n个插值,像素的量化值是包含在内的插值的中间值:,量化图像通过扩展和步骤(4)中用C值代替L值的加和进行重建。Lady图像的量化结果如图6f-i。每一层的插值通过增加n值直到能够在大于图像宽度(像素间距约为3微弧)五倍的距离外察觉到图像降级为止。注意插值的大小在高层(低空间频率)变小。给定金字塔塔层插值的大小反映了人类观察者对该层空间频带上相对误差的敏感程度。人类对低和中等空间频率的相对扰动相当敏感,但对高空间频率的扰动相对不敏感3,4和7。上面提到的方法中数据方差的增加导致观察者灵敏度也随之增加,这意味着

18、高层金字塔的量化等级必须比低层金字塔中多。幸运的是, 由于低的采样密度,这些像素对整个图像的比特率起不了太大作用。低层(高频)像素,经过了细致取样,可以进行粗糙量化。结论编码、量化和重建的最后结果如图8。原先的Lady图像显示出如图8(a);编码视图显示如图8(b),效率为1.58bits/像素。我们假设变长码字编码用来代替非均匀分布的点的值,所以对于一个给定的金字塔层来说比特率是其水平估计样本熵乘以它的采样密度,图像比特率是所有层的总和。对沃尔特图像进行同样的程序处理,原图像如图8(c),如图8(d)是在0.73比特/像素效率编码的视图。这两种情况下,在前文所述的浏览状态下,经编码的图像几乎

19、与原图像是区分不开的。渐进式传输从文中我们还应该能看出,拉普拉斯金字塔融合算法代码尤其适合循序渐进图像传输。在这种类型的传输图像的一个粗略译码是首先传送给接收者的影像内容的一个早期印象,然后后续的传输提供了具有更细分辨率的影像细节5。只要图像的内容被识别或者是可以明显看出图像不是所需要的,观察者可以终止图像的传输。为了达到渐进式传输,金字塔最顶层水平的代码是首先传送,并且在金字塔的接收过程中被扩大了,形成一个初步、粗略的图像。下一层次随后被传送,被扩大,并且被添加到第一个等等。在接收过程结束的时候,最初的图像就显得很模糊,但是逐渐变得清晰。这个渐进的过程正如图9中,从左至右所示。值得注意的是,

20、虽然完全传输的每个像素都要求1.58比特 (最右边的图像),大约这些的一半,或者前一个图像的每一个像素需要0.81比特 (右二,图9),0.31为再之前的图像 (右三)。总结和结论拉普拉斯金字塔是一个在图像处理方面具有许多吸引人功能的通用数据结构。它代表了一个准带通图像系列的形象,即在连续稀疏密度采样下的图像。由此产生的代码元素,形成了自相似结构,是在空间和空间频域的定位。通过适当选取编码和量化方案的参数,可以大大减小表示的熵,同时保持在人的视觉系统感知灵敏度的失真范围内。图10总结了拉普拉斯金字塔编码的步骤。第一步,如最左边所示是高斯金字塔图像自下而上的构造g0,g1,gN见(1)。由于连续

21、高斯层之间的差异进而得到了拉普拉斯金字塔的图像L0,L1,,LN见(3)。它们是由数值金字塔Cl(ij)所代表的量化的压缩编码见(5)。最后,图像重构遵循着一个扩大求和的程序见(4),在L数值的地方使用C的数值。在这里,我们指定由R0重建图像。从文中还可以看出,拉普拉斯金字塔融合算法编码方案需要相对简单的计算。计算是局部的,并且可以同时执行。而且用相同计算的线性迭代来从它的前身建造每个金字塔层。我们可以设想使用矩阵处理器和一个管状结构实时进行拉普拉斯编码解码。还有一个好处,如前文中所提到的,就是在进行拉普拉斯金字塔融合计算时,可以自动进入到图像的准带通拷贝过程。在这种表示方法中,各种大小的图像特性都得到了加强,而且各种图像的处理过程和模式识别任务都可以直接利用。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号