监控图像处理毕业论文.doc

上传人:laozhun 文档编号:4029825 上传时间:2023-04-01 格式:DOC 页数:27 大小:3.91MB
返回 下载 相关 举报
监控图像处理毕业论文.doc_第1页
第1页 / 共27页
监控图像处理毕业论文.doc_第2页
第2页 / 共27页
监控图像处理毕业论文.doc_第3页
第3页 / 共27页
监控图像处理毕业论文.doc_第4页
第4页 / 共27页
监控图像处理毕业论文.doc_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《监控图像处理毕业论文.doc》由会员分享,可在线阅读,更多相关《监控图像处理毕业论文.doc(27页珍藏版)》请在三一办公上搜索。

1、中国科学技术大学University of Science and Technology of China本 科 生 毕 业 设计题 目: 图像处理在监控系统中的应用姓 名: 崔 雄 文 学 号: PB06210365 系 别: 电子工程与信息科学系 指导教师: 尹 东 二一年六月致 谢 值此毕业之际,我首先要感谢我的导师尹东教授,是尹老师让我有在信息科学实验中心学习与实践的机会。在他的悉心指导与教育下,使我对计算机的学习,对图像处理和视频监控系统有了一定的体会和认识。这对我今后的学习,工作生活有很大的帮助。我的班主任老师李争鸣老师,唐朝舜老师,裴小平老师,平时在我们的学习和生活上给了我们很大

2、的关心和支持,在此感谢他们四年中对我的教诲。在本科四年的学习期间,师从的各位任课老师给了我悉心的指导,他们不仅在学业上给了我们谆谆教诲,而且也在人格和精神上使我们受益匪浅。在此对他们表示衷心的感谢和深深的敬意。我们班的何沅泽、宋平、梁吉祥、黄江华等同学,大家一起在尹东老师的指导下进行毕业论文的相关工作,我们彼此之间象兄弟一般的情谊,我是不会忘记的。和一起朝夕相处的同寝室的同学杨勇,何沅泽,刘海磊,以及胡校成,李明哲,赖德华,他们在四年里给我的帮助,我衷心的感谢他们,我们的友谊我会永远铭记在心。大家永远是朋友。谨以此文献给我敬爱的父亲和母亲,我尊敬的各位老师,以及所有关心我的朋友们。目录摘要3A

3、BSTRACT4第一章 视觉压缩的人眼视觉特性基础51.1 视觉的空间和时间性质51.2 视觉与画质评价6第二章 静止图像编码标准82.1 JPEG标准82.2 JPEG2000标准92.3 对未来图像编码的眺望10第三章 监控图像处理技术113.1概述113.2监控图像预处理技术12第四章 监控图像压缩技术184.1 离散小波变换和DCT变换及其应用184.2 监控图像DCT压缩的GUI可视化编程实现23参考文献25摘要在经济社会快速发展的今天,伴随着科学技术的渐渐成熟和完善,人们在尽情享受科学技术带来的福利的同时,越来越多的社会问题也出现了,其中,社会治安成为其中人们比较关心的话题。在城市

4、小区中,在公共交通中,在各种公共场合中,视频监控系统的运用越来越普及。这种系统在预防违法犯罪,辨认抓捕犯罪分子,维护社会治安等方面,起到了重要的作用。然而,这种监控系统也存在很多问题。如监控图像不清晰,特征人物不明显,图像文件过大等。这些都是急需解决的问题。本文就是在这种背景下,运用经典图像处理技术和相关领域最新进展,对以上问题进行分析解决。主要工作有:1. 运用直方图均衡,Descartes 可变分辨率转换对图像进行预处理,同时对图像进行了区域处理。2. 运用多尺度Retinex算法处理监控图像,消除图像中的天气不利信息。3. 运用小波变换对监控图像进行压缩,融合和增强。4. 实现了8*8D

5、CT变换的图像编程,并对其进行了详细的分析和实验论证。5. 实现了监控图像变换,压缩,恢复这个三流程的可视化编程。关键词:图像处理,视频监控系统,图像预处理,图像增强,图像压缩,图像恢复 AbstractToday, with gradual maturity and perfection of science and technology, people are enjoying the benefits of science and technology, however, more and more social problems appear, among them social se

6、curity is a topic that people concerns more. In urban area, in public transportation, in all public places, usage of video monitor system is becoming more and more popular. This system plays an important role in preventing crimes, identifying and arresting criminals, maintaining public order and so

7、on.However, the monitor system also has a lot of problems. For example, images are not clear enough, characters of criminals are not obvious and image files are too big. These are problems which needs resolving. This article, using classical image processing technology and latest progress of related

8、 fields, analyzes and resolves problems above. Main jobs are:1. Preprocess images using image histogram equalization and Descartes variable resolution of image pretreatment.2. Eliminate adverse impact on images by weather such as rain, snow and fog by Retinex multiscale image processing algorithms.3

9、. Apply wavelet transformation in image compression, fusion and enhancement.4. Realize image programming of 8*8 DCT transformation, and analyse it in detail via experiments.5. Realize GUI programming of JPEG.Key words: Image Processing, Vide Monitor System, Image Preprocessing, Image Compression, Im

10、age Enhancement, Image Reconstruction第一章 视觉压缩的人眼视觉特性基础1.1 视觉的空间和时间性质一、视觉与神经系统人类视觉系统(the human visual system, HVS)是神经系统的一部分,神经系统是一个非常复杂的通信网络。在这个网络中通信时通过神经细胞神经元进行的,并由一个十分强大的计算机大脑来管理。一个神经元有一个5um-100um大小的细胞体,与这个细胞体相连的有一个叫轴突的主纤维和一些叫做树突的纤维分支。信息从一个神经元到另一个神经元的传递是以电化学方式进行的。两个神经元件的连接处叫做突触。发射和接受信息的神经元分别叫做突触前神经

11、元和突出后神经元。可以将神经系统设想成一个由神经元以串联,并联,反馈的形式组成的网络。这些一个复杂网络的分析,初看起来时非常困难,甚至是不可能的。但是,神经系统的一些特点可以使问题简化,从而有可能在细胞一级上分析神经系统。第一个特点是,神经系统中传递的信号只有两种,一种是用于长距离的,另一种是用于短距离的;第二个特点是,这些信号的形式对于所有神经元,不管其携带的信息是视觉的,听觉的,触觉的等等,几乎都是同样的。此外,信号的形式从一种动物到另一种动物也是不变的。这样就为研究提供了方便。被脑所接收和处理的信号是外部事件的符号表示。神经元输出的信号时脉冲串,每一脉冲的持续时间约为1ms.这些脉冲的重

12、复频率与外部刺激的强度成正比,即神经系统用调频方式通信。二、运动觉察和视觉掩盖物体运动造成的主观分辨率下降与人眼是否能跟踪住该运动物体有关。Miyahara曾于1975年测量过人对于图像的时间和空间的分辨率要求,发现如果图像中的运动物体能被人眼跟踪,则二者的结果是类似的。然而,对于不易被人眼跟踪的运动物体,它的分辨率损失就不太容易被察觉。显示在屏幕上的大多数运动时不易跟踪的,例如,人物的头,肩运动就难于精确预测。另外,观看者也不会分散注意力去跟踪他看到的那么多的物体。Miyahara的实验表明,在一般的电视观看条件下,平稳运动,当角速度达到24/s时,开始能被察觉。另外,Seyler和Budr

13、ikis在1965年研究时间掩盖效应时发现,如果是紧跟在一个场景变换之后,空间清晰度显著下降时不易被察觉的,只要早其后慢慢增加即可。如果在0.75s之内恢复100%的清晰度,观看者就不会感觉到清晰度的下降。虽然已有不少涉及时间掩盖的心理学文献发表,但是应该说,将其研究结果与图像编码联系起来的还不普遍。1.2 视觉与画质评价一、图像质量在实际系统中,重要的是首先根据应用的需要来确定所要求的图像质量。不同的系统对图像质量的要求不同。例如,如果用于图像判读,则相对于图像色调而言,更看重的是图像清晰度;而对于广播电视就更关心色调,特别是肤色要逼真。由于图像编码引起的图像损伤多种多样,并与具体采取的图像

14、编码方案有关,远较模拟传输引入的图像损伤复杂,因此,对其进行分类和定向描写有相当难度。 一种途径是研究人类视觉系统的工作原理,希望从中推导建立图像质量的模型。 尽管目前关于人类视觉系统的了解逐渐深化,取得了很大的进步,但同时从以上讨论也看到视觉系统十分复杂,开发出一个能用于优化图像和视频编码系统,简 单实用的视觉处理模型还有相当距离。因此,主观试验就成为评价图像质量的最常用和最可靠的手段。二、图像质量的主观评价1974年CCIR(国际无线电咨询委员会)对电视图像的主观评价方法提出建议(CCIR Recommendation 5001),这个建议为对在不同的时间,不同的地点,不同的学者所取得的研

15、究成果进行比较提供了可能。该建议对进行主观评价的人员,评价等级,测试图像,测试条件,图像显示方式等都做了如下规定。1.评价人员进行主观评价的人员可以是本领域有经验的专家,也可以是没有经验的一般人员。进行评价时,有经验的和没经验的两类人员要分别进行。为了保证统计上的可靠性,一般有经验的专家不应少于10人,没有经验的观看者不应少于20人。2评价方法分为两种评价方法,一种是等级评价,另一种是比较方法。进行等级评价时,一组评价人员在规定的观看条件下观看依事先确定的方法处理过的图像序列,并对所看到的每一图像进行评价,给出一个质量等级。比较方法采取的是相对尺度,用来评价待评图像与某个参考图像的相对质量。3

16、. 测试图像为了测试一个编码系统或一个编码方案的性能,一般要选取5个左右的测试图像。4. 测试条件观看距离等于6倍像高;黑白画面中最白与底色黑之间的对比度在100左右;周围环境照度要低。为了避免闪烁的影响,平均亮度对于场频为50Hz的系统一般要比场频为60Hz的系统低一些。5. 画面显示不同质量等级和不同质量损伤的图像要以随机的顺序显示,并且显示顺序上要保证两个具有相同或不同损伤程度的同一副图像不能相继出现。如前所述,如能充分利用人的视觉特点,挖掘潜力,就能显著提高图像和视频编码系统的压缩效率。这里涉及两方面的研究课题,一方面是深入研究人的视觉特性本身,包括视觉生理学和视觉心理学等方面的研究;

17、另一方面,要研究能与已知的视觉特性匹配的编码方式,将视觉的潜力充分利用。第二章 静止图像编码标准2.1 JPEG标准一、JPEG简介JPEG是联合图像专家组(joint photographic experts group)的英文缩写,其中“联合”的含义是指三个国际组织国际标准化组织(ISO),国际电报电话组织(CCITT)和国际电工委员会(IEC)联合成立的一个图像专家小组。JPEG的目的是给出一个适用于各种连续色调图像的压缩方法,其中源图像类型可以不受尺寸,内容,统计特性,像素形状以及颜色空间等的限制,压缩性能可达到当时技术所能实现的最好效果,并要求算法易于软硬件实施,系统具有优良的性价比

18、。JPEG标准共提供了四种操作模式2-4:1.顺序编码每个图像分量从左到右,从上到下扫描,一次扫描完成编码。2.累进编码图像编码在多次扫描中完成,接收端收到的图像时经多次扫描,由模糊到清晰的渐进过程。3.分层编码图像在多个空间分辨率进行编码,在信道传输较慢或接收端显示器分辨率较低的情况下,可只做低分辨率解码,而不必做高分辨率解码。二JPEG系统图2-1 JPEG编码器图2-1给出了基本系统的编解码器框图。在编码过程中,JPEG将源图像分成8*8的像素块,对各块分别进行DCT变换,量化和熵编码。算法首先通过DCT变换消除图像块各像素在空间域的相关性;而后根据给定的量化表对DCT系数进行量化,通过

19、量化降低DCT系数的精度来进一步消除图像数据间的统计相关性;最后输出图像压缩数据。解码时,采用与编码器同样的量化表和熵解码表对各块压缩数据进行熵解码和反量化;再进行反向DCT变换(IDCT);最后重建出图像。由此可见,整个压缩编码系统主要包括源图像数据输入,DCT变换,量化和熵编码四大部分。2.2 JPEG2000标准一、JPEG的缺陷作为一种应时而生的国际标准,JPEG也并不是万能的,随着时代的进步,通信技术的发展以及社会需求的变化,JPEG标准也将逐渐退出历史舞台的主角位置,进而为新生标准所代替。新的时代要求图像压缩系统不仅具有优良的压缩效率,还要具有对压缩码流的灵活处理能力以及良好的人机

20、交互性。面对众多新的应用需求,传统的JPEG标准已显得力不从心,这主要表现在以下几个方面:1.低码率压缩在码率低于0.25bit/像素时,JPEG重构图像存在严重的方块效应,难以满足网络传输需要。2.在噪声环境中传输二、JPEG2000图2-2 JPEG2000基本框图JPEG2000基本系统编解码框图如图2-2所示2-4,源图像数据经正向预处理后进行离散小波变换(DWT),对变换后的DWT系数实施量化,再进行熵编码,最后根据实际应用需求,将熵编码后的数据组织成压缩码流输出。解码时则根据压缩码流中的参数,对应于编码器各部分进行逆向操作,最后输出重构图像。三、JPEG2000与JPEG的比较JP

21、EG采用了目前较先进的压缩编码技术,相对于JPEG,主要有以下几个方面1.JPEG2000采用全图(full-frame)离散小波变换取代JPEG中的分块离散余弦变换(DCT),从而具有较好的能量聚集性。2.JPEG2000采用带有中心零死区的量化器(零死区步长为量化步长的两倍),可以实现图像的嵌入式编码(embedded coding)。3.JPEG2000用基于上下文的自适应算术编码取代JPEG基本系统中的赫夫曼编码,对量化后DWT系数的二进制位平面进行算术编码。4.画布坐标系统(canvas coordinate system)的引入使得在图像压缩域进行诸如剪切,旋转和翻转(flippi

22、ng)等操作变得极为简便。2.3 对未来图像编码的眺望一 新编码算法的萌芽图像编码算法已经有了很多的方案,现在的主流是预测编码和变化编码。这两种编码的概念早在二十世纪五,六十年代就已为人们所熟知,是相当成素的技术。相比之下,矢量量化和算术编码问世于1980年前后,是比较新的算法,当前还处于发展之中。例如,矢量量化以前曾是按统计特性设计的,今后可能会向着自组织型或结构模板型化的方向发展。最近,有报道利用人工神经网络进行信息压缩和应用分形理论进行编码的尝试。人工神经网络和分形理论的应用多少有点赶潮流的意思,但如果能从这里萌生出图形编码的新思路,则一定能够会很有意义。与此不同,尽可能按图像本质来建立

23、模型并基于其模型进行编码的思路逐渐受到了重视。二 从信息压缩编码到结构编码有一种意见认为,再过几十年,通信传输已经是相干光大容量通信时代,记录存储媒体也已是现在所无法比拟的大容量媒体了。到了那时,图像信息压缩早就成了无用技术了。实际上,一部分从事图像编码的研究人员(例如,智能编码研究人员)已经不把图像编码简单看做是单纯的信息压缩技术了,认为图像编码应该采用“信息结构描述技术”的想法正在逐步发展。比方说,既然五线谱可以认为是描述音乐这样的音响信号的结构形式,那么,如果也能针对图像找到一种类似于五线谱之类的描述形式,不也就能通过编码来按结构描述图像了吗?三.多媒体融合编码将来,图像,语音,文件媒体

24、都将不单独存在,而是成为相互关联的多媒体。那时,最理想的办法就是像图3-4那样,通过编码把各不同媒体按照概念和含义的级别表示成统一的代码信息。图2-3 多媒体融合编码的构想第三章 监控图像处理技术3.1概述一.视频监控系统图像清晰化处理目前,视频监控已在安防领域里广泛的应用,但是存在实时监视和图像回放不清晰的现象,导致对识别、取证、事件分析造成困难。 电视监控系统在我国已经非常普及,包括银行、军队、政府、企业都已经安装了大量的摄像机。但据初步了解,绝大多数的电视监控系统存在实时监视和回放图像不清晰的问题,从而导致对识别、取证、事件分析造成困难,甚至使嫌疑人面部特征无法辨认。随着中国经济的飞速发

25、展,各大城市已经建有大量的电视监控系统。但是尽管安装了众多的监控摄像机,案情发生后的图像回放都存在图像不清晰的问题,特别是嫌疑人面部特征不清晰,难以辨认,这给公安部门的破案、法院的取证都带来了极大的麻烦。当我们花费很大的资金安装了电视监控系统,却得不到清晰的图像,这给实际工作带来很大的问题: 1、无法判别现场细节; 2、无法辨认犯罪嫌疑人面部特征; 3、无法成为现场取证资料。二.监控效用信息理论监控效用信息是指在监控过程中, 对监控行为可以产生决策或者物化效用的信息。监控效用信息在生产监控过程中起着主导的作用, 它的范围取决于监控的目标和对象。监控效用信息理论的提出, 是为了在保证生产管理工作

26、正常进行的前提下, 尽可能地减少传输、转换及共享的数据量, 从而保证监控系统的实时性与有效性。在监控图像中, 监控对象及其所在的局部区域通常包含了绝大部分的监控效用信息, 是监控人员始终关注并感兴趣的区域(RO I) , 由其产生的局部视觉信息是引导监控行为和管理决策的关键。而RO I 之外的背景区域几乎不含监控效用信息, 对监控过程的影响微乎其微, 往往被监控人员所忽视。因此, 对于生产监控而言, 只要保证监控图像中RO I 的视觉信息能够满足监控行为正常进行的需要就可以了。3.2监控图像预处理技术一 直方图均衡一幅图像中灰度级rk出现的概率近似为Pk(rk)= k=0,1,2,L-1其中,

27、n是图像中像素的总和,nk是灰度级为rk的像素个数,L为图像中可能的灰度级总数。变换函数的离散形式为Sk=T(rk)=因此,已处理的图像由通过上式,将输入图像中灰度级为rk的各像素映射到输出图像中灰度级为Sk的对应像素得到。这种变换称为直方图均衡化或直方图线性化。以下为直方图均衡化的实验结果原图像 均衡后图像图3-1 直方图效果图实验分析:直方图均衡后的图像对比度增强,清晰度增高,但冗余信息仍然很多。这种处理方法简单,效果明显,但在增强有效信息对比度的同时,也增强了无效信息的对比度。二 Descartes 可变分辨率转换视网膜中央凹视觉是指人类视觉系统对于客观世界的视觉采样在空间分布上不是均一

28、的 , 而是以视网膜中央凹为中心逐渐降低感知分辨率的采样过程。在监控图像中应用基于视网膜中央凹视觉的处理方法, 即视网膜中央凹处理, 是为了模仿人眼在视觉感知过程中的信息处理机制来对生产监控图像中的监控效用信息进行筛选, 从而降低监控图像的数据量, 提高监控效率。处理后的监控图像能够在富含监控效用信息的RO I 上保持高分辨率, 以满足监控人员准确提取效用信息支持管理决策的需求, 而远离RO I 的背景区域分辨率则逐渐降低, 在减少非监控效用信息量的同时让监控人员能够对生产现场的整体状况有所了解, 从而辅助监控行为得以正常进行。空间变分辨率转换是模仿人眼在视觉感知中的空间分辨率变化, 对原监控

29、图像中的像素进行非均匀采样, 用较少像素得到转换图像来取代原图像的方法。实现空间变分辨率转换的途径有很多, 主要有复杂对数映射、DCT 量化系数处理、金字塔图像显示和小波变换等, 但现有各种处理方法都或多或少存在着缺陷与局限性。Descartes 可变分辨率转换是一种改进的对数映射方法, 它将传统的基于极坐标的对数映射方程在Descartes 坐标系内沿x 轴和y 轴方向进行分解, 保留了原图像在Descartes 坐标系内的矩形特征, 从而使对数极坐标映射转换中产生的转换图像边缘不规则问题得以解决。当注视点在原图像坐标(x 0, y 0) 处时, Descartes可变分辨率转换通过以下转换

30、方程将原图像中坐标为(x , y ) 的像素映射成为转换图像中坐标为(x , y )的像素:x = x 0 + ln (d xD+ 1)S x ,y= y 0 + ln (d yD+ 1)S y ,d x = x - x 0, d y = y - y 0.在转换过程中, 由压缩比例系数S x、S y 分别控制图像在x 轴和y 轴上的压缩程度, 也可以通过变形系数D 来调节图像的采样分布, 从而满足用户对视频传输码率和画面显示效果的不同需求。以下为Descartes 可变分辨率转换的实验 原图像 处理后图像采样率图3-2 Descartes 可变分辨率转换效果图实验结果分析:利用对数函数实现采样

31、率的变换,是一种比较理想的方法。这种算法不适合于高分辨率图像的预处理。而且三个待定的参数紧密相连,对参数的调节恰当与否也直接关系到预处理效果的好坏。实验结果中也可以看出这一点。理想的效果是以采样点为中心,采样率逐渐减小。三、多尺度Retinex灰度图像增强算法 图像增强的方法分为两大类:空域法和频域法 .“空域”一词指图像平面本身,是以对图像的像素直接处理为基础的. 本文研究空域法. 传统的空域法,如直方图均衡和线性对比度增强方法,在提高有用信息对比度的同时,也增强了无用信息的对比度 . 如在车辆识别中,车辆受光照、高大建筑物、树木等形成的阴影噪声影响,在提高车辆对比度的同时也提高了光照和阴影

32、等噪声的对比度,因此增加了计算机视觉方法如目标定位与跟踪的难度. 光照和阴影等噪声的存在给这些物体的特征提取和识别带来了极大的困难. 因此有必要研究可靠的方法对原始彩色图像进行补偿或消除,减少噪声干扰,提高机器识别率. 基于此考虑,Land于20世纪60年代末提出了基于人类视觉 感知的Retinex理论。 下面为多尺度Retinex算法的实验结果: 雾天 沙尘天 霾天 水中 昏暗天气 图3-3多尺度Retinex灰度图像增强算法各种天气下增强效果图四区域处理区域处理的主要任务是选取图像中用户感兴趣的特定区域,并对其进行滤波等操作,以达到改善局部图像的目的。对于监控图像进行区域处理尤其重要,当R

33、OI区域视觉效果不太明显时,往往通过区域处理的方法来改善。下面是区域处理的实例和效果图 原图 模板 处理图 图3-3 区域处理效果图 第四章 监控图像压缩技术4.1 离散小波变换和DCT变换及其应用一小波变换及其应用1984年法国的年轻的地球物理学家Jean Morlet在进行石油勘探的地震数据处理分析时与法国理论物理学家A.Grossman一起提出了小波变换(wavelet transform, WT)的概念并定义了小波函数的伸缩平移系:,但并没有受到学术界的重视。直到1986年法国大数学家Yves Meyer构造出平方可积空间L2的规范正交基二进制伸缩平移系:小波才得到数学界的认可。198

34、7年正在读硕士的Stephane Mallat将自己熟悉的图像处理的塔式算法引入小波分析,提出多分辨分析的概念和构造正交小波的快速算法Mallat算法。1988年法国女科学家Inrid Daubechies构造出具有紧支集的正交小波基Daubechies小波。1990年美籍华裔数学家崔锦泰和武汉大学的数学教授王建忠又构造出基于样条函数的单正交小波函数样条小波。1992年Daubechies在美国费城举行的CBMS-NFN应用数学大会上作了著名的小波十讲Ten Lectures on Wavelets报告,掀起了学习与应用小波的高潮。1994年Wim Swelden提出了一种不依赖于Fourie

35、r变换的新的小波构造方法提升模式(lifting scheme),也叫第二代小波或整数小波变换。连续小波变换(CWT = Continuous wavelet transform)的定义为:其中,a为缩放因子(对应于频率信息),b为平移因子(对应于时空信息),为小波函数(又叫基本小波或母小波),表示的复共轭。小波变换的特点有:1.时频局域性、多分辨分析、数学显微镜2.自适应窗口滤波:低频宽、高频窄3.适用于去噪、滤波、边缘检测等如同三角函数sin x和cos x及e-jx可以缩放构成函数空间的基底sin nx, cos nx及 e-jwx 一样,母小波也可以缩放和平移而构成函数空间的基底:及与

36、傅立叶变换不同,小波变换的结果有两个参数,多了一个可以表示时空位置信息的平移因子,所以其图示为一个二维曲面。将连续小波变换的缩放因子a离散化,得到二进小波变换;再将其平移因子b也离散化,就得到离散小波变换。以下为小波变换的图像实验结果:图4-1 用小波变换实现的图像压缩效果图(分别为对比度较低和较高的情况)图4-2 小波变换用于图像融合图4-3 小波变换用于图像增强二DCT变换及其应用在傅里叶级数式中,如果被展开的函数是实偶函数,那么,其傅里叶技术中只包含余弦项,在将其离散化由此可导出余弦变换,或称之为离散余弦变换(DCT,Discrete Cosine Transform)。二维离散余弦正变

37、换公式为数展开 式中,。二维离散余弦逆变换公式为 式中,。 JPEG采用的是88大小的子块的二维离散余弦变换。在编码器的输入端,把原始图像顺序地分割成一系列88的子块,子块的数值在-128到127之间。采用余弦变换获得64个变换系数。变换公式如下: 式中,。对于一个8*8的矩阵,经过DCT变换后的8*8系数矩阵的左上部分为直流部分,右下部分为高频部分。压缩应该在最合理的近似原始图像的情况下使用最少的系数,使用系数的多少也决定了压缩比的大小。下面为DCT变换的实验结果:图4-4 不同图像DCT变换的结果图4-5 实验给出的8*8DCT系数的权重图4-6 DCT压缩重建图像与采用的系数数目关系演示

38、图待添加的隐藏文字内容2图4-7 压缩采用的系数数量与信噪比间的关系图4.2 监控图像DCT压缩的GUI可视化编程实现实现平台:matlab v6.5主程序文件名称:ddct.m附属m文件:pinp:显示Saturn图像DCT变换后的频谱分布zhifang:显示Saturn图像DCT变换后的直方图本程序使用的与离散余弦变换有关的指令:dct:离散余弦变换 idct:离散余弦变换的反变换dct2:计算二维离散余弦变换 idct2:计算二维离散余弦变换的逆变换dctmtx:计算离散余弦变换矩阵实 dctmtx2:计算二维离散余弦变换矩阵dctdemo:二维离散余弦变换图像压缩演示相关函数:Make

39、DCT():计算当前图像的8*8DCT矩阵ApplyDCT():调用函数MakeDCT(),对原始图像应用DCT系数SliderUpdate():用于更新重建图像的矩阵模板使用的图像:Saturn.tifPout.tifTrees.tifQuarter.tifCircuit.tif程序使用说明:滑块用来选择DCT系数集,选中的系数集用滑块上方的图形窗口中的白色空格表示出来。一旦滑块的位置确定下来后,再按“应用”按钮就产生对应于该系数集的重建的图像以及原始图像与重建图像的差图像。按下“DCT变换”键可看到以Saturn图像为例的dct变换实例。下面的文字显示重构图像的均方误差。下面为实验结果的几

40、个截图: 图4-8 对Pout图像分别以64,32,1个系数复原图像的效果对比图 图4-9 对Saturn图像的复原图和单独分析图参考文献1. 章毓晋。图像工程上册:图象处理和分析。北京:清华大学出版社。1999.10。2. 章毓晋。图像分割。北京:科学出版社。2001。3. 原岛博。图像信息压缩。薛培鼎译。北京:科学出版社。2004.3。4. 张春田,苏育挺,张静。数字图像压缩编码。北京:清华大学出版社。2006。5. 姚庆栋,毕厚杰,王兆华,徐孟侠。图像编码基础。杭州:浙江大学出版社。1992。6. 荆其诚,焦书兰,纪桂萍。人类的视觉。北京:科学出版社。1997。7. 高文。多媒体数据压缩

41、技术。北京:电子工业出版社。2002。8. 肖自美。图像信息理论与压缩编码技术。广州:中山大学出版社。9. 精英科技。视频压缩与音频编码技术。北京:中国电力出版社。10. 张旭东,卢国栋,冯建。图像编码基础和小波变换技术原理,算法和标准。北京:清华大学出版社。2004。11. 张静,张春田。JPEG2000基本系统的功能扩展。计算机工程与应用学报。2003年39期。12. 张宏基,陈尚勤,华达芬等。数字通信数学基础。北京:人民邮电出版社。1982。13. 赵荣椿。数字图像处理导论。西安:西北工业大学出版社。1995。14. 程正兴。小波分析算法与应用。西安:西安交通大学出版社。1998。15.

42、 刘红梅。基于小波变换的视频编码和数字图像/视频水印关键技术的研究。中山大学博士论文。2001。16. 王东生,曹磊。混沌,分形及其应用。合肥:中国科学技术大学出版社。1995。17. 朱秀昌,刘峰,胡栋。数字图像处理与图像通信。北京:北京邮电大学出版社。2002。18. 沈亚荪等。视频编码与低速率传输。北京:电子工业出版社。2001。19. 钟玉琢等。基于对象的多媒体数据压缩编码标准MPEG-4及其校验模型。北京:科学出版社。2000。20. 潘文杰。傅里叶分析及其应用。北京:北京大学出版社。2000。21. 日下秀夫。彩色图像工程。朱虹译。北京:科学出版社。2004.22. 小野定康,铃木

43、纯司。JPEG/MPEG技术。叶明译。北京:科学出版社。2004。23. 小野定康,铃木纯司。JPEG2000技术。强增译。北京:科学出版社。2004。24. 邹谋炎。反卷积与信号复原。北京:国防工业出版社。2001。25. 马颂德,张正友。计算机视觉。北京:科学出版社。1998。26. 张志涌。精通matlab 6.5。北京:北京航天航空大学出版社。2003。27. 张兆礼。现代图像处理技术及Matlab实现。北京:人民邮电出版社。2001。28. 陈怀琛。MATLAB及其在理工课程中的应用指南。西安:西安电子科技大学出版社。29. 宋凯,沈红。多尺度Retinex灰度图像增强算法。沈阳:辽

44、宁大学学报自然科学版第35卷第1期。200830. 郑勇,刘大成。基于视网膜中央凹视觉的监控图像处理方法。北京:清华大学学报自然科学版第45卷第2期。2005。31. 李学明。基于Retinex理论的图像增强算法。北京:北京邮电大学学报2005年第二期。2005。32. 沙莎,罗三定,周尤明。数字视频监控图像压缩方法研究。广州:中山大学信息学院。2007。33. 全洪渊,刘爱君。一种应用于隧道视频监控的图像识别系统。重庆:重庆大学自动化学院。2007。34. 礼水根,吴纪桃。分形与小波。北京:科学出版社。2002。35. 程正兴。小波分析算法与应用。西安:西安交通大学出版社。1998。36. 秦前清,杨宗凯。实用小波分析。西安:西安电子科技大学出版社。1995。37. 崔锦泰著。程正兴译。小波分析导论。西安:西安交通大学出版社。1995。38. 刘红梅。基于小波变换的视频编码和数字图像关键技术的研究。广州:中山大学博士论文。2001。39.Blake A, Zisserman A. Visual reconstruction. Cambridge, MA: MIT Press.1987.39. Bovik A. a Handbook of Image and

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号