第二章 数字图像表示及其处理ppt课件.ppt

上传人:小飞机 文档编号:1433844 上传时间:2022-11-24 格式:PPT 页数:73 大小:2.81MB
返回 下载 相关 举报
第二章 数字图像表示及其处理ppt课件.ppt_第1页
第1页 / 共73页
第二章 数字图像表示及其处理ppt课件.ppt_第2页
第2页 / 共73页
第二章 数字图像表示及其处理ppt课件.ppt_第3页
第3页 / 共73页
第二章 数字图像表示及其处理ppt课件.ppt_第4页
第4页 / 共73页
第二章 数字图像表示及其处理ppt课件.ppt_第5页
第5页 / 共73页
点击查看更多>>
资源描述

《第二章 数字图像表示及其处理ppt课件.ppt》由会员分享,可在线阅读,更多相关《第二章 数字图像表示及其处理ppt课件.ppt(73页珍藏版)》请在三一办公上搜索。

1、图像处理与模式识别,Image Processing and Pattern Recognition,版权所有:钱 瑛,Outline of Lecture 2,人眼视觉特性色度学与彩色模型图像的数字化数字图像的基本类型图像的文件格式图像的输入图像的存储与输出,人眼视觉特性,人眼是一个平均半径为20mm的球状器官。它由三层薄膜包围。最外层是坚硬的蛋白质膜,其中,位于前方的大约16部分为有弹性的透明组织,称为角膜,光线从这里进入眼内。,其余56为白色不透明组织,称为巩膜,作用是巩固和保护整个眼球。中间一层由虹膜和脉络膜组成。 虹膜的中间有一个圆孔,称为瞳孔。它的大小可以由连接虹膜的环状肌肉组织来

2、调节,以控制进入眼睛内部的光通量大小,其作用和照相机中的光圈一样。最内一层为视网膜,它的表面分布有大量光敏细胞。,除了三层薄膜,在瞳孔后面还有一个扁球形的透明水晶体。水晶体的作用如同可变焦距的一个透镜,它的曲率可以由睫状肌的收缩进行调节,从而使景象始终能刚好地聚焦于黄斑区。眼睛的晶状体和普通光学透镜之间的主要差别在于前者的适应性强。,用眼睛看建筑物侧面的图解,C点是晶状体的光心,视觉低级感知层次,视觉系统从外界获取图象,就是在眼睛视网膜上获得周围世界的光学成象,然后由视觉接收器(杆状细胞和锥状细胞在视网膜上作为视觉接收器),将光图象信息转化为视网膜的神经活动电信息,最后通过视神经纤维,把这些图

3、象信息传送入大脑,由大脑获得图象感知。,中心凹(成像区),x/17=15/100 x=2.55mm,视网膜上有杆状细胞和锥状细胞两类视觉接收器:,杆状细胞(Rods):细长而薄,数量上约7500万1亿5000万,它们提供暗视,即在较低数量级亮度时的视觉响应,其光灵敏度高。锥状细胞(Cons):结构上短而粗,数量少,约600万700万,光灵敏度较低,它们提供昼视,其响应光亮度范围比杆状细胞要高56个数量级。在中间亮度范围是两种视觉细胞同时起作用。锥状细胞集中分布在视网膜中心小凹里。,人类视觉系统在对物体的识别上有特殊强大的功能;但在对灰度、距离和面积的绝对估计上却有某些欠缺;以传感器单元的数目比

4、较:视网膜包含接近1亿3000万至1亿5000万个光接收器,这远远大于一般数字成像系统CCD片上的传感器单元数;和它每次执行运算的数目比较:和计算机的时钟频率相比,神经处理单元的开关时间将比之大约慢104倍;总体而言,人类的视觉系统还是比计算机视觉系统要强大得多。它能实时分析复杂的景物以使我们能即时的反应。,假设一个平面如磨砂玻璃一样散光,被1个强度为I且可以变化的光源从背后照亮,1个照度增量为I,像短促闪光一样加在均匀照明的平面上,可使人感到平面中间像1个圆形亮点,如图所示,如果I不够亮,实验者没有感知上的变化,当I逐步增强,感知上发生变化。如果50的机会感知亮度变化,则量I50/I为韦伯率

5、,小的韦伯率表示可区分强度的小变化,有较好的亮度区分能力;大的韦伯率表示只有大的强度变化才能区分,有较差的亮度区分能力,亮度适应性,人眼视觉系统对亮度的响应具有对数性质,是单调的非线性系统。实验证明,这一非线性接近1/3的幂指数函数。人眼通过这一对数性质,达到宽达108的视觉亮度范围。但在固定背景光的条件下,适应范围并不宽,约几十个灰度级。眼睛对光强的响应是非线性的。一块光强为I+ I的小块被背景强度I 所包围,则可觉察的差值I是I的函数,即对视觉敏感的是对比度,而不是亮度值本身。韦伯定理:如果一个物体的亮度与其周围背景I有刚刚可觉察得到的差别,则它们的比值是I的函数。其在一定的亮度范围内,近

6、似不变,为常数值 0.02,这称为韦伯比。即: I/I=0.02 (常数),视觉范围是指人眼所能感觉到的亮度范围。这一范围非常宽,大约从百分之几cd/m2到几百万cd/m2 。事实上,在人眼适应了某一平均的亮度环境之后,它能感受的亮度范围要小得多。即使是客观上相同的亮度,当平均亮度不同时,主观感觉的亮度也不相同。,人眼分辨率,马赫带效应人眼对于图像上不同空间频率的成分具有不同的灵敏度。视觉系统对空间高频和空间低频的敏感性较差,而对空间中频则有较高的敏感性,因而在亮度突变处产生亮度过冲现象,这种过冲对人眼所见的景物有增强其轮廓的作用。,每个条带内部的亮度是常数,但仍然有强烈的边缘效应,色度学与彩

7、色模型,光波:光是一种按波长辐射的电磁波。光的物理性质:波长(光速,频率)和幅度 下页图:可见光谱颜色视觉系统对可见光的感知视网膜上锥状光敏细胞:光强与颜色。视网膜上杆状光敏细胞:光强。颜色度量:色调、亮度、饱和度 色调波长 亮度幅度 饱和度色光的纯度,500,600,紫,400,700,750,紫蓝,蓝,蓝绿,绿,绿黄,黄,橙,橙红,红,350,可见光,0.005nm,5nm,350nm,750nm,0.4mm,射线,射线,紫外线,红外线,无线电波,0.01nm,10km,电磁波波长范围很大,使人产生视觉,感到明亮和颜色的电磁波叫可见光。 可视光区的波长在400nm700nm,当光谱采样限制

8、到三个人类视觉系统敏感的红、绿、蓝光波段时,对这三个光谱带的光能量进行采样,就可以得到一幅彩色图像。,色调Hue :人眼感觉到物体反射或发射光波的波长。色调就是颜色的分类。如七色:红、橙、黄、绿、青、蓝、紫在色谱中,色调连续变化。饱和度Saturation:指颜色的纯正程度。与亮度有关:某一色调参入白光,色调不变但饱和度降低与参入其它颜色的光有关:饱和度与色调都会改变。亮度Intensity:人眼感受到的颜色的光的强度同一种色块,在不同强度的白光照射下,反射的光波波长一样(色调相同),但人眼感觉到的颜色不同。某一颜色的光,量度很弱,趋于黑色,反之,趋于白色。,彩色的表示,彩色的表示是基于Tom

9、as Young提出的三基色原理:“任何彩色可以用合适的三种基本色混合而再生” 。生理学已证明,视网膜中有三种视锥体,具有不同的吸收光谱,SR(),SG(),SB() 其中:MINMAX 、MIN 400nm、max 780nm吸收光谱响应的峰值分别在光谱的红、绿、兰区域。而且,吸收曲线有相当多的部分是相互重叠的。这是三基色原理的生理基础。,人眼中红绿蓝锥状体的波长吸收函数,国际照度委员会(CIE)在1931年规定3种基本色的波长为:R:700nm,G:546.1nm,B:435.8nm,三基色相加混色:红、绿、兰三基色(RGB),三基色相减混色:黄、青、品红(CMY),设组成某种颜色C所需的

10、三个刺激量分别用R、G、B表示每种刺激量的比例系数为r、g、b,有,1931年CIE根据此原则制定了一个色度图:舌型图,每一点对应一种颜色边界点代表纯颜色任意两点连线表示线上的颜色可由两点颜色混合形成任意三点形成的三角形内的颜色可由三点颜色混合形成,R、G、B 各用一个字节可表示: 28 x 28 x 28 =1677 万色RGB 全为1 为白色RGB 全为0 为黑色RGB 数值相等为灰色RGB 哪个数值大就偏向哪种颜色,R,G,B,彩色模型也称为彩色空间或彩色系统,是描述色彩的一种方法。目前表达颜色的彩色模型有许多种,它们是根据不同的应用目的而提出的。在数字图像处理中,实际上最常用的彩色模型

11、是RGB(红、绿、蓝)模型,HSI(色调、饱和度、亮度)模型。前者主要用于彩色显示器和彩色视频摄像机;后者则更符合人类描述和解释颜色的方式。,彩色模型,在RGB模型中,每种颜色出现在红、绿、蓝的原色光谱分量中,这个模型基于笛卡尔坐标系统。图中R、G、B位于3个角上;青、深红和黄位于另外三个角上,黑色在原点处,白色位于,RGB彩色模型,离原点最远的角上。在该模型中,灰度等级沿着主对角线从原点的黑色到点(1,1,1)的白色分布。,彩色模型,HSI(Hue, Saturation, Intensity)颜色空间,HSI能减少彩色图像处理的复杂性。合乎人对彩色的认识: 色彩:色调、饱和度 亮度:非彩色

12、属性,对应黑白图像的灰度。,HIS彩色模型双三棱锥模型形(74年),这种彩色系统格式的设计反映了人类观察彩色的方式。如:红色又分为浅红和深红色等等。 I:双三棱锥中心线;表示光照强度或称为亮度,它确定了像素的整体亮度,而不管其颜色是什么。 H:表示色度,由角度表示。反映了该颜色最接近什么样的光谱波长。0o为红色,120o为绿色,240o为蓝色。0o到240o覆盖了700nm435.8nm的可见光谱颜色,240o到360o是400nm 435.8nm的可见光谱颜色。 S:饱和度,饱和度参数是沿双棱锥中心线垂直方向到彩色点的长度。在双棱锥的外表面是纯的或称饱和的颜色,其饱和度值为1。在中心是中性(

13、灰色)影调,即饱和度为0。,HIS彩色模型,彩色模型之间的转换,RGB到HSI的彩色变换 :,HSI到RGB的转换 :由HIS到RGB的转化公式有些不同,它取决于要转换的点落在原始色所分割的哪个扇区。,色度学与彩色模型,图像的数字化,一幅图像实际上记录的是物体辐射能量的空间分布,这个分布是空间坐标、时间和波长的函数,即:I=(x,y,z,t)。当一幅图像为平面单色静止图像时,空间坐标变量z ,波长和时间变量t可以从函数中去除,一幅图像可以用二维函数f(x,y)来表示: f(x,y)=i(x,y)r(x,y) 这里 0i(x,y) 0r(x,y)1 反射分量限制在0和1之间。i(x,y)的性质取

14、决于照射源,而r(x,y)取决于成像物体的特性。,数字图像可以理解为对二维函数f(x,y)进行采样和量化(即离散处理)后得到的图像,因此,通常用二维矩阵来表示一幅数字图像。 将一幅图像进行数字化的过程就是在计算机内生成一个二维矩阵的过程。数字化过程包括三个步骤:扫描、采样和量化。,采样,采样(Sampling):对图像空间坐标的离散化,它决定了图像的空间分辨率。 用一个网格把待处理的图像覆盖,然后把每一小格上模拟图像的各个亮度取平均值,作为该小方格中点的值;或者把方格的交叉点处模拟图像的亮度值作为该方格交叉点上的值。,图像的采样,分辨率,分辨率 是指映射到图像平面上的单个像素的景物元素的尺寸。

15、 单位:像素/英寸,像素/厘米 (如:扫描仪的指标 300dpi),或者是指要精确测量和再现一定尺寸的图像所必需的像素个数。 单位:像素*像素 (如:数码相机指标30万像素(640*480),常用的几种分辨率,屏幕分辨率(screen resolution) 也称光栅分辨率,CRT在水平和垂直方向上能显示的最大光点数。显示分辨率(display resolution) 计算机显示控制器所能提供的显示模式。图象分辨率(image resolution) 每英寸图象含有多少个象素点。 图象尺寸大小、图象分辨率、图象文件大小,分辨率(续),位分辨率(bits resolution) 也称位深,用来衡

16、量每个象素存储的信息位数。如2位、8位、24位。输出分辨率(output resolution) 打印机等输出设备每英寸所产生的点数(dpi)。,以多大的采样间隔进行采用为好?,取样与量化,点阵采样的数学描述,取样与量化,点阵采样的的耐奎斯特准则,vc、uc为截止频率,量化,把采样后所得的各像素灰度值从模拟量到离散量的转换称为图像灰度的量化。量化是对图像幅度坐标的离散化,它决定了图像的幅度分辨率。,量化的方法包括:分层量化、均匀量化和非均匀量化。分层量化是把每一个离散样本的连续灰度值只分成有限多的层次。均匀量化是把原图像灰度层次从最暗至最亮均匀分为有限个层次,如果采用不均匀分层就称为非均匀量化

17、。,(a) 量化 (b) 量化为8 bit,量化示意图,(a) 256级灰度图象 (b) 子图 (c) 子图对应的量化数据,图像量化实例,(a),(b),(c),对一幅图像,当量化级数一定时,采样点数对图像质量有着显著的影响。采样点数越多,图像质量越好;当采样点数减少时,图上的块状效应就逐渐明显。当图像的采样点数一定时,采用不同量化级数的图像质量也不一样。量化级数越多,图像质量越好,当量化级数越少时,图像质量越差。量化级数最小的极端情况就是二值图像,图像会出现假轮廓。,采样点数和量化级数的关系:,(a) 采样点256256时的图像 (b) 采样点6464时的图像(c) 采样点3232时的图像(

18、d) 采样点1616时的图像,采样点数与图像质量之间的关系,(a),(b),(c),(d),(a) 量化为2级的Lena图像 (b) 量化为16级的Lena图像(c) 量化为256级的Lena图像,量化级数与图像质量之间的关系,数字图像的基本类型,计算机一般采用两种方式存储静态图像:位映射(Bitmap),即位图存储模式;向量处理(Vector),也称矢量存储模式。 位图也称为栅格图像,是通过许多像素点表示一幅图像,每个像素具有颜色属性和位置属性。矢量图只存储图像内容的轮廓部分,而不是存储图像数据的每一点。,二值图像,二值图像也叫黑白图像,就是图像像素只存在0,1两个值。,二进制的lenna图

19、像,灰度图像,灰度图像是包含灰度级的图像,如64级,256级等。如当像素灰度级用8 bit表示时,每个像素的取值就是256种灰度中的一种,即每个像素的灰度值为0到255中的一个。通常,用0表示黑,255表示白,从0到255亮度逐渐增加。,索引图像,索引图像把像素值直接作为索引颜色的序号。根据索引颜色的序号就可以找到该像素的实际颜色。当把索引图像读入计算机时,索引颜色将被存储到调色板中。调色板是包含不同颜色的颜色表,每种颜色以红,绿,蓝三种颜色的组合来表示。调色板的单元个数是与图像的颜色数一致的。256色图像有256个索引颜色,相应的调色板就有256个单元。,RGB彩色图像,RGB图像是一类图像

20、的总称。这类图像不使用单独的调色板,每一个像素的颜色由存储在相应位置的红、绿、蓝颜色分量共同决定。RGB图像是24位图像,红、绿、蓝分量分别占用8位,理论上可以包含16M种不同的颜色。,数字图像的基本文件格式,每一种图像文件均有一个文件头, 在文件头之后才是图像数据。文件头的内容一般包括文件类型、文件制作者、制作时间、版本号、文件大小等内容。各种图像文件的制作还涉及到图像文件的压缩方式和存储效率等。常用的图像文件存储格式主要有BMP文件、JPG文件、PCX文件、TIFF文件以及GIF文件等。,常用图像文件格式,.BMP 位图文件(bitmap),数据量大1 位:2值黑白 4 位:16 灰度或1

21、6色8 位:256灰度或256色16位:65536色(增强色)24位:1677万色(真彩色),常用图像文件格式,.JPG 用JPEG标准压缩的图像文件,数据量最小.GIF 无损压缩,1/2 1/4, CompuServe.TIF 工业标准,最复杂,最灵活.PSD Adobe公司Photoshop用.PCX 最早支持彩色图像的,256色,不支持真彩色,图像的文件格式,1. GIF 格式 (Graphics Interchange Format) GIF 是美国 Compu Serve 公司于1987年制定的格式,目的是能够在不同平台上交流使用,是 Internet上WWW中的重要文件格式之一,支

22、持64000像素的图像。,2. BMP 格式 (Bitmap) BMP 是一种与设备无关的图像文件格式,它是随微软 Windows 软件推出的一种位图形式的图像格式, Windows 软件的图像资源多数以该格式存储。 其文件分三部分:文件头、信息头和图像数据。文件头用来说明文件类型、实际图像数据长度和起始位置、分辨率等, 信息头是彩色映射。,3. PCX 格式 PCX 是 E-soft 公司为其图像处理软件 Paint Brush (画笔)配套推出的一个图像格式,是经过压缩的格式, 多数位图文件都能转换成这种格式。它包括三类文件: 各种单色的PCX 文件,不超过16色的彩色 PCX 文件, 共

23、有256种颜色的 PCX文件。大多数图像编辑软件均能处理这种格式的文件,各种扫描仪的输出也能生成 PCX文件。,4. TIFF 格式 (Tagged Image File Format) TIFF 也缩写成 TIF 它是由原 Aldus 和微软公司合作开发的用于扫描仪和桌面出版系统的文件格式,称为标记图像文件格式。其有压缩和不压缩的两种格式,以其灵活而获得青睐,多数应用程序都支持这种格式。 . JPG 格式 这是一种较新的格式,称为JPEG 文件交换格式,采用JPEG 方法压缩而成,其压缩比高,并可在压缩比和图像质量之间平衡,用最经济的存储空间得到较好的图像质量。,图形图像的获取与输入,.用图

24、形工具软件生成 利用 Paint Brush、Photoshop等图形软件去创作所需要的图形,它们都具有大致相同的功能,能用鼠标(或数字化仪)描绘各种形状的图形,并可填色、填图案、 变形、剪切、粘贴, 也可标注各种文字符号。用这种方法可以很方便地生成一些小型简单的画面,如图案、 标志等,设计修改都很方便,成本较低。,. 图像扫描 图像扫描仪主要应用在图纸之类平面的图像采集的场合, 根据其外形和产生图像的方式通常将其分为手持式、平板式和滚筒式等三种类型,根据其对颜色的辨别能力又分为单色、灰度和彩色三种。 滚筒式扫描仪多用于输入较大尺寸的图像。平板式扫描仪带有感应窗的自动移动装置,只需将扫描对象平

25、放在扫描面板上即可,是投资较低并能获得较高质量图像的较理想的选择。手持式扫描仪造价低廉,可直接对书本杂志上的图像进行扫描,而不必将图像裁剪下来,因而在 MPC 中使用较多。,.数字摄像输入 利用电视摄像机或数字式照相机,可把照片、艺术作品甚至实际场景输入计算机来产生一幅数字图像。这种方式与普通照相机、录像机相比,省去了胶片及冲洗过程,可以直接将采集的数字图像信息保存在内部存储器中。 摄像机与扫描仪的差别是:扫描仪只能输入平面的图像,而摄像机可以捕获三维空间的景物,即使是输入平面的图像,速度也比扫描仪快。扫描仪只能输入静止的图像,而摄像机既可输入静止图像,也能输入活动图像。 ,摄像机的基本组成框

26、图,单 CCD原理单 CCD在感光点上加上滤镜,只能接收三原色的其中一种色彩,3 CCD原理 3 CCD机以三块 CCD分别接收红、绿、蓝三原色接收量是单 CCD的三倍,按摄像机质量的不同,广播级业务级家用级,按电视节目制作,ESP用摄像机EFP用摄像机ENG用摄像机,按摄像器件,摄像管摄像机CCD电子耦合器件摄像机按CCD数量可分为:单片、三片式摄像机 。,按信号方式,模拟摄像机数字摄像机。,.利用录像机和电视机捕获图像 可以对录像机和电视机的视频输出进行采集,通过视频卡和有关软件生成数字图像。 .视频抓帧 打开“超级解霸五”播放器,播放 VCD 影碟;如果播放到某一精彩画面,立即按下暂停键

27、,让画面静止;然后再点击有照相机外形的按钮,出现一个对话框,提示将此时的图像画面存盘;我们可以在对话框中指明存储文件名及存盘路径, 按“OK ”即可将这一精彩镜头抓取存盘,此图像文件以后可让你随时调用。 ,.从图片库中获取 现有的图片大多都以光盘形式保存,收集了世界上各地著名摄影师所拍摄的各类图片,主要包括:自然风光、花鸟鱼虫、风土人情、城市景观、边框水纹、装饰按钮等,供你根据不同场合选择使用。 ,图像的存储与输出,.图像的存储 存储器是保存图像数据和处理过程中的有关数据的装置。由于一般图像的数据量是很大的,所以作为图像处理系统的辅助存储器既要求容量足够大,也要求有相当快的速度磁盘作为图像文件的存储器在速度和容量方面大都能基本满足要求。采用大容量的硬盘作为图像处理系统的存储装置是很适合的。 光盘存储容量可达600多兆字节,它在可保存性方面极其优越,是保存图像数据的理想介质,特别适用于一些具有容量大、保存期长等特点的用途,例如图像数据库等。,. 图像的输出设备 图像输出设备是指在图像处理系统中将已输入计算机的数字化图像(处理过或未处理过的)输出为清晰逼真的图像的设备。这些输出图像可以供分析、识别、 保存和使用。输出设备可分为在胶片基纸面等介质上记录输出的硬拷贝装置和仅仅显示输出的软拷贝装置。 常用的输出设备有打印机,绘图仪等。 ,Questions?,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号