《《数字图像处理》第2章.ppt》由会员分享,可在线阅读,更多相关《《数字图像处理》第2章.ppt(75页珍藏版)》请在三一办公上搜索。
1、数字图像处理,第二章 数字图像处理基础 视觉感知要素 图像感知和获取 图像取样和量化 数字图像的类型 数字图像文件格式简介 象素间的一些基本关系 线性和非线性操作,2.1 视觉感知要素,眼睛的构造:(人眼包含有三层膜)眼角膜与巩膜外壳脉络膜(前面睫状体 虹膜 晶状体)视网膜(视网膜表面的分离光 接收器提供图案视觉,分为锥状体、杆状体)锥状体:位于视网膜中间,对颜色 灵敏度高,分辨图像细节.白昼视觉杆状体:分布在视网膜表面,无彩 色感觉,在低照明度下对 图像较敏感,用来给出 视野内一般的总体图像.夜视觉,2.1 视觉感知要素,视网膜上锥状体和杆状体的分布,晶状体成像 晶状体成像与普通光学透镜原理
2、类似,但晶状体可以根据需要调整曲率半径,分别对远处和近处的物体聚焦.,2.1 视觉感知要素,人眼对不同亮度的适应 亮度适应范围:1010量级 10-6mL 到 104mL 实验表明,主观亮度是进入 眼睛亮度的对数函数 亮度适应现象:人眼并不能同时在整个范围内 工作,而是利用改变整个灵敏 度来完成这一大变动的.亮度适应级:视觉系统当前 的灵敏度级别,2.1 视觉感知要素,人眼辨别光强度变化的能力 韦伯比 可辨别增量的50%典型实验 图2.5 用于描述亮度辨别特性的基本实验 图2.6 作为强度函数的典型韦伯比 当背景光保持恒定时,改变其他光源亮度,从不能察觉到总可以察觉之间变化,一般观察者可以辨别
3、12到24级不同强度的变化.,2.1 视觉感知要素,人眼感觉亮度并不是简单的强度函数 例1:马赫带(毛边带),2.1 视觉感知要素,例2:背景变亮,相同强度的方块变暗,2.1 视觉感知要素,视觉错觉,2.1 视觉感知要素,电磁波谱可以用波长()、频率()或能量来描述 c 光速 h 普朗克常量,2.2 光和电磁波谱,2.2 光和电磁波谱,电磁波是能量的一种,任何有能量的物体,都会释放电磁波。,人从物体感受的颜色由物体反射光的性质决定 若所有反射的可见光波长均衡,则物体显示白色 有颜色的物体是因为吸收了其他波长的大部分能量,从而反射某段波长范围的光。没有颜色的光叫单色光,灰度级通常用来描述单色光的
4、强度,其范围从黑到灰,最后到白。在原理上,如果可以开发出一种传感器,能够检测由一种电磁波谱发射的能量,就可以在那一段波长上对感兴趣的物体成像。,2.2 光和电磁波谱,灰度和色彩,彩色模型:RGB 加色法CMY,CMYK 减色法HSB(色泽,饱和度,明亮度),2.2 光和电磁波谱,2.3 图像感知和获取,我们感兴趣的各类图像都是由“照射”源和形成图像的“场景”元素对光能的反射或吸收相结合而产生的。,2.3 图像感知和获取,把照射量变为数字图像的传感器装置,2.3 图像感知和获取,用单个传感器获取图像,通过x-y方向二维扫描,形成二维图像。,2.3 图像感知和获取,用带状传感器获取图像,只需一维扫
5、描,就能形成二维图像。,2.3 图像感知和获取,用传感器阵列获取图像,不需要扫描,就能形成二维图像。,图像形成模型,2.3 图像感知和获取,2.3 图像感知和获取,图像形成模型 在特定坐标(x,y)处,通过传感器转换获得的f值为一正的标量。函数f(x,y)由(1)入射到观察场景的光源总量(2)场景中物体反射光的总量组成。单色图像在任何坐标(x0,y0)处的强度为图像在该处的灰度级 lf(x0,y0),显然有 可以规定灰度级范围为0,L-1,1,2.4 图像取样和量化,获取图像的目标是从感知的数据中产生数字图像,但多数传感器的输出是连续的电压波形,因此需要把连续的感知数据转换为数字形式。这一过程
6、由图像的取样与量化来完成。数字化坐标值称为取样,数字化幅度值称为量化。,2.4 图像取样和量化,2.4 图像取样和量化,2.4 图像取样和量化,黑白图像,灰度图像,彩色图像,2.4 图像取样和量化,黑白图像的数字化,2.4 图像取样和量化,灰度图像的数字化,2.4 图像取样和量化,彩色图像的数字化,2.4 图像取样和量化,图像的非均匀采样:在灰度级变化尖锐的区域,用细腻的采样,在灰度级比较平滑的区域,用粗糙的采样。图像的非均匀量化:非均匀量化是依据一幅图像具体的灰度值分布的概率密度函数,按总的量化误差最小的原则来进行量化.具体做法是对图像中像素灰度值频繁出现的灰度值范围,量化间隔取小一些,而对
7、那些像素灰度值极少出现的范围,则量化间隔取大一些.由于图像灰度值的概率分布函数因图像不同而异,所以不可能找到可用于所有图像的最佳非等间隔量化方法.,2.4 图像取样和量化,数字图像的表示 本书中表示数字图像所用坐标的约定 M,N必须为正数,灰度 级取值为2的整数次幂 L=2k,为k位图像 图像存储量 b=M*N*k,2.4 图像取样和量化,数字图像的表示,2.4 图像取样和量化,空间分辨率:由取样值决定,图像中可辨别的最小细节。一般用单位长度上采样的像素数目或单位长度上的线对数目表示。灰度级分辨率:灰度级中可分辨的最小变化。一般用灰度级或比特数表示。当没有必要对涉及像素的物理分辨率进行实际度量
8、和在原始场景中分析细节等级时,通常把大小为MN,灰度为L级的数字图像称为空间分辨率为MN像素,灰度级为L级的数字图像。,2.4 图像取样和量化,灰度级为256,空间像素从10241024到3232的一组图像,2.4 图像取样和量化,所有图像放大到10241024,2.4 图像取样和量化,灰度级分别为256,128,64,32的数字图像,256,128,64,32,16,8,2,4,灰度级从256到2的数字图像,2.4 图像取样和量化,同时改变N(空间分辨率NxN)和k(2k级灰度)值,face,cameraman,crowd,等偏爱线,2.4 图像取样和量化,同时改变N和k值,2.4 图像取样
9、和量化,同时改变N和k值,2.4 图像取样和量化,同时改变N和k值,总结:A、图像质量一般随N和k的增加而增加。在极少数情况下对固定的N,减小k能改进质量。最有可能的原因是减小k常能增加图像的视觉反差。B、对具有大量细节的图像只需很少的灰度级数就可较好地表示。C、Nk为常数的图像主观看起来可以有较大的差异。,2.4 图像取样和量化,采样和量化的原则,当限定数字图像的大小时,为了得到质量较好的图像,一般可采用如下原则:(1)对缓变的图像,应该细量化,粗采样,以避免假轮廓。(2)对细节丰富的图像,应细采样,粗量化,以避免模糊。,2.4 图像取样和量化,2.4 图像取样和量化,香农定理:如果一个函数
10、以等于或大于其最高频率的2倍取样,那么就能从取样完全复原原函数。,如果函数被亚取样,则混淆的现象将恶化取样。,摩尔纹,采用高分辨率传感器时未出现摩尔纹,2.4 图像取样和量化,图像的放大与收缩 最近邻域内插方法 在原图像上寻找最靠近的像 素并把它的灰度值赋给栅格上 的新像素。双线性内插方法,2.4 图像取样和量化,用最近邻域内插法(上一行)和双线性内插法(下一行)得到的放大图像 分别将128128,6464,3232放大到10241024,数字图像类型,静态图像可分为矢量(Vector)图和位图(Bitmap),位图也称为栅格图像。,1 矢量图(1)矢量图的表示方法 是用一系列绘图指令来表示一
11、幅图。这种方法的本质是用数学(更准确地说是几何学)公式描述一幅图像。,(2)矢量图的优点:A、它的文件数据量很小;B、图像质量与分辨率无关,这意味着无论将图像放大或缩小了多少次,图像总是以显示设备允许的最大清晰度显示。,数字图像类型,(3)矢量图的缺点:不易制作色调丰富或色彩变化太多的图像,绘出来的图像不是很逼真,同时也不易在不同的软件间交换文件。,数字图像类型,2 位图 是通过许多像素点表示一幅图像,每个像素具有颜色属性和位置属性。位图的优缺点:与矢量图正好相反。位图又可以分成如下四种:二值图像(binary image)、灰度图像(gray-scale image)、索引颜色图像(inde
12、x color image)和真彩色图像(true color image)。,数字图像类型,(1)二值图像 只有黑白两种颜色。,数字图像类型,(2)灰度图像 在灰度图像中,像素灰度级一般用8 bit表示,这样每个像素灰度值都是介于黑色(0)和白色(255)之间的256(28=256)种灰度中的一种。,数字图像类型,数字图像类型,(3)真彩色图像 每一个像素由红、绿和蓝三个字节组成,每个字节为8 bit,表示对应颜色分量的0到255之间的某亮度值,这三个字节组合可以产生1670万种不同的颜色。,数字图像类型,(4)索引图像 在RGB真彩色图像出现之前,由于技术上的原因,计算机在处理时并没有达到
13、每像素24位的真彩色水平,为此人们创造了索引颜色(于调色板)。在索引颜色(也称为映射颜色)模式下,颜色都是预先定义的,并且可供选用的一组颜色也很有限,索引颜色的图像最多只能显示256种颜色。,数字图像类型,图像文件格式,数字图像有多种存储格式,每种格式一般由不同的开发商支持。因此,要进行图像处理,必须了解图像文件的格式,即图像文件的数据构成。每一种图像文件均有一个文件头,在文件头之后才是图像数据。,1 BMP图像文件格式,第一部分为位图文件头BITMAPFILEHEADER,它是一个结构体,其定义如下:typedef struct tagBITMAPFILEHEADER WORD bfType
14、;/文件类型,在WINDOWS系统中为“BM”DWORD bfSize;/文件大小 WORD bfReserved1;/保留字 WORD bfReserved2;/保留字 DWORD bfOffBits;/从文件头到实际位图的偏移字节数 BITMAPFILEHEADER;这个结构的长度是固定的,为14个字节(WORD为无符号16位二进制整数,DWORD为无符号32位二进制整数)。,第二部分为位图信息头BITMAPINFOHEADER,也是一个结构:typedef struct tagBITMAPINFOHEADER DWORD biSize;/该结构的长度,为40字节 LONG biWidth
15、;/图像的宽度,单位为像素 LONG biHeight;/图像的高度,单位为像素 WORD biPlanes;/位平面数,必须是1 WORD biBitCount;/指定颜色数,1为二值,4为16色,8为 256 色,16、24、32为真彩色 DWORD biCompression;/指定是否压缩,有效的值为BI_RGB,BI_RLE8,BI_RLE16,BI_BITFIELDS DWORD biSizeImage;/实际的位图数据占用的字节数 LONG biXPelsPerMeter;/目标设备水平分辨率 LONG biYPelsPerMeter;/目标设别垂直分辨率,DWORD biClr
16、Used;/实际使用的颜色数,若该值为0,则 使用的颜色数为2的biBitCount次方种。DWORD biClrImportant;/图像中重要的颜色数,若该值为0,则所有的颜色都是重要的。BITMAPINFOHEADER;其中,biCompression的有效值为BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS,这都是一些Windows定义好的常量。由于RLE4和RLE8的压缩格式用的不多,今后仅讨论biCompression的有效值为BI_RGB,即不压缩的情况。,第三部分为调色板(Palette),只是对那些需要调色板的位图文件而言的。调色板实际上是一个数组,共有
17、biClrUsed个元素(如果该值为零,则有2的biBitCount次方个元素)。数组中每个元素的类型是一个RGBQUAD结构,占4个字节,其定义如下:,typedef struct tagRGBQUAD BYTE rgbBlue;/该颜色的蓝色分量 BYTE rgbGreen;/该颜色的绿色分量 BYTE rgbRed;/该颜色的红色分量 BYTE rgbReserved;/保留值 RGBQUAD;,第四部分就是实际的图像数据。对于用到调色板的位图,图像数据就是该像素颜色在调色板中的索引值,对于真彩色图像,图像数据就是实际的R、G、B值。下面就2色、16色、256色和真彩色位图分别介绍。对于
18、2色位图,用1位就可以表示该像素的颜色(一般0表示黑,1表示白),所以一个字节可以表示8个像素。对于16色位图,用4位可以表示一个像素的颜色,所以一个字节可以表示2个像素。对于256色位图,一个字节刚好可以表示1个像素。,下面两点请读者注意:(1)每一行的字节数必须是4的整数倍,如果不是,则需要补齐。(2)BMP文件的数据存放是从下到上,从左到右的。也就是说,从文件中最先读到的是图像最下面一行的左边第一个像素,然后是左边第二个像素,接下来是倒数第二行左边第一个像素,左边第二个像素。依次类推,最后得到的是最上面一行的最右边的一个像素。DIB(Device Independent Bitmap)图
19、像格式是设备无关位图文件,描述图像的能力基本与BMP相同,并且能运行于多种硬件平台,只是文件较大。,2.TIF图像文件格式 标记图像文件格式TIF(Tag Image File Format),它是现存图像文件格式中最复杂的一种,它提供存储各种信息的完备的手段,可以存储专门的信息而不违反格式宗旨,是目前流行的图像文件交换标准之一。,3.GIF图像文件格式 CompuServe开发的图形交换文件格式GIF(Graphics Interchange Format),目的是在不同的系统平台上交流和传输图像。它是在Web及其他联机服务上常用的一种文件格式,用于超文本标记语言(HTML)文档中的索引颜色
20、图像。,图像文件格式,4.JPEG图像格式 JPEG(Joint Photographers Experts Group)即联合图像专家组,是由ISO和CCITT为静态图像所建立的第一个国际数字图像压缩标准,主要是为了解决专业摄影师所遇到的图像信息过于庞大的问题。由于JPEG的高压缩比和良好的图像质量,使得它广泛应用于多媒体和网络程序中。JPEG和GIF成为HTML语法选用的图像格式。,图像文件格式,2.5 像素间的一些基本关系,像素p,其坐标为(x,y)的邻居,2.5 像素间的一些基本关系,相邻像素 对于像素p,其坐标为(x,y)4邻域(x+1,y),(x-1,y),(x,y+1),(x,y
21、-1)N4(p)对角邻域(x+1,y+1),(x+1,y-1),(x-1,y+1),(x-1,y-1)ND(p)8邻域 N4(p)+ND(p)N8(p),4邻域,对角邻域,8邻域,2.5 像素间的一些基本关系,像素的连通性-像素的连通性这个基本概念,可用来简化许多其它数字图像概念 的定义,如区域、边界等;-为确定两个像素是否连通,必须看它们是否相邻以及它们的灰度 值是否满足特定的相似性准则(如灰度值是否相等)。令V是用于定义邻接性的灰度值集合,为使具有V中数值的两个像素p 和q是邻接的,则它们的邻接性需符合以下三种类型之一:(1)4邻接:如果q在N4(p)集中;(2)8邻接:如果q在N8(p)
22、集中;(3)m邻接(混合邻接):如果(I)q在N4(p)中,或者(II)q在ND(p)中,且集合N4(p)N4(q)中像素灰度值均不是V中的值。,2.5 像素间的一些基本关系,m邻接可以消除8邻接所带来的二义性,像素安排(b)中心像素的8邻接像素(c)m邻接(虚线表示两像素之间是8邻接的)(虚线表示两像素 之间是m邻接的),p,q1,p,q1,q2,q2,2.5 像素间的一些基本关系,对于两个图像子集S1和S2,如果S1中的某些像素与S2中的某些像素相邻,则称S1和S2是邻接的。,根据邻接性情况,S1与S2的邻接可以分为4邻接,8邻接和m邻接,2.5 像素间的一些基本关系,像素p(x,y)到像
23、素q(s,t)的通路(path),满足:存在特定的像素序列(x0,y0),(x1,y1),(xn,yn),其中(x0,y0)=(x,y),(xn,yn)=(s,t),且像素(xi,yi)和(xi-1,yi-1)(对于1in)是邻接的。称n是通路的长度。若(x0,y0)=(xn,yn),则通路是闭合通路。,m通路,8通路,根据邻接性情况,通路可以分为4通路,8通路和m通路,随堂练习:以下p-q通路各是什么通路?,2.5 像素间的一些基本关系,8通路,m通路,4通路,8邻接,有非m邻接,全为m邻接,可以仅通过4邻接连通,2.5 像素间的一些基本关系,令S表示一幅图像中的像素子集,两个像素p和q在S
24、中是连通的指的是,存在一条全部由在S中的像素组成的p、q之间的通路。对于S中的任何像素p,S中连通到该像素的像素集叫做S的连通分量(connected component)。如果S仅有一个连通分量,则集合S叫做连通集。令R是图像中的像素子集,若R是连通集,则称R为一个区域region。一个区域R的边界boundary(也称为边缘border或轮廓contour)是指R中一些像素的集合,这些像素都具有一个或多个不在R中的邻点。如果R是整幅图像,则边界定义为由图像第一行、第一列和最后一行、最后一列组成。正常情况下,区域指一幅图像的子集,并包括区域的边缘。,2.5 像素间的一些基本关系,距离度量:对
25、于像素p,q和z,其坐标分别为(x,y),(s,t)和(v,w),如果:D(p,q)0 D(p,q)=0,当且仅当p=qD(p,q)=D(q,p)D(p,z)D(p,q)+D(q,z)则D是一个距离函数或度量.欧氏距离:De(p,q)=(x-s)2+(y-t)21/2(距离小于等于r的像素形成中心在(x,y)的圆)D4距离(城市街区距离):D4(p,q)=|x-s|+|y-t|(距离小于等于r的像素形成中心在(x,y)的菱形)D8距离(棋盘距离):D8(p,q)=max(|x-s|,|y-t|)(距离小于等于r的像素形成中心在(x,y)的方形),随堂练习:求下列两点间的欧氏距离、城区距离和棋盘距离。,2.5 像素间的一些基本关系,5,7,4,2.5 像素间的一些基本关系,基于像素的图像操作 两幅图像的算术和逻辑操作,常定义为图像中对应像素的操作。,令H是一种算子,其输入和输出都是图像,如果对于任何两幅图像f和g及其任何两个标量a和b有如下关系,则称H为线性算子:H(af+bg)=aH(f)+bH(g)即对两幅图像的和应用线性算子等同于分别对图像应用该算子并各自与适当的常数相乘,然后将结果相加.不满足上式关系的算子称为非线性算子。,2.6 线性和非线性操作,本章作业:课后 2.2,2.5,2.9,2.11,2.12,2.15,2.16,2.17,2.19,