《形状特征PPT分析课件.ppt》由会员分享,可在线阅读,更多相关《形状特征PPT分析课件.ppt(73页珍藏版)》请在三一办公上搜索。
1、形状特征,报告人:林云玫报告时间:2013.12.17,形状特征的描述,边缘检测,上下文形状描述符(shape context),1.形状特征的描述,二维图像中,形状通常被认为是一条封闭的轮廓曲线所包围的区域。形状的常用描述方法基于轮廓的:利用形状的外部边缘;基于区域的:利用形状的全部区域。,1.1基于轮廓的描述,1.1.1 基于空间域的描述1、链码2、周长3、斜率、曲率和角点4、基于多边形的特征参数1.1.2 基于变换域的描述5、傅里叶描述子6、小波轮廓描述符,1.链码,链码描述链码是一组的代码用来表示各边界点像素的坐标链码的优点有利于有关形状特征的计算有利于节省存储空间,1.链码,用于描述
2、曲线的方向链码法是由Freeman提出的,该方法采用曲线起始点的坐标和斜率(方向)来表示曲线。对于离散的数字图像而言,区域的边界轮廓可理解为相邻边界像素之间的单元连线逐段相连而成。对于图像某像素的8-邻域,把该像素和其8-邻域的各像素连线方向按八链码原理图所示进行编码,用0,1,2,3,4,5,6,7表示8个方向,这种代码称为方向码。,八链码原理图,八链码例子,八链码例子图为一条封闭曲线,若以s为起始点,按逆时针的方向编码,所构成的链码为556570700122333,若按顺时针方向编码,则得到链码与逆时针方向的编码不同。边界链码具有行进的方向性,在具体使用时必须加以注意。,八链码原理图,2.
3、周长,周长L是用相邻边缘点间距离之和来表示。采用不同的距离公式,周长L的计算不同。常用的有两种:1、欧式距离:在区域的边界像素中,设某像素与其水平或垂直方向上相邻边缘像素间的距离为1,倾斜方向上相邻边缘像素间的距离为。周长就是这些像素间距离的总和。这种方法计算的周长与实际周长相符,因而计算精度比较高。2、8邻域距离:累加边缘点数即可得到周长,这种方法与实际周长间有差异。,2.周长,根据这两种计算周长的方式,以上区域的周长分别是 和22。,3.斜率、曲率和角点,斜率(slope)能表示轮廓上各点的指向;曲率(curvature)是斜率的改变率,它描述了轮廓上各点沿轮廓方向变化的情况。在1个给定的
4、轮廓点,曲率的符号描述了轮廓在该点的凹凸性。如果曲率大于零,则曲线凹向朝着该点法线的正向。如果曲率小于零,则曲线凹向朝着该点法线的负向。曲率的局部极值点称为角点。,4.基于多边形的特征参数,多边形的特征参数主要有顶点数、凹点数、内角分布等。(a)多边形的顶点数、凹点数和凸点数 多边形的顶点数表明了多边形的复杂程度多边形的凹凸点比例反映了物体边界的齿状情况。(b)多边形的内角分布在(0,180)中的内角对应凸顶点分布在(180,360)中的内角对应凹顶点分布在180左右的内角对应平滑线或弧线等。,4.基于多边形的特征参数,(c)内角方差 多边形的内角方差反映了形状的规则程度等边多边形、矩形、圆的
5、内角方差为0。内角方差的计算公式如下:是内角均值,N是多边形的顶点数。,4.基于多边形的特征参数,(d)最小外接凸多边形、最大内接凸多边形、凹凸度 最小外接凸多边形指连接部分凸点形成的包含原图的凸多边形,最大内接凸多边形指连接部分凸点和凹点形成的包含在原图中的最大凸多边形。如下给出例子。,4.基于多边形的特征参数,凹凸度(concavo-convex)是反映物体形状凹凸程度的一个重要度量定义如下:其中,Sc是最小外接凸多边形的面积,Sr是最大内接凸多边形的面积。凸形的凹凸度为1,星形的凹度较大,凹凸度较小。利用凹凸度,可以识别物体的姿态,如飞禽类的飞、栖,走兽类的卧、站、奔跑等。,5.傅里叶描
6、述子,傅立叶描述子(FourierDescriptor,简称FD)表示单封闭曲线的形状特征.对轮廓的离散傅里叶变换表达可以作为定量描述轮廓形状的基础。基本思想傅立叶描述子的优点计算原理简单,描述清晰,具有由粗及精的特性等。,目标轮廓建模成一维序列s,对s进行一维傅立叶变换,得到傅立叶系数S,用S描述目标轮廓,5.傅里叶描述子,一个傅立叶描述子的构建包括两步:定义一种好的表示(representation)方法对轮廓曲线进行描述;采用傅立叶理论对该曲线进行变换。不同的表示方法有不同的特性,一个好的表示方法应该使最终获得的傅立叶描述子具有尺度、旋转、平移不变性及起始点的无关性。,5.傅里叶描述子,
7、将轮廓所在的XY平面与一个复平面UV重合。这样就可用复数u+jv的形式来表示给定轮廓上的每个点(x,y)而将XY平面中的曲线段转化为复平面上的1个序列,见下图。,5.傅里叶描述子,考虑1个由N点组成的封闭边界,从任1点开始绕边界1周就得到1个复数序列:s(k)的离散傅里叶变换是S(w)可称为边界的傅里叶描述,它的傅里叶反变换是:如果我们只利用S(w)的前M个系数,这样可得到s(k)的1个近似:,5.傅里叶描述子,傅立叶描述子序列S(w)反映了原曲线的形状特征,同时,由于傅立叶变换具有能量集中性,因此,少量的傅立叶描述子就可以重构出原曲线。下图给出1个由N=64个点组成的正方形轮廓以及取不同的M
8、值重建这个边界得到的 一些结果。,5.傅里叶描述子,总结少量的傅立叶系数就可以很好地描述轮廓特征。主要能量集中在了低频系数上,反映了轮廓曲线的整体形状轮廓的细节反映在了高频系数上。第1个傅立叶描述子(即直流量)为所有轮廓曲线上的点的x坐标和y坐标的均值(以复数形式表示),它即为轮廓的质心,给出了轮廓的位置信息。第2个傅立叶描述子给出了最能拟合所有轮廓点的圆的半径。,6.小波轮廓描述符,小波函数族,可如下定义,对给定的(轮廓)函数c(t),其小波变换系数为,而由小波变换系数重建c(t)的公式可写成:,其中m0。与截断系数时所需精度有关,6.小波轮廓描述符,如果设尺度函数,将上式右边第一项用 的线
9、性组合,来代替,则可将上式写为,根据小波变换的特点,上式右边第一项可以看作c(t)在2-m0尺度下的模糊草图,第二项则是对c(t)的细节充如果将 称为尺度系数,称 为小波系数,则所有系数组成与轮廓,c(t)对应的小渡轮廓描述符,6.小波轮廓描述符,小波轮廓描述符的基本性质(1)唯一性小波变换是一一对应的映射,所以一个给定的轮廓对应一组唯一的描述符反过来,一组描述符对应唯一的一个轮廓(2)可比较性对两个轮廓的描述矢量S1和S2,可以借助它们之间的内积d2=来定义它们之间的距离以判别相应轮廓的相似程度,即可在数学上对轮廓的相似程度进行定量比较,1.2.基于区域的描述,1、长轴和短轴2、区域面积3、
10、矩形度4、圆形度5、不变矩,1.2.1长轴和短轴,长轴是边界上相隔最远的2点之间的直接相连线段长度。与长轴垂直且最长的与边界的2个交点相交的线段叫边界的短轴。,1.2.2区域面积,区域面积描述了区域的大小。对于数字图像而言,区域的面积定义为区域中的像素点数。这个特征受尺寸、扭曲和缩放的影响,但是它具有旋转不变性。,1.2.3矩形度,矩形度定义为物体的面积A0与物体的最小外接矩形(MER)的面积AR之比,即 R=A0/AR。矩形度反映了物体在最小外界矩形中的填充程度,矩形的矩形度为1,圆的矩 形度为pi/4,三角形的矩形度为0.5。其它形状,矩形度的取值范围为(0,1)。利用矩形度可以区分矩形、
11、圆形和不规则形状。,1.2.4圆形度,圆形度反映了物体接近圆形的程度,也称作区域的紧凑性(Compactness),定义为4倍的区域面积A与周长P的平方之比(有的文献定义为周长的平方与4倍的区域面积之比),即:在相同面积的情况下,具有光滑边界的形状边界较短,圆形度较大,表明形状较密集。随着边界凹凸变化程度的增加,周长P相应增加,圆形度随之减小。圆的圆形度C=1,正方形的圆形度C=pi/4。,1.2.5不变矩,矩为一种线性特征,可用来对区域进行描述。对于二维连续函数f(x,y),其(i+j)阶矩定义为,由单值性定理(Uniqueness)可知:若f(x,y)为分段连续函数且在x-y平面内仅有有限
12、非0值部分,则存在各阶矩,并且矩构成的序列,M ij 由f(x,y)唯一确定;反之,序列,Mij也唯一确定f(x,y)。图像函数为满足上述条件的函数,因此存在各阶矩。,定义离散形式的图像(i+j)阶矩为:,可求得如下0阶和1阶矩:,1.2.5不变矩,它们分别代表了图像中的目标的总质量,绕x轴的1阶矩,绕y轴的1阶矩。由0阶和1阶矩我们可求得图像目标的质心:,定义图像的中心矩为:,则0-3阶中心矩可按如下公式计算:,1.2.5不变矩,1.2.5不变矩,定义归一化中心矩为:,下面定义的7个不变矩具有平移、尺度、旋转不变性,称为Hu矩。,8HuM.K.Visualpatternrecognition
13、bymomentinvariants.IRETrans.Info.Theory.1962,8:179-187.此文献证明了不变矩具有平移、尺度、旋转不变性,2.边缘检测,边缘存在于目标与背景目标与目标区域与区域之间边缘是图像最基本的特征之一,为人们描述或识别目标以及解释图像提供了一个重要的特征参数。边缘蕴含了图像丰富的内在信息方向阶越性质形状等,滤波:降低噪声增强:使邻域(或局部)强度值有显著变化的点突显出来。边缘增强一般是通过计算梯度幅值来完成的。检测:确定哪些点是边缘点。最简单的边缘检测判据是梯度幅值阈值判据。定位:确定边缘位置在边缘检测算法中,前三个步骤用得十分普遍。这是因为大多数场合下
14、,仅仅需要边缘检测器指出边缘出现在图像某一像素点的附近,而没有必要指出边缘的精确位置或方向。,线性边缘检测,The basic idea is to detect the difference of intensity.,symmetric difference(对称差分)has less space resolution(空间分辨率)than forward difference.,在图像没有噪声的情况下,都能够比较准确的检测出图像的边缘。Roberts算子受噪声的影响最大,抗噪能力,三种算子的对比,(1)Roberts边缘检测算子检测定位精度比较高,但对噪声敏感。(2)Sobel边缘检测算
15、子较好的边缘效果对噪声具有平滑作用,减小了对噪声的敏感性。(3)Prewitt边缘检测算子类似于Sobel算子它同样对噪声有平滑作用。但它检测出的边缘比较粗,定位精度比较低,容易损失如角点这样的边缘信息。在检测定位精度要求不是很高的情况下,Sobel算子是比较常用的边缘检测算子。,经典的边缘检测方法各种形式的微分运算对噪声的极度敏感把噪声当作边缘点检测出来真正的边缘而没有检测出来。对于有噪声图像来说,一种好的边缘检测方法应该具有良好的噪声抑制能力完备的边缘保持特性。,经典的边缘检测算子优点实现简单、运算速度快等,经典的边缘检测算子缺陷(1)实际边缘灰度与理想边缘灰度值间存在差异,这类算子可能检
16、测出多个边缘;(2)边缘存在的尺度范围各不相同,这类算子固定的大小不利于检测出不同尺度上的所有边缘;(3)对噪声都比较敏感。,在数字图像中,可用差分来近似微分运算,Laplacian算子的离散计算形式为:,Laplacian算子,原来的方向外,又增加了8个方向,共有16个方向上进行检测的模板,根据Laplacian算子的可靠性设定了适当的权向量。根据该估算模板,可以提高边缘检测的精度,由于合理地设置了参数,因而避免了一些伪边缘的提取。,改进的Laplacian算法,检测出来的边缘更清晰,而且也检测出原来所没有检测出的一些边缘。但是抗噪能力非常差,LOG边缘检测,LOG(Laplacian of
17、 Gaussian)算子先采用高斯函数作平滑滤波再采用拉普拉斯函数作边缘检测,5 5大小的LOG算子模板为:,Canny算子,对边缘检测方法的有效性进行评价,Canny提出了三个边缘检测准则:(1)最优检测:漏检真实边缘的概率和误检非边缘的概率都尽可能小(2)最优定位准则:检测到的边缘点的位置距离实际边缘点的位置最近,或者是由于噪声影响引起检测出的边缘偏离物体的真实边缘的程度最小;(3)检测点与边缘点一一对应:算子检测的边缘点与实际边缘点应该是一一对应的。,Canny算子,基于以上三个边缘检测准则,Canny设计了Canny边缘检测算子,用一维高斯函数平滑图像,计算梯度的幅值和方向,对幅值进行
18、非极大值抑制,双阈值法检测和连接边缘,在没有噪声的情况下检测效果优于经典边缘检测方法,Laplacian算子检测出的边缘较粗,而且存在大量的伪边缘。加入高斯白噪声,Laplacian算子、LOG算子和Canny算子,1)Laplacian算子容易丢失一部分边缘的方向信息,造成一些不连续的检测边缘抗噪声能力比较差(2)LOG算子尖锐边缘无法检测到高斯函数中方差参数的选则很关键,为取得更佳的效果应该对不同图像选择不同参数(3)Canny算子较强的噪声抑制能力采用了双阈值算法检测和连接边缘,边缘的连续性较好,三种算子的对比,3.上下文形状描述符(shape context),上下文形状描述符动机:如
19、何对物体形状进行有效表达,使得具有相似形状的图像中关键像素点(key points)之间能够匹配,从而达到形状相似度计算目的。,3.上下文形状描述符(shape context),所谓位于图像边界的像素点是这样的像素点:这些像素点灰度值与周围像素点灰度值存在较大差异。因此,可以用滤波算子来检测图像的边界信息,3.上下文形状描述符(shape context),3.上下文形状描述符(shape context),其原理:通过滤波算子,去寻找某个像素点与邻域像素点在横向或纵向上灰度变化是否超过了一定阈值,如果超过指定阈值,则该像素点是位于边界上的像素点,3.上下文形状描述符(shape conte
20、xt),步骤1:图像平滑以去除图像噪音 减少噪声响应,高斯算子对图像的平滑效果是最优的,二维高斯函数,对于一个3*3的高斯滤波算子,给定方差后,就可以通过如上公式来得到一个3*3的滤波算子矩阵,方差越大,表示中心像素点权重越大。,3.上下文形状描述符(shape context),步骤2:计算像素点的梯度,3.上下文形状描述符(shape context),步骤3:如下重置每个像素点梯度模的值,3.上下文形状描述符(shape context),步骤4:如下将每个极值点方向分别置为0、45、90和135度等四个方向,3.上下文形状描述符(shape context),步骤5:对每个潜在极值点,
21、按照其方向,检查其方向上的相邻像素点是否是极值点,如果不是,置其值为零。否则保留该点不动,3.上下文形状描述符(shape context),步骤6:双阈值法检测和连接边缘:对非极大值抑制图像取高低两个阈值Tl和T2,其中T1T2,高阈值用来提取对比度相对较强的边缘点,得到强边缘图像n1,含有很少的假边缘,但是有间断,T1越高,得到的边缘越准确,丢失的信息就越多,T1越低,得到的目标边缘越精细,但混杂的伪边缘信息越多.通过低阈值T2获得的图像n2含有大量的细节,T2越小,保留的边缘信息就越多,边缘越连续,双阈值法就是在n2中寻找与n1的强边缘点相连的像素点,并把它们不断地连接,直到n1连通为止
22、。,阈值的选取:高阈值T1:设图像的总像素数为N,非边缘点的数目占总图像像素数目的比例为Hr,根据梯度直方图从低到高逐步累加图像点数目,当累加数目达到N*Hr时,对应的图像梯度值为高阈值。一般Hr的取值为0.7或0.8。低阈值T2:为T2=T1*lr,其中lr是一个比例因子a。,3.上下文形状描述符(shape context),3.上下文形状描述符(shape context),某个像素点Shape Context的提取,对于指定的像素点,以该像素点为中心,进行极坐标变换。,对于得到的极坐标变换结果,将其平均划分出8个方向,每个方向上按照log2r步长划分为4份。这样,整个空间就被分为32个
23、区域(32个bin),每个bin所占空间从里向外增大,这是因为对该点具有鉴别力的点离得最近的点,离该点越远的点对该点的鉴别力越弱。,3.上下文形状描述符(shape context),对于指定的像素点,提取32Bin信息。,某个像素点Shape Context的提取,对于轮廓上的一给定点pi,其属性用以pi点为中心的坐标系的32个区域(bin)中落入每个区域的像素点个数wi(k)来描述,按以下公式计算:Wi(k)=#qj!=pi:qjbin(k)其中k取值为1、2,32,其中,qj为落入第k个区域中的不同于pi点的轮廓上的其余点。这样,如果某个形状的边界点个数为n,每边界点均有32个bin值,
24、则一共需要32*n个属性来描述这个形状。这32*n称呼为该形状的shape context,3.上下文形状描述符(shape context),观察图(a)和图(b)中菱形点和方块点,他们的形状上下文(d)、(e)图,基本上一致,而三角形点的形状上下文就有不同,这和我们实际的观察基本上是一致的。,3.上下文形状描述符(shape context),对于两个形状I,P,计算它们之间每个样本点(如g,h)之间的差别,即形状上下文的差别在得到每个点之间的差别以后,可以形成一个代价矩阵cost,然后运行一个最优匹配算法(如匈牙利算法等)找个一个最优匹配,使整个代价最小,最后基于这个最优匹配,得到整个形状代价,这个可以作为两个形状之间的差别衡量,代价越小,形状越相似。形状代价如下:,3.上下文形状描述符(shape context),不过到这里还只是找到一个对应关系而已,需要进一步用一个变换 T 来衡量形状之间的转变,所以,最后的形状距离可以用估计的变换来表示,如下:最后基于这个形状距离可以基本衡量两个物体形状之间的区别,进一步进行物体识别方面的工作。,http:/,