《模式识别第八章实例教学.ppt》由会员分享,可在线阅读,更多相关《模式识别第八章实例教学.ppt(58页珍藏版)》请在三一办公上搜索。
1、第八章 实例教学,8.1 应用统计决策的肤色提取 图像基础知识,HSI表色模型面向彩色处理的最常用的模型,符合人类的视觉感受。H(Hue)色调(色相),表明物体是什么颜色。S(Saturation)饱和度,表明该种颜色的浓淡。I(Intensity)亮度,与图像的彩色信息无关。RGB模型与HSI模型可以相互转换。,样本获取,原始图像,H分量 S分量 I分量由于H分量较好的区分了肤色与背景,因此选H分量图像中的像素点作为样本。,样本学习,H分量 H分量的二值化图皮肤点数的先验概率:P(1)=是皮肤的像素点数/所有像素点数=7.99%非皮肤点数的先验概率:P(2)=不是皮肤的像素点数/所有像素点数
2、=92.01%,(1)计算先验概率:图像二值化,为1的是皮肤,为0的是背景。,(2)计算类条件概率密度:计算H分量图像中皮肤区域的直方图,就是皮肤的类条件概率密度;计算H分量图像中非皮肤区域的直方图,就是非皮肤的类条件概率密度。,非皮肤的类条件概率密度 皮肤的类条件概率密度 横坐标是像素点可能的灰度值(将灰度量化成了8等分),纵坐标是相应区域中灰度值为横坐标值的像素点数。P(x|1):0.9855 0.0143 0 0 0 0 0 0.0002 P(x|2):0.0790 0.7820 0.0742 0.0192 0.0199 0.0074 0.0072 0.0108,模式分类,输入下图,用最
3、小误判概率准则和最小损失准则判决判断每个像素点是否是皮肤。,待分类的图像,H分量,a)最小误判概率准则判断每个像素点是否使皮肤。两类问题的Bayes最小误判概率准则为如果,则判,否则判,x为每个像素点的灰度值,若该点属于皮肤,置位1;若不是皮肤,置位0,得到下图。,最小误判概率准则的识别结果,b)最小损失准则,11=0,12=10,21=1,22=0 如果,则判,否则判。x为每个像素点的灰度值,若该点属于皮肤,置位1;若不是皮肤,置位0,得到下图。,可以看出最小损失准则得到的皮肤更完整,漏检率下降,但是将更多非皮肤点误判为皮肤,虚警率增加。,最小损失准则的识别结果,8.2 车牌识别,车牌相关知
4、识,英文字母中的I和O一般避而不用,以免和数字中的1和0混淆。车牌大小为440*140mm。汉字字体为黑体,数字和字母字体为国家公安部门开发的特殊字体。,8.2.2 图像采集,车牌识别预处理(1)字符分割,(2)字符细化,1.特征选择与提取,(1)特征空间向量的选择 由于车牌中字母和数字都有特定的字体,且作为汽车的“身份证”,车牌制作过程严谨,相同字符形态区别不大,他们的差异性和共同点都很明显。基于上节描述的设计准则,综合考虑了提取特征的编程复杂度和特征对不同字符的区分度,本系统分别从字符的形态、结构、笔画特点出发,采用了4个类别共10个特征值作为判断的矢量依据(特征提取时均以细化后图像为基础
5、)。字符的重心判断:字符重心位于上方/下方,分别计算字符上下半区的像素数目,如果其差值在一个固定的小范围内(试验得出此差值在0-20像素内为最佳),则该特征值记为2,上方偏多记为1,下方偏多记为3;字符重心位于左方/右方,分别计算字符左右半区的像素数目,如果其差值在一个固定的小范围内(试验得出此差值在0-20像素内为最佳),则该特征值记为2,左方偏多记为1,右方偏多记为3。特定位置的扫描线特征:图像垂直1/3处扫描线穿越的线条数目;图像垂直1/2处扫描线穿越的线条数目;图像垂直2/3处扫描线穿越的线条数目;图像水平1/3处扫描线穿越的线条数目;图像水平2/3处扫描线穿越的线条数目;,为了消除可
6、能的细化算法不完善的影响,以上在计算穿越次数时均为0-1改变次数。笔画特征:字符中“竖”的数目,计算图像在水平方向上的投影,投影点的像素数目累加值超过1/3图像高度且无超过5像素的中断,记为“竖”的数目加1;字符中“横”的数目,计算图像在垂直方向上的投影,投影点的像素数目累加值超过1/3图像宽度且无超过5像素的中断,记为“横”的数目加1;在实际情况中,由于车牌图像并不总是标准的,当出现倾斜、几何失真等情况时,字符中的横或竖不可能全部投影在一点上,而是在一个小范围内密集分布。经过多次尝试,结合车牌字符本身特点,本文将判定存在竖/横笔画的门限值设为图像高度/宽度的1/3左右。为了消除可能的图像几何
7、失真带来的影响,计算笔画数目时均不重复计算20像素点以内的笔画,既若该点存在横/竖,则在该投影方向上向下/后移动20像素继续判断。结构特征:字符中存在闭合回路的数目。利用递归实现区域生长算法,对所有独立连通区域进行标号处理,最后将连通区域个数减一(外围背景区域也作为一个连通区域被标号,需要在特征值中减去)记为该特征值。,(2)模板数据的生成考虑到车牌字符的特殊性,无法使用Windows系统自带的普通字体来作为标准模板。我们对拍摄到的车牌图像进行如下处理,形成了标准的模版数据。为了杜绝可能的系统图像处理缺陷,使用PhotoShop等商用软件将其调整为二值化图像;为了减少系统缩放函数可能存在的不完
8、善对画面失真的影响,将不同字符做成140*440的标准图像,供系统提取特征值;使用程序中的细化模块细化图像,并以特征提取模块计算标准图像的特征值,将得出的数据结果作为模板数据,以矩阵的形式保存在template.ini文件中。,2.字符识别采用最小距离准则进行模板匹配的识别。判决的标准采用欧式距离最小准则,计算当前图形的特征向量与34个特征向量(除字母I和O以外的所有数字和字母,共34个)的欧式距离,取其中最小的为判决结果。于是待识别样品与模板k之间的欧式距离dk为:,其中距离最短者为:,对每一个样品的判决过程为:遍历所有模板,计算其模板与样品间的欧式距离,取最小值作为最终判决结果。如果最短距
9、离小于某个规定的阈值,则结果为这个最小值相对应的类别;否则判定为无法识别。识别结果如图所示,在本系统中,使用一个识别模块来识别当前样品,其算法流程图如下图:,8.3 纸币识别器,、数据采集、特征提取、训练学习、分类识别,数据采集,纸币面额:5元,10元,20元,50元,100元,特征提取与选择,特征提取:长度、宽度、磁性、磁性的位置,光反射亮度、光透射亮度等,训练学习训练集:是一个已知样本集,在监督学习方法中,用它来开发出模式分类器。图中给出了对一个样本进行特征提取、分类的学习过程,分类识别对测试集来进行分类识别,确定纸币的面额及真伪。为了更好地对模式识别系统性能进行评价,必须使用一组独立于训
10、练集的测试集对系统进行测试。图中是对10元纸币分类识别的界面。,8.4最近邻方法用于图像拼接,图像获取,获取有重叠区域的两幅图像,如下图所示:(a)(b),8.4.2 特征提取,分别在两副图中用SIFT算法提取特征点,(a)图中的特征点数为5793,(b)图中的特征点数为3199。Scale Invariant Feature Transform,尺度不变量特征提取算法,简称 SIFT 算法,是一种提取控制点特征的经典算法(以下所说的“关键点”(Keypoint)是文献1中提到的说法,可以理解为控制点)。SIFT算法提取的SIFT特征向量具体具有如下特性:SIFT特征是图像的局部特征,其对旋转
11、、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定;独特性(Distinctiveness)好,信息量丰富,适用于在海量特征数据库中进行快速、准确的匹配;多量性,即使少数的几个物体也可以产生大量SIFT特征向量;高速性,经优化的SIFT匹配算法甚至可以达到实时的要求;可扩展性,可以很方便的与其他形式的特征向量进行联合。,SIFT 算法首先在尺度空间进行特征检测,并确定关键点的位置和关键点所处的尺度,然后使用关键点邻域梯度的主方向作为该点的方向特征,以实现算子对尺度和方向的无关性。主要计算步骤如下:尺度空间极值检测:搜索整个尺度和图像位置。通过使用高斯差分函数(Dif
12、ference of Gaussian)确定对尺度和方向具有不变性的兴趣点。以初步确定关键点位置和所在尺度。关键点定位:在每一个候选位置,详细地模型拟合以确定位置和尺度。根据稳定性选择关键点。通过拟合三维二次函数以精确确定关键点的位置和尺度,同时消除低对比度的关键点和不稳定的边缘响应点(因为高斯差分算子会产生较强的边缘响应),以增强匹配稳定性、提高抗噪声能力。,方向分配:每一个关键点根据局部图像梯度方向分配一个或多个方向。其后所有操作都根据分配的方向、尺度、位置。利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性。关键点描述符:在每个关键点周围在选定的尺度下测量
13、局部图像梯度。为了增强匹配的稳健性,对每个关键点使用44共16个种子点来描述,这样对于一个关键点就可以产生128个数据,最终形成128维的SIFT特征向量。其中第一步骤里高斯差分函数是这样定义的:高斯卷积核是实现尺度变换的唯一线性核,于是一副二维图像的尺度空间定义为:其中 是尺度可变高斯函数,(x,y)是空间坐标,是尺度坐标。,为了有效的在尺度空间检测到稳定的关键点,提出了高斯差分尺度空间(DOG scale-space)。利用不同尺度的高斯差分核与图像卷积生成。以上就是高斯差分函数计算式。高斯差分函数(Difference of Gaussian)计算比较简单,是尺度归一化的拉普拉斯-高斯算
14、子的近似。图像经过高斯差分算子计算,可以像用Sobel 算子计算时一样,提取局部极值点作为控制点。下面用下图形象地描述SIFT 算法中第三步和第四步的过程。,SIFT算法形象表示图 如图所示,在控制点(左图中心点)周围88邻域内,每个点的梯度大小和方向均为已知,中央点为当前控制点的位置,每个小方格代表控制点邻域所在尺度空间的一个像素,箭头方向代表该像素的梯度方向,箭头长度代表梯度模值(注:实际应用中,中心点也是像素点,因此可将左图中靠近中心的四个像素点选出一个作为中心点)。然后根据像素点和中心点的远近距离来进行高斯函数加权,左图圆圈表示高斯函数加权的范围。,加权方法如下:对圆圈内的每个像素点对
15、应的梯度,令其方向不变,使其梯度模值乘以加权系数。其中用来确定高斯函数加权的范围,是因为 所以在上图中,可以近似,即。其中和是所考察像素点与中心点X方向和Y方向的坐标差值。加权完毕后,将88的邻域分块进行梯度直方图统计。梯度直方图统计方法如下:如左图所示粗线将邻域分成4块,每一块里都含有16个像素点。接下来给定梯度8个方向,如右图所示,将左图每一块里的各个像素点所对应的梯度,归类到8个给定的方向。再将归为一类的梯度模值求和,就得到如右图所示的8个方向长短不一的梯度直方图了。如此进行得到控制点周围4个梯度直方图,将这4个直方图化为向量,再将其首尾相连,就成为控制点的32位SIFT特征向量。以上就
16、是SIFT 算法的大致思路。这种邻域方向性信息联合的思想增强了算法抗噪声的能力,同时对于含有定位误差的特征匹配也提供了较好的容错性。,8.4.3 特征匹配,对图(a)中的5793个点,依次用最近邻方法K-NN算法,在图(b)中的3199个点中寻找与(a)每个点的最佳配对点,即属于同一类的点,没有匹配上的点删除。实验结果为找到了56对匹配点,如下图所示。,8.4.4 图像拼接,通过56对匹配点,将两幅图像拼接成下图。,8.5从红外图像序列中识别目标,、跑步人识别、船只识别、车辆识别,8.5.1 跑步人识别,红外图像序列是由ECCO ENGNEERING CO.生产的FLIR摄像机采集的。监视状态
17、下视场角为2013.3度,分辨率800线 450线,帧频30 Hz。检测算法中的运动强度系数取4,位移系数取10。在视场中能否检测出运动目标,与目标的距离、运动速度和目标面积密切相关。在一定的距离上能检测的目标的运动速度和大小也有一个确定的范围。测试结果如下:,8.5.2 船只识别,船只在海面上行驶时,海水、船只和天空在红外图像中特性各不一样,海水温度较低,灰度值较低,天空次之,灰度较高,船只温度最高,灰度最亮,因此在理想情况下,只要从红外图像中检测出最亮的部分即可识别船只。然而,在实际图像中,海水、天空和船只在红外图像中的灰度并不是均一的,而是受强烈的噪声干扰,噪声的方差已达到几十个灰度级,
18、因此简单的门限分割是不可能解决问题,整个问题的核心是如何从强噪声环境中检测出分割门限。,下面我们来分析问题的数学模型:我们把噪声视为高斯分布,设海水、天空和船只的平均灰度分别为,,对应方差为,它们在整个图像所占面积的比例为,则图像灰度分布的概率密度函数,若根据输入图像的灰度直方图得到灰度分布概率密度函数,可以依据贝叶斯准则得到海水、船只和天空之间的分割门限。红外图像船只识别系统界面如下图所示:,8.5.3 车辆识别,由红外传感器所获取的运动车辆的图像序列,具有强噪声、目标边缘模糊以及同一目标由于温度分布不均匀造成目标内部灰度变化剧烈等特点,这些特点使得许多常规图像分析和处理方法失效或效果不佳。
19、另一方面,由于传感器与目标之间的距离较近,运动目标在序列的各幅图像中的姿态变化比较剧烈,这也对目标的检测识别和跟踪工作提出了挑战。我们从运动目标的检测和跟踪两方面着手,解决了在红外图像序列中车辆的捕获及其姿态判定问题。,上面的4幅图像是我们从序列中抽取出来的反映车辆在行驶过程中不同的姿态:本系统能够从序列的任意时刻开始进行运动目标的检测和跟踪,准确地报告目标的位置和姿态,并且在传感器指向发生切换时,系统能够及时停止跟踪,自动完成目标的重新检测识别,然后继续进行跟踪,相应的测试结果如下:,8.6心电图自动诊断,、心电自动诊断介绍、预处理、特征提取与选择、心脏病诊断,8.6.1 心电自动诊断介绍,
20、心脏病是威胁人类生命的主要疾病之一,长期以来,对心脏病的研究一直是医学界的重要课题。人体心电图(Electrocardiograph,ECG,如图1所示)作为心脏电活动在体表的综合表现,蕴涵着丰富的反映心脏节律及其电传导的生理和病理信息,在一定程度上可以客观反映心脏各部位的生理状况,是诊断心脏疾病、评价心脏功能的重要依据之一,尤其对于各种心律失常和传导障碍的诊断分析具有重大诊断价值,是目前分析与鉴别各种心律失常最精确的方法。,图1 正常的典型心电波形图,由于病态心电图种类繁多、变异极大,同种病理不同患者的心电图、甚至同一患者不同时刻的心电图都存在着较大的差异;若医师长期从事大量图形的识别工作,
21、极易疲劳,容易漏检、出错。而且,人工进行心电信号分析都是事后分析,分析速度达不到准实时性要求。为了把医师从繁琐的图形识别工作中解脱出来,将精力集中在异常心电波形的识别和判断上,从而提高医疗诊断效率、缩短诊断时间,研究心电图的计算机辅助分析算法,开发出一种功能强大的心电信号自动分析系统,特别是可以准确、快速地对心律失常病类进行判别的系统,近年来越来越受到医务人员和科技人员的重视。心电信号自动分析是指在采集到ECG信号的基础上,通过对其处理提取表征心脏状态的波形信息和特征参数,获取心脏工作状态的相关信息,然后利用这些特征信息分析、判别心电信号类型及所对应的疾病类型或健康水平,进而对心脏状态和健康状
22、况进行预测。整个心电信号自动分析的流程如图2所示。,图2 心电信号自动分析流程图,由图2可知,心电信号自动分析研究的内容包括以下四个主要方面:一是心电 信号预处理技术的研究;二是波形检测与特征点定位算法的研究;三是心电 特征提取与选择方法的研究;四是心电波形自动分类与疾病诊断方法的研究。,8.6.2 预处理,临床采集的心电信号,尤其是动态心电信号,由于受试者所在环境、运动量和活动的剧烈程度不一样,系统所采集的ECG质量也不一样。心电信号是mV级的微弱信号,在采集过程中,受人体运动、采集仪器、电磁环境等影响,不可避免地会引入许多噪声干扰,这些噪声主要有以下几种表现形式:工频干扰,基线漂移,肌电干
23、扰,电极接触噪声,运动伪迹等。来源于心脏以外的这些噪声信号以加性或乘性方式与心电信号相混杂,会引起ECG信号的各种畸变,给准确检测和判断ECG信号带来极大的困难。在以上各种噪声干扰中,工频干扰和基线漂移是最为普遍的,也是心电信号预处理中必须首要考虑对其消除或有效抑制的主要噪声成份。,小波滤波结果:,图3 ECG信号的小波阈值滤波结果(a)含高频噪声的心电信号及其小波滤波结果(b)含基线漂移的心电信号及其小波滤波结果,形态学滤波结果:,图4 数学形态学滤波器对ECG信号的滤波结果(a)含高频噪声的ECG信号及其滤波结果(b)含基线漂移干扰的ECG信号及其滤波结果,8.6.3 特征提取与选择,图5
24、 特征检测界面,表1 时域特征参数的均值和方差统计结果,图6 不同类型心电信号在小波系数分布上的差异,妈妈新开了个淘宝店,欢迎前来捧场 妈妈的淘宝点开了快半年了,主要卖的是毛绒玩具、坐垫、抱枕之类的,但生意一直不是很好,感觉妈妈还是很用心的,花了不少功夫,但是就是没有人气,所以我也来出自己的一份力,帮忙宣传一下。并且妈妈总是去五亭龙挑最好的玩具整理、发货,质量绝对有保证。另外我家就在扬州五亭龙玩具城旁边,货源丰富,质量可靠,价格便宜。欢迎大家来逛逛【扬州五亭龙玩具总动员】,个人小广告:,表2 三类ECG信号QRS波形及其高阶累积量特征信息统计表,图7 特征提取结果显示界面,8.6.4 心脏病诊
25、断,图8 心脏病智能诊断专家系统界面,图9 诊断结果的解释说明,表3 SVM分类器的心电信号分类结果,8.7遥感图像中的目标识别,、飞机识别、机场识别、桥梁识别,飞机识别算法是基于部分的(Part-based)和层次的(hierarchical),包括两个部分:学习和识别,算法框图如下图所示。(1)学习阶段。通过对属于同一类别的学习样本的学习,得到基于部分的结构模型,并针对问题特点用一个属性关系图来表示。然后由这些图匹配得到一个模糊属性关系图,以此作为形状模型。(2)识别阶段。用上述形状模型来检测识别形状。首先用柔性形态学凸集检测器检测出最显著的子部分,得到候选区域,然后在其邻域检测识别其它子部分,分析这些子部分的几何结构关系,以此作进一步证实。下面就对各个部分作详细论述。,一组由40幅图像(其中包含97架飞机)组成的图像库被用来实验,其中之一示于下图。,(a)训练样本,(b)识别结果,、机场识别机场识别系统界面:,机场识别过程:,桥梁识别桥梁识别系统界面:,桥梁识别过程:,