《毕业设计论文基于聚类的智能图像分析算法.doc》由会员分享,可在线阅读,更多相关《毕业设计论文基于聚类的智能图像分析算法.doc(57页珍藏版)》请在三一办公上搜索。
1、基于聚类的智能图像分析算法摘要智能图像处理技术在众多领域得到了广泛应用。在具有监控、报警等功能的安防系统中,在自然基因显微系统中,在模式识别系统中等,智能图像处理技术都起到了不可小觑的作用。目前基于内容的智能图像识别与分类技术在准确性具体应用方面还面临着许多难题。本文通过介绍智能图像分析方法及相关算法理论,重点研究以SVM算法为代表的监督分类算法及以k-means聚类算法为代表的费监督分类算法,并结合Hu图像矩不变特征,对图像进行聚类分析及分类。在理论学习的基础上,运用MatLab实现算法并验证应用效果。有监督分类方面,本文采用了提取能够较好的保持图像的边缘、形状等特性的Hu矩不变特征作为训练
2、特征,分类方法采用了基于聚类的SVM算法。在提取出训练样本的特征值后,将其输入SVM的训练网络进行训练。最后将待分类图片输入即可得到分类结果。本文计算出了该非监督分类方式分类结果的准确性,并对其进行了分析与讨论。无监督分类方面,本文采用了k-means分类方法。预先设定好分类的类别数后,输入待分类图片,则系统通过调用分类函数,将自动分类的结果输出。在算法研究的基础上,设计并实现了水果图像智能分析应用系统,具有创建特征值数据库、创建训练网络、图像有监督分类和图像无监督分类等功能。当进行图像有监督分类,即SVM算发分类时,准确率可达到将近70%。关键词 SVM k-means图像分类Intelli
3、gentImage AnalysisBased on ClusteringAlgorithmABSTRACTIntelligent image processing technology has been widely applied in many fields. In monitoring and alarm security system, in natural gene microscope, and in the middle pattern recognition system, intelligent image processing technology has played
4、highly important role.Currently content-based image recognition and classification of intelligent technology are facing many problems in specific application for accuracy. This paper will describes intelligent image analysis method and algorithm theory, meanwhile combines with the same characteristi
5、cs of HU image moments, and focuses on the SVM algorithm for classification and supervision of representatives of the costs of supervised classification algorithms. In the theoretical study, verify the application of results based on the use of MatLab algorithm.In the phase of supervising classifica
6、tion, this paper used Hu moments invariant feature as a training feature that can keep the extracted image edge, shape and other characteristics using SVM-based clustering algorithm. After extracting samples characteristic value, put into SVMs training network to have training. Finally the input ima
7、ge can be classified by the classification results. This paper concludes the approach to the classification of non-supervised classification accuracy of the results meanwhile analyzes and discusses the accuracy.This paper used K-menas classification method in the field of unsupervised classification
8、. After pre-configuring data, put into classified image, and then by calling the classification function, the system will output the results of automatic classification.Based on algorithm, design and implementation of fruit intelligent image analysis application system with a characteristic value da
9、tabase, training network, image supervised classification and image unsupervised classification features. When the image has supervised classification, the SVM classification count classification, the accuracy rate can reach nearly 70%.KEY WORDS SVM k-means Image classification35目录第一章 绪论11.1智能图像分析概述
10、11.1.1课题背景11.1.2国内外研究现状21.2聚类分析31.3课题目标及本文研究内容31.3.1预期目标31.3.2主要研究内容31.3.3系统方案41.3.4本文的结构4第二章 技术基础52.1图像特征52.2图像分类方法52.2.1图像分类概念52.2.2图像分类原理62.2.3图像分类方法62.3MatLab及图像智能处理工具箱7第三章 图像矩不变特征提取93.1图像矩不变特征介绍113.2图像矩不变特征提取12第四章 分类算法144.1SVM分类算法144.2k-means分类算法16第五章 基于MatLab的图像分析软件实现195.1软件功能及系统流程195.2关键函数详述1
11、95.2.1图像灰度化195.2.2图像平滑与图像锐化205.2.2.1中值滤波205.2.2.2图像锐化215.2.3Hu矩不变特征值215.2.4SVM神经网络的建立和训练225.2.5k-means分类函数24第六章 系统测试266.1系统界面266.2功能测试及统计306.2.1训练样本306.2.2结果与分析30第七章 结论与展望337.1结果与结论337.2问题与展望337.3心得体会33参考文献35致 谢36北京邮电大学本科毕业设计(论文)第一章 绪论1.1 智能图像分析概述随着我国人民生活水平的提高,数码相机、DV机等摄影器材得到了极大范围的普及,数字图像的数量也在飞速增长,同
12、时,互联网的普及使得人们对于图像检索的需求大大增加。近年来,为了满足人们日益增长的生活、学习、工作、娱乐等各方面的需要,数字图书馆中储存了数以万计的图像。图像处理技术从一开始就是一个基于线性代数、统计理论和物理学之上,具有很强理论背景的研究领域,它需要广泛的基础知识,包括计算机科学、数字信号处理、随机过程和统计数学、矩阵分析、信息论、控制论和最优化理论等。同时,图像处理又是一门与应用紧密结合的学科,应用领域涉及计算机视觉、地理、气象、航空航天、医疗保健、刑事侦查等。1.1.1 课题背景在20世纪初,运用机器来处理图片是一件非常困难的事。但随着计算机硬件、图像获取设备、显示设备的不断改进和各种高
13、性能能工作站的出现,图像处理技术迅猛发展。而信息时代的到来,又无疑使图像处理技术进入了一个更加蓬勃发展的阶段,特别是以多媒体技术、通信技术、信息存储技术和以Internet为代表的计算机网络技术的加速发展以及高清晰度电视的深入应用研究,图像处理技术研究和应用前景更为广阔。数字图像处理所涉及的知识非常广泛,具体的研究方法种类繁多。传统的图像处理技术主要集中在图像的获取、变换、增强、恢复(还原)、压缩编码、分割与边缘提取等方面,并且随着新工具、新方法的不断出现,这些图像处理技术也一直在更新与发展。近十多年来,随着信息技术的发展,图像特征分析、图像配准、图像融合、图像分类、图像识别、基于内容的图像检
14、索与图像数字水印等领域取得长足的进展。这些图像处理技术反映了人类的智力活动,它在计算机上模仿、延伸和扩展了人的智能,具有智能化处理功能,因而称之为智能图像处理技术。其中最具代表性的是图像分类技术以及基于内容的图像检索。图像分类就是利用计算机对图像进行定量分析,把图像中的每个像元或区域划归为若干个类别中的一种,以代替人的视觉判读。图像分类的过程就是模式识别的过程,是目视判读的延伸和发展。图像分类主要用于遥感、医学与军事等领域。以遥感图像分析为例,遥感技术是通过对遥感传感器接收到的电磁波辐射信息特征的分析来识别地物类型的,这可以通过人工目视解释来实现,或是用计算机进行自动分类处理,也可以用人工目视
15、解释与计算机自动分类处理相结合来实现。用计算机对遥感图像进行地物类型识别是遥感图像数字处理的一个重要内容,也是模式识别技术在遥感技术领域中的具体应用。基于内容的图像检索就是根据图像的语义和感知特征进行检索,具体实现就是从图像数据中提取出特定的信息线索(或特征指标),然后根据这些线索从大量存储在图像数据库的图像中进行查找,检索出具有相似特征的图像数据。与传统的基于关键词的数据库检索相比,具有相似度检索、近似检索和要求给出检索结果的集合限制等特点。人们常说“物以类聚,人以群分”。面对数量庞大的图像信息,寻找一种方便快捷、直接有效的对图像进行分类方法已经成为进行图像处理工作的重要基础和必不可少的重要
16、环节,尤其是对于基于内容的图像检索具有极其重要的作用。聚类分析分类方法是先对图像按照某种相似性原则进行聚类,把相似的图像聚合为一类,检索过程在类内进行,从而大大的缩小图像检索范围,就能够达到快速、准确检索图像的目的。1.1.2 国内外研究现状人类从一出生,人眼就在不断地接受、分析和理解周围的景物,这是人类的一种本能活动。在计算机技术的不断发展中,人类更是将这一本能发挥的淋漓尽致。在20世纪70-80年代,图像处理的研究方向主要集中于用图像变换和数学模型来表征图像信号。20世纪80年代中期,各种高性能的工作站和个人电脑应用的普及使图像处理研究和应用不再仅仅是大机构和大型学术团体的“专利”。现在随
17、着Internet的广泛普及。图像处理技术和应用前景将更为广阔。从应用的角度来看,数字照相技术、电子影像、数字化电视机、图像数据库和多媒体技术的出现都在推动这一领域不断地向前发展。总的来说,图像处理技术将不再局限于电子工程研究领域,它已设计到其他学科,如计算机科学、地理、医疗保健、刑事侦查等领域。另外,除了处理位于可视频谱范围的图像信号外,在过去的20年里,对射电望远镜形成的图像、红外图像、合成孔径雷达(Synthetic Aperture Radar.SAR)图像的研究都非常活跃。特别是CT和核磁共振的利用都极大地丰富了这一领域研究的内容。除了上述这些研究领域外,图像处理技术研究人员还积极地
18、眷力于纹理和图形形状的分析与识别、运动检测与估计、图像处理并行系统、图像处理技术的软硬兼研究等工作。由于图像处理技术从一开始就具有很强的理论背景,因此一些具有高鲁棒性的图像处理算法已经应用到消费类型的产品中,一些较成熟的算法也已逐步形成公认的标准。如在20世纪80年代末逐步规划形成、20世纪90年代全面公布的H.263,JEPG,MPEG-2等图像压缩与传输标准使图像处理技术在产业化方面取得巨大的成功。最近的成果也将在JPEG2000标准中体现标准中将用近年来图像变换研究的新成果:小波变换来取代原来的DCT变换,这是因为小波变换克服了傅里叶变换不具有时频局部性质的缺陷,并且和DCT一样具有快速
19、算法。图像处理技术发展非常快,随着基础理论研究的不断推前、更新,各种新颖的图像处理技术层出不穷。就近年来产生了大量研究结果的图像分类算法来说,从有无监督的监督划分为有监督分类和无监督分类。无监督分类方法中K-means分类方法得到了广泛的研究,Paredes等利用K-means算法对训练图像块区生成的KD树进行类似类别搜索,得到了不错的分类效果。但传统K-means算法搜索匹配效率低,特别是对于高维的大型数据集,搜索分类非常费时。Stefan Berchtold 等提出了一种预先计算K-means不相似测度的动态解空间的方法,简化了计算,提高了搜索分类效率。Bin Zhang等采用基于聚类的树
20、算法加速K-means,而不用预先计算K-means不相似测度的特性和矩阵式,从而更大的加快了算法的速度,并减小了计算准确性的损失。另一类在图像分类中广泛使用的有监督分类方法是支持向量机(SVM)分类。何灵敏等采用基于径向基核函数的SVM方法对遥感图像分类,并证实采用一对多的SVM分类方法比BP神经网络方法更适合于对复杂小样本多原数据的分类,蒋芸等将粗糙集理论与SVM结合起来,利用粗糙集理论处理大数据量、消除冗余信息等方面的优势,减少训练数据,提高了SVM的分类能力。大部分SVM方法都采用单一的核函数的类型,当采用局部核函数则学习能力强、泛化性能较弱,采用全局性核函数则泛化性能强、学习能力较弱
21、。1.2 聚类分析聚类分析(cluster analysis)是一种将研究对象分为相对同质的群组(clusters)的统计分析技术。聚类分析也叫分类分析(classification analysis)或数值分类(numerical taxonomy),是用数学的方法来研究和处理给定对象的分类,即对同类型对象抽象出其共性,从而形成类。聚类分析是一种数值分类方法(即完全是根据数据关系)。要进行聚类分析就要首先建立一个由某些事物属性构成的指标体系,或者说是一个变量组合。入选的每个指标必须能刻画事物属性的某个侧面,所有指标组合起来形成一个完备的指标体系,它们互相配合可以共同刻画事物的特征。所谓完备的
22、指标体系,是说入选的指标是充分的,其它任何新增变量对辨别事物差异无显著性贡献。如果所选指标不完备,则导致分类偏差。简单地说,聚类分析的结果取决于变量的选择和变量值获取的两个方面。变量选择越准确、测量越可靠,得到的分类结果越是能描述事物各类间的本质区别。1.3 课题目标及本文研究内容1.3.1 预期目标本论文拟将智能分类技术应用于图像的自动识别,以水果图像分类为目标,研究其特征提取方法及智能分类算法,实现基于Matlab平台的水果图像智能分析软件。1.3.2 主要研究内容论文主要研究内容包括:图像特征提取方法研究:分析图像的典型特征,并研究Hu矩不变特征值的计算方法。分类算法研究:在理解算法原理
23、的基础上运用算法,实现算法功能并分析比较算法性能。智能图像分析软件实现: 系统以MatLab为平台,通过用户界面形式实现了基于聚类的智能图像分类软件,具有建立根据现有图库训练网络、对任一图像实现分类并以图文结合方式展现分类结果等功能。1.3.3 系统方案论文以水果图像的分类为目标,通过图像的预处理、特征提取与分类,基于MatLab实现图像的智能分析。在图像预处理阶段,系统将对输入图像进行灰度化、中值滤波以及锐化并提取图像边缘的操作。特征提取阶段,系统将计算出输入图像的圆度、拉伸度、周长等中间值,将这些必要的中间值带入Hu特征迭代计算公式,即可获得后续处理所需要的特征值向量。分类阶段,系统为用户
24、提供了选择界面。当使用者选择SVM分类方法时,系统将通过使用图库训练学习的方式得到分类结果。当使用者选择K-means分类时,系统将得到自主聚类的分类结果。1.3.4 本文的结构本文分为七个部分,各部分的内容依次如下:第一章,绪论。介绍要解决的主要问题问题。第二章,技术基础。介绍本文涉及到的知识以及使用的工具。第三章,图像矩不变特征提取。对本文采用的训练特征进行详细介绍。第四章,分类算法。对本文用到的两类不同的分类算法进行详细介绍。第五章,算法软件实现。对系统涉及的核心算法、关键函数以及系统界面进行详细的介绍。第六章,系统测试。第七章,结论与展望。论文的成果总结及不足展望。第二章 技术基础22
25、.1 图像特征图像特征指的是图像场中可用作图像标志的属性,通常可以分为统计特征与视觉特征两大类。统计特征包括直方图、频谱和矩等,是人为特征,需要经过变换才能得到。视觉特征指的是具有直观意义的图像的形状与颜色特征,如颜色、纹理、形状等。图像特征的提取和分析是智能图像分析的关键步骤。近年来,随着多媒体技术的发展,许多图像特征被研究人员发掘并利用,为进一步的图像处理提供了极大地便利。对于某幅特定图像,根据不同的需要,通常要提取其不同的特征,因而一幅图像又有了许多不同的表达方式。也就是说,图像的不同特征从各个角度反映了图像在这个特定维度中的特点。在图像统计特征中,直方图描述的是图片显示范围内的灰度分布
26、曲线,它的横轴从左到右代表照片从黑(暗部)到白(亮度)的像素数量。频谱是以横轴纵轴的波纹方式,记录画出图像中包含的各种信号频率的图形资料,是图像信号的频域表征。矩特征表征了图像区域的几何特征,又称为几何矩,其具有平移、旋转、尺度等特性的不变特征,又称其为不变矩。也是本文中应用到得特征。在视觉特征中,颜色特征是一种全局特征,表征了图像区域所对应的景物的表面性质,是基于像素点的特征。纹理特表征了图像区域所对应景物的表面性质征,也是一种全局特征,但是纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。形状特征由其集合属性(长短、距离、面积、凹凸)、统计属性(投影)、拓扑属性(欧
27、拉数、连通)表征,是图像最本质的特征反映。不变矩特征由于其在图像平移、伸缩、旋转时均保持不变,而且具有全局性,是图像识别的主要方法,广泛的应用于机器视觉、目标识别与分类、纹理分析等等。Hu首先提出了七个几何不变矩用于图像识别,利用不变矩进行形状识别获得了广泛的应用。后来人们进行了多方面的研究,发现不变矩还具有绝对的独立性,没有信息冗余现象,抽样性能好,抗噪能力强,更适合用于几何不变图像描述和识别。本文就将使用到Hu的不变矩特征。2.2 图像分类方法2.2.1 图像分类概念从人眼角度看,提高图像对比对、增加视觉维度、进行空间变换或滤波,其目的就是让人们能够凭借知识和经验,根据图像色调、亮度、位置
28、、纹理以及结构等特征,准确的对图像类型或者目标,做出正确的判断和解释,并根据当下的需求,对所需图像进行绘制处理。图像分类就是通过计算机对图像进行定量的分析的过程,把图像中的各个像素或者区域划归到若干类别中的一类去,以代替人眼的视觉判读。图像分类的过程其实是一个模式识别的过程,是人眼目视判读的延续以及发展。图像分类具有计算精度高、速度快、图像测量准确度高等特点。2.2.2 图像分类原理图像分类的理论依据是:图像中的同类景物在相同条件下,应具有相同或类似的光谱信息特征,从而体现出某种同类景物的某种内在相似性,即同类景物像素的特征向量将聚类于同一特征的空间区域,从而不同的景物的光谱信息特征和空间信息
29、特征不同,它们将聚类于不同特征的空间区域。从统计决策理论来看,图像分类在数学上就是对呈现统计可变的数据作出决策的过程。将一个像素归入任一类别的决策,可以说是统计上的一种明智的“猜测”。统计决策比较成熟,对模式不太复杂的应用已经相当的成功,但不能反映模式结构特性,概率表示形式使使用上也存在局限性。神经网络分类方法是只能信息处理的重要内容,它可以处理一些环境复杂、背景不清楚、推理规则不明确的问题。2.2.3 图像分类方法用统计方法进行图像分类时,首先从待分类对象中提取能够反映对象属性的特征向量,并将这些向量定义在一个特征空间之中。之后运用统计决策的方法对特征空间进行划分,用以区分不同特征对应的对象
30、,进而达到分类的目的。同时,在分类的过程中,按照有无样本学习可以分为非监督分类法和监督分类法。监督分类就是用已知的类别样本选择特征参数和建立判别函数,对各个像素进行分类。通常意义上的监督分类包含以下两个具体的分类方法。1. 最小距离分类法最小距离分类法是最简单的监督分类方法。这种方法的基本思想是:从训练样本中提取各个类别对应的均值向量并求出待测向量到各个均值向量的距离,比较后将待测类别归入距离最小的一类中。设待分类像素到类别的距离为 式(2-1)其中,为类别数,为类的中心。当则 2. 最大似然分类(多类分类)最大似然分类建立在贝叶斯准则上,其分类正确率最高,是风险最小的判决分析。在维特征空间中
31、,待测像素对于类的条件概率密度函数和类的先验概率均已知,则最大似然分类法建立的判别函数集为:()式(2-2)若则当服从高维正态分布时,有式(2-3)而非监督分类则需要在进行分类之前获得类别的先验属性,通过这个属性求出判别函数中的未知参数。在先验属性未知的情况下将所有样本就将所有样本划分为若干个类别的方法称为费监督分类,这种方法是根据像素间的相似度大小进行聚类。在聚类过程中,通常是按照某种相似性准则来对样本进行合并或分离。像素聚类有两种途径:迭代法与非迭代法。迭代法先给定一个初始分类,然后通过迭代算法找到能够使准则函数取极值的最优聚类结果,因此这是一个动态聚类分析过程。常用动态聚类法有K-mea
32、ns算法、LBG算法和分裂算法。2.3 MatLab及图像智能处理工具箱MatLab是MatrixLaboratory(矩阵实验室)的缩写,是一款由美国Math Works公司出品的商业数学软件。MatLab是一款用于数据可视化、算法开发、数据分析以及数值计算的高级技术计算语言和交互式环境。除了矩阵运算、绘制函数/数据图像等常用功能外,MatLab还可以用来创建用户界面及与调用其它语言(包括C,C+和FORTRAN)编写的程序。尽管MatLab主要用于数值运算,但利用为数众多的附加工具箱(Toolbox)它也适合不同领域的应用,例如图像处理、控制系统设计与分析、信号处理与通讯、金融建模和分析等
33、。另外还有一个配套软件包Simulink,提供了一个可视化开发环境,常用于系统模拟、动态/嵌入式系统开发等方面。本系统的功能实现就是是借助MatLab的工具箱完成的。Vapnik经过多年研究,提出了统计学理论和一种新的经验建模工具:支持向量机(Support Vector Machine,SVM)。SVM的训练是依据统计学理论中的结构风险最小化原则,在最小化经验风险的同时最小化SVM的模型复杂度,提高了模型的泛化能力。尽管如此,SVM训练为一个有约束的二次规划问题,其约束条件数等于训练样本容量,因此在用于大训练样本容量的建模问题时,会导致训练时间过长。针对SVM这一缺点,Suykens提出了损
34、失函数为二次函数,约束条件为等式形式的支持向量机:最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)。LSSVM的训练问题为一个线性方程组求解问题,相对于SVM训练的二次规划问题求解,其计算量有了很大的降低。此次系统所用的工具包为由比利时鲁汶大学的K.Pelckmans以及J.A.K.Suykens等开发的LS-SVMlab Toolbox(Version 1.5)。此工具箱实现了基于SVM算法的多类分类。此外,在展现运行结果时用到了MatLab中的GUI用户界面设计。图形用户界面(Graphical User Interface,简称G
35、UI,又称图形用户接口)是指采用图形方式显示的计算机操作用户接口。第三章 图像矩不变特征提取常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。一 颜色特征(一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。(二)常用的特征提取与匹配方法颜色直方图。其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体
36、空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。(三)常用的颜色空间:RGB颜色空间、HSV颜色空间。颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。二 纹理特征(一)特点:纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征具有
37、较大的优越性,不会由于局部的偏差而无法匹配成功。作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力。但是,纹理特征也有其缺点,一个很明显的缺点是当图像的分辨率变化的时候,所计算出来的纹理可能会有较大偏差。另外,由于有可能受到光照、反射情况的影响,从2-D图像中反映出来的纹理不一定是3-D物体表面真实的纹理。(二)常用的特征提取与匹配方法纹理特征描述方法分类(1)统计方法统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法Gotlieb 和 Kreyszig 等人在研究共生矩阵中各种统计特征基础上,通过实验,得出灰度共生矩阵的四个关键特征:能量、惯量、熵和相关性。统计
38、方法中另一种典型方法,则是从图像的自相关函数(即图像的能量谱函数)提取纹理特征,即通过对图像的能量谱函数的计算,提取纹理的粗细度及方向性等特征参数(2)几何法所谓几何法,是建立在纹理基元(基本的纹理元素)理论基础上的一种纹理特征分析方法。纹理基元理论认为,复杂的纹理可以由若干简单的纹理基元以一定的有规律的形式重复排列构成。在几何法中,比较有影响的算法有两种:Voronio 棋盘格特征法和结构法。(3)模型法模型法以图像的构造模型为基础,采用模型的参数作为纹理特征。典型的方法是随机场模型法,如马尔可夫(Markov)随机场(MRF)模型法和 Gibbs 随机场模型法(4)信号处理法纹理特征的提取
39、与匹配主要有:灰度共生矩阵、Tamura 纹理特征、自回归纹理模型、小波变换等。灰度共生矩阵特征提取与匹配主要依赖于能量、惯量、熵和相关性四个参数。Tamura 纹理特征基于人类对纹理的视觉感知心理学研究,提出6种属性,即:粗糙度、对比度、方向度、线像度、规整度和粗略度。自回归纹理模型(simultaneous auto-regressive, SAR)是马尔可夫随机场(MRF)模型的一种应用实例。三 形状特征(一)特点:各种基于形状特征的检索方法都可以比较有效地利用图像中感兴趣的目标来进行检索,但它们也有一些共同的问题,(二)常用的特征提取与匹配方法通常情况下,形状特征有两类表示方法,一类是
40、轮廓特征,另一类是区域特征。图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。几种典型的形状特征描述方法:(1)边界特征法该方法通过对边界特征的描述来获取图像的形状参数。其中Hough 变换检测平行直线方法和边界方向直方图方法是经典方法。Hough 变换是利用图像全局特性而将边缘像素连接起来组成区域封闭边界的一种方法,其基本思想是点线的对偶性;边界方向直方图法首先微分图像求得图像边缘,然后,做出关于边缘大小和方向的直方图,通常的方法是构造图像灰度梯度方向矩阵。(2)傅里叶形状描述符法傅里叶形状描述符(Fourier shape descriptors)基本思想是用物体边
41、界的傅里叶变换作为形状描述,利用区域边界的封闭性和周期性,将二维问题转化为一维问题。由边界点导出三种形状表达,分别是曲率函数、质心距离、复坐标函数。(3)几何参数法形状的表达和匹配采用更为简单的区域特征描述方法,例如采用有关形状定量测度(如矩、面积、周长等)的形状参数法(shape factor)。在 QBIC 系统中,便是利用圆度、偏心率、主轴方向和代数不变矩等几何参数,进行基于形状特征的图像检索。四空间关系特征特点:所谓空间关系,是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系,这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。通常空间位置信息可以分为两类:相
42、对空间位置信息和绝对空间位置信息。前一种关系强调的是目标之间的相对情况,如上下左右关系等,后一种关系强调的是目标之间的距离大小以及方位。显而易见,由绝对空间位置可推出相对空间位置,但表达相对空间位置信息常比较简单。空间关系特征的使用可加强对图像内容的描述区分能力,但空间关系特征常对图像或目标的旋转、反转、尺度变化等比较敏感。另外,实际应用中,仅仅利用空间信息往往是不够的,不能有效准确地表达场景信息。为了检索,除使用空间关系特征外,还需要其它特征来配合。常用的特征提取与匹配方法:提取图像空间关系特征可以有两种方法:一种方法是首先对图像进行自动分割,划分出图像中所包含的对象或颜色区域,然后根据这些
43、区域提取图像特征,并建立索引;另一种方法则简单地将图像均匀地划分为若干规则子块,然后对每个图像子块提取特征,并建立索引。33.1 图像矩不变特征介绍矩特征主要表示了图像区域内的几何特征,又称为几何矩,由于其具有平移、旋转、尺度等特性的不变特征,所以又称其为矩不变。在图像处理中,几何矩不变可以被用来当做一个重要的特征来表示物体,可以据此特征来对图像进行分类等操作。几何矩是在在1962年被Hu(Visual pattern recognition by moment invariants)提出的,矩不变的主要思想是通过使用对变换不敏感的基于区域的几个矩作为形状特征。矩是描述图像特征的算子,在图像分
44、析与模式识别领域中有重要的应用。迄今为止,常见的矩描述子可以分为以下几种:正交矩、几何矩、旋转矩和复数矩。其中几何矩最早被提出并且形式最简单,所以对它的研究最为充分。几何矩对简单图像有一定的描述能力,虽然在区分度上不如其他三种矩,但与其他算子比较起来,较为简单,一般通过一个数字就可表达。矩不变特征的优越性,特别是其具有的旋转不变形、图形的扭曲伸缩等不变形,对于本系统的分类训练具有极其重要的作用。比如,输入系统的待分类图片中的感兴趣区域很可能由于拍摄角度的问题扭曲、拉伸、变形等,但是矩不变特征的这一特性很好的避免了此类操作造成的误差,提高了系统的分类准确度。以下是两个矩不变特征的图像检索实例。图
45、3-1 旋转不变性图3-2 扭曲、伸缩性变不变性从图3-1中的图像检索结果可以看出,形状检索算法对于图像的旋转具有不变性。图3-2检索的结果证明形状检索算法对于图像的扭曲。伸缩形变具有不变性,并对图像的基本形状特性具有鲁棒性,在具有一定形变的干扰情况下,仍能得出较好的图像检索结果。3.2 图像矩不变特征提取数字图像是通过一个数字矩阵表征的。图像f(x,y)的(p+q)阶几何矩定义为:式中是图像的灰度。矩在统计学中通常被用来反映随机变量的分布情况,当被推广到力学中,它用作描述空间物体的质量分布。同理,如果我们将图像的灰度值看作是一个二维或三维的密度分布函数,则矩方法就可用于图像分析领域并且用作图
46、像特征的提取。最常用的,物体的零阶矩显示了图像的“质量”:式(3-1)一阶矩()用于确定图像质心():式(3-2)若将坐标原点移至和 处,就得到了对于图像位移不变的中心矩。如式(3-3)Hu在文中提出了7个几何矩的不变量,这些不变量满足于图像平移、伸缩和旋转不变。如果定义,Hu的7种矩为:在本系统中,使用SVM神经网络对图像进行分类时,需要提取图像的Hu矩不变特征。特征提取具体步骤如下:(1)对初始图库图像和待分类图像进行二图像滤波、直方图均衡、图像均衡、边缘检测、二值法锐化等预处理,将目标从背景中分割出来。经过以上步骤后,目标被突出,图像背景被弱化,从而使目标更容易辨识;图3-3 图像分割与
47、特征提取(2)通过MatLab中的自有函数对初始图库图像和待分类图像进行提取面积、矩形度、原型度、拉伸度以及周长等特征值,为之后的Hu矩不变特征做好准备;(3)通过带入步骤(2)的运算结果计算出初始图库图像和待分类图像的面积、矩形度和伸长度。并按照上文提到的算法计算出每幅图像的7个矩不变特征。这样一来每幅图像就包含了10个特征值,建立一个数组,将特征值存储进去即可。第四章 分类算法本系统在图像分类的功能上,既使用到了监督分类方法,又使用到了非监督分类方法。一下就将这两种分类方法对应的具体算法进行主要介绍。本文使用到了支持向量机分类算法(SVM)以及K-means分类算法。44.1 SVM分类算法1. 算法简介支持向量机(SVM,Support Vector Machine)是在高维特征空间使用线性函数假设空间的学习系统。它将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面。分隔超平面使两个平行超平面的距离最大化。假定平行超平面间的距离或差距越大,分类器的总误差越小。支持向量机由一个来自最优化理论