毕业设计（论文）字符识别算法的设计与实现.doc

资源描述

《毕业设计（论文）字符识别算法的设计与实现.doc》由会员分享，可在线阅读，更多相关《毕业设计（论文）字符识别算法的设计与实现.doc（38页珍藏版）》请在三一办公上搜索。

1、淮阴工学院毕业设计说明书（论文）作者:王书娇学号：1071302107学院:计算机工程学院专业:通信工程题目:字符识别算法的设计与实现讲师高尚兵指导者： (姓名) (专业技术职务)评阅者： (姓名) (专业技术职务)2011年6月毕业设计说明书（论文）中文摘要字符识别属于模板识别的一种，模板识别就是用计算机自动识别，目的在于让机器自动识别实物。常用的字符识别方法很多，主流方法有3大类：采用基于模板匹配的OCR算法、基于人工网络的OCR算法以及主分量分析OCR算法。模板匹配方法是实现离散输入模板分类的有效途径之一, 实质是度量输入模板与样本之间的某种相似性, 取相似性最大者

2、为输入模板所属类别。模板匹配算法简单，很容易实现。模板匹配法在对于具有特定形态的字符识别系统中还是会被广泛使用的。本论文提出的字符识别算法的原理是：在原有模板匹配算法基础上，提出一种改进的模板匹配方法。这种新的模板匹配算法不仅使字符识别率得到提高，而且实现样品匹配效率理论上的提高。实验表明：对于具有一定形态的字符如车牌字符、印刷字和文本字符等字符的识别率确实是有所提高。在提高识别率的基础上，也实现了系统的运算速率的提高。关键词字符识别，模板匹配，特征，识别率毕业设计说明书（论文）外文摘要Title Design and Implementation on Algorithm of Char

3、acter Recognition AbstractCharacter recognition belongs to a template recognition, Template identification is to use the computer automatically recognize. The purpose of the template identification is to automatically identify the kind by the computer.Common character recognition method are many, ma

4、instream method have three categories:OCR algorithm of the template matching, OCR algorithm of artificial network and OCR algorithm of principal component analysis.Template matching method is an effective way to realize discrete input template classification, Essence is to measure the similarity of

5、input template and sample, input template belongs to the category of biggest similarity. Template matching method is simple and easy to implement.Template matching method with a specific form for the character recognition system is still widely used.This paper presents the principle of the character

6、 recognition algorithm is:An improved template matching method was proposed based on the original template matching algorithm.This new template matching algorithm not only improve the rate of character recognition, and improve the efficiency of realizing samples matched in enhancement.The result sho

7、ws that the character recognition rate of them is really improved for a certain form of characters, such as the license plate characters, text characters and printed word. Based on these, the rate of operation system increase.Keywords character recognition, template matching, features, recognition r

8、ate目录1 引言11.1 字符识别技术发展11.2 课题研究背景和意义21.2.1 课题背景21.2.2 课题研究意义21.3 字符识别主要技术介绍31.3.1 模板匹配算法31.3.2 人工网络算法31.3.2 主分量分析算法81.4 字符识别介绍91.4.1 本课题要研究和解决的问题91.4.2 系统开发环境和开发工具92 特征提取介绍102.1 特征的定义102.2 特征提取分类102.2.1 边缘102.2.2 角102.2.3 区域112.2.4 脊112.3 常见的特征112.3.1 颜色特征112.3.2 纹理特征122.3.3 形状特征132.3.4 空间关系特征153 字

9、符识别算法实现183.1 一般模板匹配算法实现183.1.1 特征提取介绍193.1.2 特征提取举例193.1.3 样本库建立203.1.4 模板匹配原理203.1.5 模板匹配算法实现举例213.2 改进模板匹配算法实现223.2.1 特征提取介绍223.2.2 样本库建立243.2.3 模板匹配原理243.2.4 模板匹配算法实现举例253.3 算法比较263.3.1 程序实现263.3.2 匹配效率273.3.3 识别效率29小结30致谢31参考文献321 引言字符是人类历史文明发展的产物，是人类交流的工具。字符识别是模板识别领域内多数课题均会遇到的基本问题。字符识别作为一个运

10、用计算机和图像处理相结合的技术在各个领域发挥着重要的作用。字符识别时工业运用中的一个重要的方面，其发展水平一直受到图像界的关注，原因在于：一方面，字符识别技术的发展难度很大，这种难度不仅在于字符的图像识别，而且在于实际应用的复杂性和应用部门对系统价格的承受能力；另一方面，图像处理技术的发展所产生的效益也是十分显著的，其实际应用系统也将产生很大的经济效益和社会效益。例如，车牌号码的识别、手写字符的识别等。手写字符识别技术在计算机、手机上都得到广泛的运用。在国外，车牌识别作为字符识别的一个应用领域，技术已经成熟，而在我国，对于车牌识别技术研究还主要是集中在对各种车牌定位、字符分割和识别等方面的算法

11、进行研究上。1.1 字符识别技术发展字符识别的两大重要领域是手写字符识别和车牌号码识别。手写字符技术是在八十年代后期，计算机硬件资源发生了巨大变化的基础上发展起来的。八十年代末九十代初，手写体识别研究数目剧增，大量的OCR方面的论文和系统见诸于世；SOPIE、IEEE在这一方向举办了多次会议。到1922年大致形成了以结构方法和统计方法两个方向，系统逐渐向实用化发展。1992年后单字符手写体识别，尤其是数字识别率接近95%，实用系统进入市场。有代表性的国内系统和研究小组由美国的Expervision的RTK（Recognition Cool Kits）、美国纽约州大学buffalo分校的ceda

12、r研究中心、加拿大concordia大学的CENPARMI实验室等，国内则以清华大学电子系、北京信息工程学院、中自汉王、北京邮电大学信息系、沈阳自动化所以及清华大学计算机系为代表3。而作为另一个重要领域车牌号码识别技术，在国外已经发展较为成熟。目前国外车牌识别系统已经有很多的成熟产品。以色列Hi-Tech公司的See/CarSystem系列，新加坡optasia公司的IMPS系列都是比较成熟的产品。其中IMPS产品主要是和新加坡的车牌，近年来也有一些新产品来适应不同国家的车辆，可以识别汉字以及特殊草体文字等。另外，日本、韩国、德国、意大利、英国等国家都有是和本国的识别系统。虽然，国外的车牌识别

13、系统研究工作已经有很大进展，但对我国不适合，只能做某方面的借鉴。国内在90年代也开始了车牌识别的研究。目前比较成熟的产品有中科院自动化研究所汉王科技的“汉王眼”，深圳吉通电子有限公司的“车牌通”、上海高德威只能交通系统有限公司的汽车牌照识别器等等。1.2 课题研究背景和意义1.2.1 课题背景随着计算机应用领域的不断扩大和图像处理技术的不断提高，越来越多的人将目光放在了研究字符识别上。现在很多工厂实现了机器作业全自动化，各行各业都朝着那个方向发展。有人提出了给车辆建立它们的身份系统，有了这个系统，当检测车辆超载、超车等违规现象可以自行对车主进行处罚、记录，当车辆被收取过路费时可以自动从车主账户

14、处理，以及对被盗车辆和犯罪车辆实时监控等。虽然国外技术已经成熟，但发达国家并不对外公布这种技术。我国的车牌系统具有自身的特殊性，国外的车牌识别系统一般不能直接使用。我国的车牌中不仅有英文字母和阿拉伯数字，还包括笔画繁杂的汉字，导致其识别难度比仅有之母、数字的识别大的多，加上国内部分车道路条件差，车辆污染比较严重，而且实际运行车辆号码牌收到泥、油、漆等影响，车牌往往会有断裂现象。同时号牌制作工艺的不规范也会出现字符变浅、变模糊，是车牌字符识别的难度比不同的字符识别大的多。这也是国内现有的车牌识别系统识别效率不够高的主要原因。所以准确的识别车牌字符，现已成为了国内车牌识别系统的重点和难点。这不仅需

15、要计算机技术、拍摄技术，还需要图像处理技术等。图像分割在字符识别研究中是非常重要的技术之一。图像分割是图像处理中最为基础和重要的领域之一，它是指将一幅图像分解为若干互不交迭区域的集合。图像处理技术的发展为和计算机技术的发展为字符识别打下了很好的基础。1.2.2 课题研究意义字符识别属于模板识别的一种，模板识别就是用计算机自动识别，目的在于让机器自动识别实物。自动识别也就代替了人的工作。车辆牌照自动识别系统是图像模板识别领域的一个经典课题。作为字符识别技术中一个重要领域车牌识别，也被越来越多的人关注。车牌自动识别系统能广泛应用于高速公路不停车收费站、城市交叉口、港口和机场、国家重要机关出入地等场

16、所，对提高这些场所交通系统的管理水平和自动化程度具有重要的意义。有了这个系统，交警不用担心有人违规而没被发现；收费站也就不需要那么多人来对过往车辆进行人工收费，省下不少劳动力，而且也减少了过往车主的时间；被盗车和犯罪车辆都能及时发现和处理等。而手写字符识别在信息处理、办公自动化、邮政处理系统等多方面具有着重要的使用价值和理论意义。字符识别也具有广泛的运用前景，比如电脑阅卷，把考试试卷都扫描到电脑上，根据扫面的图片识别出学生的答案，然后和标准答案比较，自动评分并将学生的姓名和分数记录在相应表格中，呈现给老师。在未来可以设计字符识别电子锁，讲房子主人的签名录入电子锁内，当主人要开门时，只要拿和电子

17、锁配备的笔在屏幕上写上自己的名字，电子锁根据原有的档案和现在的图形进行比较，相符就会开门，不符则不会开门。相应的原理还可以用在保险箱上，银行卡密码设置上等。对于盲人而言，如果有一个装置，在盲人需要读书、看报、使用电脑是，可以语音播报扫面到的字符。这样对于盲人来说，这是他们的另一双眼睛，代替他们那双不能用的眼睛来看这个世界，他们的世界就不会障碍重重。对于哑巴来说，如果有这样一个放在手写并能朗读出所写内容的装置，相信他们出门会更方便，即使我们大多数人不懂哑语，但有了这个装置，我们也能和轻松地明白他们要说什么，沟通起来更方便。相信字符识别技术随着慢慢的发展，会更好的为人类服务。1.3 字符识别主要技

18、术介绍常用的字符识别方法很多，主流方法有3大类：采用基于模板匹配的OCR算法、基于人工网络的OCR算法以及主分量分析OCR算法。1.3.1 模板匹配算法模板匹配方法是实现离散输入模板分类的有效途径之一, 实质是度量输入模板与样本之间的某种相似性, 取相似性最大者为输入模板所属类别。它根据字符的直观形象抽取特征, 用相关匹配原理进行识别, 即是将输入字符与标准字符在一个分类器中进行匹配。模板匹配算法主要通过使用相应字符特征向量之间的距离进行匹配，这类算法只有找到了准确的字符特征描述方法，才能较好的识别出相应的字符，但方法简单。常用的字符特征包括字符像素点值、字符边界有向链表、字符笔画、字符拐点等

19、。1.3.2 人工网络算法人工神经网络的研究，可以追溯到 1957年Rosenblatt提出的感知器(Perceptron)模型。它几乎与人工智能AI（Artificial Intelligence）同时起步，但30余年来却并未取得人工智能那样巨大的成功，中间经历了一段长时间的萧条。直到30年代，获得了关于人工神经网络切实可行的算法，以及以Von Neumann体系为依托的传统算法在知识处理方面日益显露出其力不从心后，人们才重新对人工神经网络发生了兴趣，导致神经网络的复兴。从神经细胞处理刺激的角度看，每个神经细胞可以简单地看做由三部分组成：树突，轴突，细胞体。对每个神经细胞，树突可以由多个

20、，它们是接受来自其他神经细胞的刺激的通道；细胞体只有一个，它接受刺激并进行相应的处理；轴突也只有一个，它负责输出刺激，通过神经连接传递给其他神经元。当某个来自大脑或者感受器的刺激发生，神经细胞就通过树突-胞体-轴突-神经连接-其他细胞这样的迅速将刺激通过处理传到其他神经细胞。这样一条通路就是一个信息处理的通路。整个神经系统由无数的神经细胞及神经连接组成，构成一个神奇的巨大的信号处理系统。图1-1神经细胞处理系统但是刺激在神经系统里并非毫无规律地广播式地传播。通常某条通道对某类刺激传播的速度比较快，而且神经细胞每传播一次这类刺激，似乎这类刺激就在这个神经细胞里留下了痕迹，就好像很多动物会在走

21、过的路上留下分泌物。渐渐地这类刺激在大多数情况下多会从这条通道经过，通过这条通道相同的处理后输出。聪明的科学家从生物的神经系统里得到启示，创造了一种新的处理信号的具有一定智能的人工神经网络。他们仿造生物神经系统建立了这样一个信号处理的模型：每个信息处理单元接受n个输入X1,X2Xn,对每个输入的灵敏度为W1,W2Wn,处理单元的处理功能用一个函数y = f(X1*W1+X2*W2+Xi*Wi+Xn*Wn- )表示，而处理单元处理的结果就是输出Y。由多个这样的信息处理单元构成的一个网络就是人工神经网络。让我们看一下美国神经网络学家Hecht Nielsen对人工神经网络的定义：人工神经网络是由多

22、个非常简单的处理单元彼此按某种方式相互连接而形成的计算机系统，该系统考其状态对外部输入信息的动态响应来处理信息。（一）设计信息处理单元连接的方式按照信息处理单元的连接方式，神经网络可以分为多种类型。这里介绍按照结点有无反馈划分的两种典型的网络结构：（1）前馈网络网络可以分为几个层。各层按信号传输先后顺序依次排列，第i层的神经元只接受第i-1层神经元给出的信号。各神经元之间没有反馈。输入层结点与输出层结点称为“可见层”，其他中间层则称为“隐层”。（2）反馈网络网络分层，某些结点除了接受外加输入以外，还要接受其他结点的反馈，或者是自身的反馈。当然，除了这种划分方式，还有按照层数划分为单层网络与

23、多层网络，按照输入数据的特点划分为离散网络和连续网络等。不同的网络在性能和效率上会有很大的差异，一般来说，跨层连接的结点越多，网络越是可靠；层数越多，网络的效率越低；反馈越多，网络的学习能力越强；结点个数越多，网络的记忆能力就越好。因此往往要根据实际应用设计网络的连接。在这里，我们不难得出一个结论：信息处理单元连接的方式的设计是人工神经网络算法设计的一个重要方面。目前研究得相对成熟的是BP误差反传神经网络，Hopfield反馈神经网络，BAM双向联想记忆神经网络，CMAC小脑神经网络，RBF径向基函数神经网络，SOM自组织特征映射神经网络，CPN对偶传播神经网络，ART自适应谐振理论，量子神经

24、网络。有兴趣的读者可参照相关资料。（二）设计学习算法在人工智能领域，人工神经网络是模拟人脑的模板匹配的主要手段。根据常识我们很容易理解，人脑要对某个模板得到正确匹配，需要大量的训练和纠正。训练越多，纠正越多，匹配就越准确。人工神经网络也是如此，要通过大量的学习才能投入正确使用，在使用中又不断地自我学习。这里摘抄一段来自百度网站的例子，虽然并不够权威，但能够很简单地说明问题。现以人工神经网络对手写“A”、“B”两个字母的识别为例进行说明，规定当“A”输入网络时，应该输出“1”，而当输入为“B”时，输出为“0”。所以网络学习的准则应该是：如果网络作出错误的的判决，则通过网络的学习，应使得网络减

25、少下次犯同样错误的可能性。首先，给网络的各连接权值赋予(0，1)区间内的随机值，将“A”所对应的图象模板输入给网络，网络将输入模板加权求和、与门限比较、再进行非线性运算，得到网络的输出。在此情况下，网络输出为“1”和“0”的概率各为50%，也就是说是完全随机的。这时如果输出为“1”(结果正确)，则使连接权值增大，以便使网络再次遇到“A”模板输入时，仍然能作出正确的判断。如果输出为“0”(即结果错误)，则把网络连接权值朝着减小综合输入加权值的方向调整，其目的在于使网络下次再遇到“A”模板输入时，减小犯同样错误的可能性。如此操作调整，当给网络轮番输入若干个手写字母“A”、“B”后，经过网络按

26、以上学习方法进行若干次学习后，网络判断的正确率将大大提高。这说明网络对这两个模板的学习已经获得了成功，它已将这两个模板分布地记忆在网络的各个连接权值上。当网络再次遇到其中任何一个模板时，能够作出迅速、准确的判断和识别。一般说来，网络中所含的神经元个数越多，则它能记忆、识别的模板也就越多。这个例子引出了一个“学习算法”。学习算法的设计是人工神经网络算法设计的另外一个重要的方面。学习算法设计得好，网络的学习能力就越强，容错能力也越强。经典的学习算法有Hebb规则，误差修正法学习规则，胜者为王学习规则，有兴趣的读者可参照相关资料。（三）设计功能函数信息处理单元的功能是人工神经网络算法设计的又一重

27、要方面，一般以功能函数的形式给出（及模型中的F函数）。功能函数的设计直接影响到网络的功能。常见的功能函数有：（1）简单线性函数：神经元功能函数F连续取值，输入X由连接矩阵W加权产生输出。F(X)=X（2）对称硬限幅函数：F(X)=SGN(X-).此函数只有二值，大于阀值输出+1，小于阀值输出-1。（3）正线性函数：F(X)=0 if X=0。另外还有硬限幅函数，线性函数，饱和线性函数，对称饱和线性函数，淡极性S形函数，双曲正切S形函数，竞争函数等。综上，设计信息处理单元的连接方式，设计网络学习算法，设计信息处理单元的功能，是人工神经网络算法设计的三个基本的方面。具体的算法细则应该根据网络

28、的性能，功能，应用场合等设计。（四）实际应用受当前脑科学，集成技术发展的限制，各种人工神经网络模型还过于简单，远远达不到模拟自然神经网络的智能。但即便这样，人工神经网络仍有很大的用武之地。各种基于人工神经网络的与实际问题相结合的模型不断地被建立，如人脸识别，车牌自动扫描等。（五）当前研究现状及趋势目前在神经网络研究方法上已形成多个流派，最富有成果的研究工作包括：多层网络 BP算法，Hopfield网络模型，自适应共振理论，自组织特征映射理论等对神经网络研究可以分为理论研究和应用研究两大方面。理论研究可分为以下两类：（1）利用神经生理与认知科学研究人类思维以及智能机理。（2）利用神经基础理论的

29、研究成果，用数理方法探索功能更加完善、性能更加优越的神经网络模型，深入研究网络算法和性能，如：稳定性、收敛性、容错性、鲁棒性等；开发新的网络数理理论，如：神经网络动力学、非线性神经场等。应用研究可分为以下两类：（1）神经网络的软件模拟和硬件实现的研究。（2）神经网络在各个领域中应用的研究。这些领域主要包括：模板识别、信号处理、知识工程、专家系统、优化组合、机器人控制等。目前，对人工神经网络及相关算法的研究正如火如荼地展开。某些算法已经应用到实际生产中。人工神经网络的应用领域正在不断扩大，不仅可以广泛应用于工程，科学和数学领域，也可广泛应用于医学，商业，金融甚至于文学领域。随着各种神经

30、网络模型的创建和各种硬件，网络设备制造工艺的提高，人工神经网络的应用将会越来越广泛。神经网络识别时目前应用最广泛的一种基于机器学习的识别方法，神经网络是通过对人脑生物神经机理进行简化，抽象和模拟之后建立起来的一种计算机模型，属于极其学习的重要领域。为保证高识别率，神经网络需要使用大量样本进行训练，而样本的手机和选取大大增加了这类系统的局限性，且神经网络本身对有噪声和变化较大的样本训练集难以适应，易陷入局部最优出现“过拟和”现象。1.3.2 主分量分析算法主分量分析又称主成分分析，也有称经验正交函数分解或特征向量分析。分析对象：以网格点为空间点（多个变量）随时间变化的样本主分量分析与回归分析

31、、差别分析不同，它是一种分析方法而不是一种预报方法主分量分析能够把随时间变化的气象要素场分解为空间函数部分和时间函数部分。其中空间函数部分概括场的地域分布特点，这部分是不随时间变化的，而时间函数部分则由空间点的线性组合所构成，称为主分量，这些主分量的头几个占有原空间点的总方差的很大部分。研究主分量随时间变化的规律就可以代替对场的随时间变化的研究。我们希望可以通过某种线性组合的方法使某个变量或者某些变量的解释方差变得比较大，这些具有较大解释方差的变量就称为主分量。 EOF（主分量）结果分析：通过显著性检验的前几项特征向量最大限度地表征了某一区域气候变量场的变率分布结构。它们所代表的空间分

32、布型式是该变量场典型的分布结构。如果特征向量的各分量均为同一符号的数，那么这一特征向量所反映的是该区域变量变化趋势基本一致的特征，数值绝对值较大处则为中心。如果某一特征向量的分布呈正、负相间的分布型式，这一个特征向量则代表了两种分布类型。特征向量所对应的时间系数代表了这一区域由特征向量所表征的分布型式的时间变化特征。系数数值绝对值越大，表明这一时刻这类分布型式越典型。从特征值的方差贡献和累积方差贡献了解所分析的特征向量的方差占总方差的比例及前几项特征向量总共占总方差的比例。主分量分析法往往需要配合分类器一起使用，他能将高维的特征数据映射到相互正交和特征空间中去，并选择其中能量最大的特征量

33、来表征和区分样本。它对于特征的优化和选择具有很重要的意义。但这类算法余姚给样本建立高维的特征空间，如果特征空间低则会降低特征选择的效果，也不利于分类。1.4 字符识别介绍1.4.1 本课题要研究和解决的问题本课题的主要内容是介绍了几种字符识别算法，分析了这几种算法的原理和特点。提出一到两种字符识别算法并用MATLAB实现。字符识别的算法有很多种，但目前为止还没有一个通用的方法，也不存在一种判断识别是否最优的客观标准。1.4.2 系统开发环境和开发工具操作系统：Windows Vista Home Premium Service Pack 1。开发工具：MATLAB ,Version 7.4.0

34、.237(R2009a)。MATLAB(矩阵实验室)，功能十分强大，运算效率很高的工程数学工具软件，全称是Matrix Laboratory。起初它是一种专门用于矩阵运算的软件，经过多年的发展，MATLAB已经发展成为一种功能强大的软件，几乎可以解决科学计算中的任何问题。矩阵和数组是MATLAB的核心，因为MATLAB中的所有数据都是以数组的表示和储存的。除了常用的矩阵代数运算值外，MATLAB还提供了非常广泛和灵活的方式处理数据集的数组运算功能。另外，MATLAB除了对矩阵提供了强大的处理能力之外，还具有一种与其他高级语言相似的编程特性。同时它还可以与.NET和C+语言混合编程，进一步扩展了

35、其功能。在图形可视化方面，MATLAB提供了图形用户界面（GUI），使得用户可以进行可视化编程。因此，MATLAB就把数据结构、编程特性以及图形用户界面完美地结合到一起。在图像处理的过程中涉及到大量数据的处理，尤其是矩阵数据和数组数据。在这方面，相比于C+等语言，MATLAB有不可比拟的优势。在图像处理的过程中，会涉及到图像的频域变换的问题，MATLAB在这方面也有很好的优势。综上，选择MATLAB作为开发工具。2 特征提取介绍特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息，决定每个图像的点是否术语一个图像特征。特征提取的结果是把图像上的点分为不同的子集，这些子集往

36、往属于孤立的点、连续的曲线或者连续的区域。 2.1 特征的定义至今为止特征没有万能和精确的定义。特征的精确定义往往由问题或者应用类型决定。特征是一个数字图像中“有趣”的部分，它是许多计算机图像分析算法的起点。因此一个算法是否成功往往由它使用和定义的特征决定。因此特征提取最重要的一个特性是“可重复性”：同一场景的不同图像所提取的特征应该是相同的。特征提取是图象处理中的一个初级运算，也就是说它是对一个图像进行的第一个运算处理。它检查每个像素来确定该像素是否代表一个特征。假如它是一个更大的算法的一部分，那么这个算法一般只检查图像的特征区域。作为特征提取的一个前提运算，输入图像一般通过高斯模糊核在

37、尺度空间中被平滑。此后通过局部导数运算来计算图像的一个或多个特征。有时，假如特征提取需要许多的计算时间，而可以使用的时间有限制，一个高层次算法可以用来控制特征提取阶层，这样仅图像的部分被用来寻找特征。 2.2 特征提取分类由于许多计算机图像算法使用特征提取作为其初级计算步骤，因此有大量特征提取算法被发展，其提取的特征各种各样，它们的计算复杂性和可重复性也非常不同。 2.2.1 边缘边缘是组成两个图像区域之间边界（或边缘）的像素。一般一个边缘的形状可以是任意的，还可能包括交叉点。在实践中边缘一般被定义为图像中拥有大的梯度的点组成的子集。一些常用的算法还会把梯度高的点联系起来来构成一个更完善的

38、边缘的描写。这些算法也可能对边缘提出一些限制。局部地看边缘是一维结构。 2.2.2 角角是图像中点似的特征，在局部它有两维结构。早期的算法首先进行边缘检测，然后分析边缘的走向来寻找边缘突然转向（角）。后来发展的算法不再需要边缘检测这个步骤，而是可以直接在图像梯度中寻找高度曲率。后来发现这样有时可以在图像中本来没有角的地方发现具有同角一样的特征的区域。 2.2.3 区域与角不同的是区域描写一个图像中的一个区域性的结构，但是区域也可能仅由一个像素组成，因此许多区域检测也可以用来监测角。一个区域监测器检测图像中一个对于角监测器来说太平滑的区域。区域检测可以被想象为把一张图像缩小，然后在缩小的图像

39、上进行角检测。 2.2.4 脊长条形的物体被称为脊。在实践中脊可以被看作是代表对称轴的一维曲线，此外局部针对于每个脊像素有一个脊宽度。从灰梯度图像中提取脊要比提取边缘、角和区域困难。在空中摄影中往往使用脊检测来分辨道路，在医学图像中它被用来分辨血管。 2.3 常见的特征常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。 2.3.1 颜色特征（一）颜色特征特点颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征，此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感，所以颜色特征不能很好地捕捉图

40、像中对象的局部特征。另外，仅使用颜色特征查询时，如果数据库很大，常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法，其优点是不受图像旋转和平移变化的影响，进一步借助归一化还可不受图像尺度变化的影响，基缺点是没有表达出颜色空间分布的信息。（二）常用的特征提取与匹配方法（1）颜色直方图其优点在于：它能简单描述一幅图像中颜色的全局分布，即不同色彩在整幅图像中所占的比例，特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于：它无法描述图像中颜色的局部分布及每种色彩所处的空间位置，即无法描述图像中的某一具体的对象或物体。最常用的颜色空间：RGB颜色

41、空间、HSV颜色空间。颜色直方图特征匹配方法：直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。（2）颜色集颜色直方图法是一种全局颜色特征提取与匹配方法，无法区分局部颜色信息。颜色集是对颜色直方图的一种近似首先将图像从 RGB颜色空间转化成视觉均衡的颜色空间（如 HSV空间），并将颜色空间量化成若干个柄。然后，用色彩自动分割技术将图像分为若干区域，每个区域用量化颜色空间的某个颜色分量来索引，从而将图像表达为一个二进制的颜色索引集。在图像匹配中，比较不同图像颜色集之间的距离和色彩区域的空间关系。（3）颜色矩这种方法的数学基础在于：图像中任何的颜色分布均可以用它的矩来表示

42、。此外，由于颜色分布信息主要集中在低阶矩中，因此，仅采用颜色的一阶矩（mean）、二阶矩（variance）和三阶矩（skewness）就足以表达图像的颜色分布。（4）颜色聚合向量其核心思想是：将属于直方图每一个柄的像素分成两部分，如果该柄内的某些像素所占据的连续区域的面积大于给定的阈值，则该区域内的像素作为聚合像素，否则作为非聚合像素。 2.3.2 纹理特征（一）纹理特征特点纹理特征也是一种全局特征，它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性，并不能完全反映出物体的本质属性，所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同，纹理特征不

43、是基于像素点的特征，它需要在包含多个像素点的区域中进行统计计算。在模板匹配中，这种区域性的特征具有较大的优越性，不会由于局部的偏差而无法匹配成功。作为一种统计特征，纹理特征常具有旋转不变性，并且对于噪声有较强的抵抗能力。但是，纹理特征也有其缺点，一个很明显的缺点是当图像的分辨率变化的时候，所计算出来的纹理可能会有较大偏差。另外，由于有可能受到光照、反射情况的影响，从2-D图像中反映出来的纹理不一定是3-D物体表面真实的纹理。例如，水中的倒影，光滑的金属面互相反射造成的影响等都会导致纹理的变化。由于这些不是物体本身的特性，因而将纹理信息应用于检索时，有时这些虚假的纹理会对检索造成“误导”。在

44、检索具有粗细、疏密等方面较大差别的纹理图像时，利用纹理特征是一种有效的方法。但当纹理之间的粗细、疏密等易于分辨的信息之间相差不大的时候，通常的纹理特征很难准确地反映出人的视觉感觉不同的纹理之间的差别。（二）常用的特征提取与匹配方法纹理特征描述方法分类（1）统计方法统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法Gotlieb 和 Kreyszig 等人在研究共生矩阵中各种统计特征基础上，通过实验，得出灰度共生矩阵的四个关键特征：能量、惯量、熵和相关性。统计方法中另一种典型方法，则是从图像的自相关函数（即图像的能量谱函数）提取纹理特征，即通过对图像的能量谱函数的计算，提取纹理的粗

45、细度及方向性等特征参数（2）几何法所谓几何法，是建立在纹理基元（基本的纹理元素）理论基础上的一种纹理特征分析方法。纹理基元理论认为，复杂的纹理可以由若干简单的纹理基元以一定的有规律的形式重复排列构成。在几何法中，比较有影响的算法有两种：Voronio 棋盘格特征法和结构法。（3）模型法模型法以图像的构造模型为基础，采用模型的参数作为纹理特征。典型的方法是随机场模型法，如马尔可夫（Markov）随机场（MRF）模型法和 Gibbs 随机场模型法（4）信号处理法纹理特征的提取与匹配主要有：灰度共生矩阵、Tamura 纹理特征、自回归纹理模型、小波变换等。灰度共生矩阵特征提取与匹配主要

46、依赖于能量、惯量、熵和相关性四个参数。Tamura 纹理特征基于人类对纹理的视觉感知心理学研究，提出6种属性，即：粗糙度、对比度、方向度、线像度、规整度和粗略度。自回归纹理模型（simultaneous auto-regressive, SAR）是马尔可夫随机场（MRF）模型的一种应用实例。 2.3.3 形状特征（一）形状特征特点个基于形状特征的检索方法都可以比较有效地利用图像中感兴趣的目标来进行检索，但它们也有一些共同的问题，包括：目前基于形状的检索方法还缺乏比较完善的数学模型；如果目标有变形时检索结果往往不太可靠；许多形状特征仅描述了目标局部的性质，要全面描述目标常对计算时间和存储量有较

47、高的要求；许多形状特征所反映的目标形状信息与人的直观感觉不完全一致，或者说，特征空间的相似性与人视觉系统感受到的相似性有差别。另外，从 2-D 图像中表现的 3-D 物体实际上只是物体在空间某一平面的投影，从 2-D 图像中反映出来的形状常不是 3-D 物体真实的形状，由于视点的变化，可能会产生各种失真。（二）常用的特征提取与匹配方法通常情况下，形状特征有两类表示方法，一类是轮廓特征，另一类是区域特征。图像的轮廓特征主要针对物体的外边界，而图像的区域特征则关系到整个形状区域。几种典型的形状特征描述方法（1）边界特征法该方法通过对边界特征的描述来获取图像的形状参数。其中Hough 变换检测平行直线方法和边界方向直方图方法是经典方法。Hough 变换是利用图像全局特性而将边缘像素连接起来组成区域封闭边界的一种方法，其基本思想是点线

展开阅读全文