机器视觉设计和实现电气工程工专业.docx

资源描述

《机器视觉设计和实现电气工程工专业.docx》由会员分享，可在线阅读，更多相关《机器视觉设计和实现电气工程工专业.docx（49页珍藏版）》请在三一办公上搜索。

1、目录摘要3Abstract4第1章绪论51.1 自动识别课题背景51.2 机器视觉51.2.1 机器视觉的发展概况51.2.2 机器视觉与图像处理71.3 图像处理与识别技术91.4 图像处理与识别系统101.4.1 关于计算机图像处理系统101.4.2 图像处理与识别系统的构成111.5 斑马线自动识别系统课题研究内容12第2章图像处理与识别及图像理解142.1 二值图像分析142.1.1 阈值运算152.2 图像区域分析172.2.1 区域与边缘172.3 图像处理与识别及图像理解所研究的内容192.3.1 图像处理技术192.3.2 图像识别技术202.3.3 图像理解212.4 图像处

2、理与识别及图像理解的关系242.4.1 图像处理242.4.2 图像理解252.5 图像处理工具MATLAB26第三章斑马线自动识别系统主要算法283.1 边缘检测283.2 坎尼(Canny)算子293.3 模板匹配算法32第4章基于matIab的斑马线自动识别系统354.1 系统结构流图354.2 系统功能模块分析与实现364.2.1 图像分割模块364.2.2 模板读取模块404.2.3 图像识别模块404.2.4 GUl界面设计及系统测试42结论45致谢47参考文献48摘要机器视觉也称图像分析与理解。机器视觉的发展推动智能系统的发展，也拓宽计算机与各种智能机器的研究范围和应用领域。图像

3、处理与识别技术是机器视觉的一个重要组成部分。图像处理与识别技术的发展经历了初创期，发展期，普及期，和实用期4个阶段。20世纪90年代是图像技术的实用化时期，特点就是图像处理的信息量巨大，对处理速度的要求极高。人行道路的斑马线自动识别系统的课题设计，以一幅交通道路识别为例，具体介绍了斑马线自动识别的原理。整个处理过程分为图像预处理、图像边缘提取、图像定位、图像分割、图像识别五大模块，用MATLAB软件编程来实现每一个部分,最后识别出人行道路图像。在研究的同时对其中出现的问题进行了具体分析。关键词：机器视觉图像处理自动识别预处理边缘提取图像定位图像分割图像识别AbstractMachinevisi

4、onisalsoImageanalysisandunderstanding.ThedevelopmentofmachinevisionpromotetheprogressofIntelligentsystem,andalsowidentheresearchandapplicationfieldofcomputerandeveryintelligentmachine.Technologyofimageprocessingandrecognitionistheimportantcomponentofmachinevision.Theprogressofimageprocessingandrecog

5、nitionhavefourphasesthatisinitialperioddevelopmentperioduniversalperiodandpracticalperiod.Thepracticalperiodofimagetechnologyis1990s20thcentury.Thefeaturesisthattheinformationofimageprocessingtoobig,andsothat,itsprocessingspeedmustbefast.Thecourseoftrafficsignautomatismrecognitionsystem,withonetraff

6、icsignrecognition,theprincipleofthetrafficsignrecognitionisintroducedconcretely.Thisprocesswasdividedintoimagepre-process,imageedgeextraction,imagelocation,imagedivisionandimagerecognition,whichisimplementedseparatedbyusingMATLAB.Thetrafficsignimageisrecognizedatlast.Atthesametime,theproblemsarealso

7、analyzed.Andsolvedintheprocess.Keywords:Machinevisionimageprocessingautomatismrecognitionpre-processedgeextractionimagelocationimagedivisionimagerecognition第1章绪论1.1 自动识别课题背景人类在征服自然、改造自然和推动社会进步的过程中，面临着自身能力、能量的局限性，因而发明和创造了许多机器来辅助或代替人类完成任务.智能机器，包括智能机器人，是这种机器最理想的形式,也是人类科学研究中所面临的最大挑战之一.智能机器是指这样一种系统，它能模拟人

8、类的功能，能感知外部世界并有效地解决人所能解决问题.人类感知外部世界主要是通过视觉、触觉、听觉和嗅觉等感觉器官，其中约80%的信息是由视觉获取的.因此,对于智能机器来说,赋予机器以人类视觉功能对发展智能机器是及其重要的，也由此形成了一门新的学科一机器视觉(也称机器视觉或图像分析与理解等).机器视觉的发展不仅将大大推动智能系统的发展，也将拓宽计算机与各种智能机器的研究范围和应用领域。1.2 机器视觉1.2.1 机器视觉的发展概况70年代中期,麻省理工学院(Mrr)人工智能(AI)实验室正式开设机器视觉”(MaChineViSion)课程，由国际著名学者B.K.P.Horn教授讲授.同时，MITA

9、I实验室吸引了国际上许多知名学者参与机器视觉的理论、算法、系统设计的研究，DaVidMarr教授就是其中的一位.他于1973年应邀在MlTAl实验室领导一个以博士生为主体的研究小组,1977年提出了不同于“积木世界分析方法的计算视觉理论(computationalvision),该理论在80年代成为机器视觉研究领域中的一个十分重要的理论框架.可以说，对机器视觉的全球性研究热潮是从20世纪80年代开始的，到了80年代中期，机器视觉获得了蓬勃发展，新概念、新方法、新理论不断涌现，比如，基于感知特征群的物体识别理论框架，主动视觉理论框架，视觉集成理论框架等.到目前为止，机器视觉仍然是一个非常活跃的研

10、究领域.许多会议论文集都反应了该领域的最新进展，比如，InternationalConferenceonComputerVisionandPatternRecognition(CVPR);InternationalConferenceonComputerVision(ICCV);InternationalConferenceonPatternRecognition(ICPR);InternationalConferenceonRoboticsandAutomation(ICRA);WorkshoponComputerVision,andnumerousconferencesofSPIE.还有许

11、多学术期刊也包含了这一领域的最新研究成果，如，IEEETransactiononPatternAnalysisandMachineIntelIigence(PAMI);ComputerVision,Graphics,andImageProcessing(CVGIP);IEEETransactiononImageProcessing;IEEETransactiononSystems,Man,andCybernetics(SMC);MachineVisionandApplications;InternationalJournalonComputerVision(IJCV);ImageandVisi

12、onComputing;andPatternRecognition.每年还出版许多研究专集、学术著作、技术报告，举行专题讨论会等.所有这些都是研究机器视觉及其应用的很好信息来源.Marr的视觉计算理论Mal982立足于计算机科学，系统地概括了心理生理学、神经生理学等方面业已取得的所有重要成果，是视觉研究中迄今为止最为完善的视觉理论.Marr建立的视觉计算理论，使机器视觉研究有了一个比较明确的体系，并大大推动了机器视觉研究的发展.人们普遍认为，机器视觉这门学科的形成与Marr的视觉理论有着密切的关系.事实上，尽管20世纪70年代初期就有人使用机器视觉这个名词Binford,1971,但正是Mai

13、T70年代末建立的视觉理论促使机器视觉这一名词的流行.1.2.2 机器视觉与图像处理机器视觉相关的学科有许多.与机器视觉密切相关的领域及机器视觉与其它学科的关系如下.图像处理是一个发展比较成熟的领域.图像处理技术通常是把一幅图像变换成另外一幅图像，也就是说，图像处理系统的输入是图像，输出仍然是图像，信息恢复任务则留给人来完成.图像处理包括图像增强、图像压缩和模糊校正与非聚焦图像等课题.机器视觉系统把图像作为输入，产生的输出为另一种形式，比如图像中物体轮廓的表示.因此，机器视觉的重点是在人的最小干预下，由计算机自动恢复场景信息.图像处理算法在机器视觉系统的早期阶段起着很大的作用，它们通常被用来增

14、强特定信息并抑制噪声.计算机图形学是通过几何基元，如线、圆和自由曲面，来生成图像，它在可视化(Visualization)和虚拟现实(VirtualReality)中起着很重要的作用.机器视觉正好是解决相反的问题，即从图像中估计几何基元和其它特征.因此，计算机图形学属于图像综合，机器视觉属于图像分析.这两个领域在其发展的早期阶段是没有什么联系的，但是近十几年来发展的越来越相近了.机器视觉使用了计算机图形学中的曲线和曲面表示方法以及其它的一些技术，而计算机图形学也使用机器视觉技术，以便在计算机中建立逼真的图像模型.可视化和虚拟现实把这两个领域紧密地联系在一起.模式识别主要用于识别各种符号、图画等

15、平面图形.模式一般指一类事物区别于其它事物所具有的共同特征。模式识别方法主要有统计方法和句法方法两种，统计方法是指从模式抽取一组特征值，并以划分特征空间的方法来识别每一个模式。句法方法是指利用一组简单的子模式(模式基元)通过文法规则来描述复杂的模式。模式识别方法是机器视觉识别物体的重要基础之一.机器视觉识别物体还经常需要其它的技术.我们将在物体识别部分简要地讨论统计模式识别的主要内容.人工智能(artificialintelligent,AD涉及到智能系统的设计和智能计算的研究.在经过图像处理和图像特征提取过程后，接下来要用人工智能方法对场景特征进行表示，并分析和理解场景.人工智能有三个过程：

16、感知、认知和行动.感知把反应现实世界的信息转换成信号，并表示成符号，认知是对符号进行各种操作，行动则把符号转换成影响周围环境的信号.人工智能的许多技术在机器视觉的各个方面起着重要作用.事实上，机器视觉通常被视为人工智能的一个分支.人工神经网络(artificialneuralnetworks,ANNs)是一种信息处理系统，它是由大量简单的处理单元(称为神经元)通过具有强度的连接(connection)相互联系起来，实现并行分布式处理(ParaIIeIdistributionprocessing,PDP).人工神经网络的最大特点是可以通过改变连接强度来调整系统，使之适应复杂的环境，实现类似人的学

17、习、归纳和分类等功能.人工神经网络已经在许多工程技术领域得到了广泛的应用.神经网络作为一种方法和机制将用于解决机器视觉中的许多问题.神经物理学与认知科学长期将人类视觉作为主要的研究对象.机器视觉中已有的许多方法与人类视觉极为相似.目前，许多机器视觉研究者对研究人类视觉计算模型比研究机器视觉系统更感兴趣，希望机器视觉更加自然化，更加接近生物视觉。1.3 图像处理与识别技术图像就是用各种观测系统以不同形式和手段观测客观世界而获得的，可以直接或间接作用于人眼而产生视知觉的实体。人类从外界获得的信息约有75%来自于视角系统，也就是说，人类的大部分信息都是从图像中获得。图像处理是人类视觉延伸的重要手段，

18、可以使人们看到任意波长上所测得的图像。例如，借助伽马相机，X光机，人们可以看到红外和超声图像；借助CT可看到物体内部的断层图像；借助相应工具可看到立体图像。1964年，美国在太空拍回的大量月球照片就是使用了计算机对图像进行了处理，使原本不清晰的图像信息得以清晰再现。这是这门技术发展的重要里程碑。此后，图像处理技术在空间研究方面得到广泛应用。总体来说，图像处理技术的发展经历了初创期，发展期，普及期,和实用期4个阶段。20世纪90年代是图像技术的实用化时期，图像处理的信息量巨大，对处理速度的要求极高。图像识别所讨论的问题，是研究用计算机代替人工自动地处理大量的物理信息，解决人类生理器官所不能识别的

19、问题，从而部分代替人的脑力劳动。人类识别图像的过程总是先找出它们外形或颜色的某些特征进行比较分析，判断，然后加以分门别类，即识别它们。人们在研制自动识别机时也往往借鉴人的思维活动，采用同样的处理方法,然后图像的灰度与色彩是由光强和波长不同的光波引起，它们与景物表面的特性，方向，光线条件以及干预等多种因素有关。在各种恶劣的工作环境中，图像与景物已有较大的差别。因此要区分图像属于哪一类，往往要经过预处理，分割，特征抽取，分析，分类，识别等一系列过程。现在这些技术完全可通过计算机进行模拟，对图像信息进行处理来达到对它的区别。21世纪的图像技术要向高质量化方面发展，主要体现在以下几点:首先高分辨率，高

20、速度，图像处理技术发展的最终目标是要实现图像的实时处理，这在移动目标的生成，识别和跟踪上有着重要意义；其次是立体化，立体化所包括的信息最为完整和丰富，数字全息技术将有利于达到这个目的；再者是智能化，其目的是实现图像的智能生成,处理，识别和理解。1.4 图像处理与识别系统1.4.1 关于计算机图像处理系统计算机图像处理技术是以计算机为核心的应用技术，因此，计算机图像处理系统的发展，是随着计算机技术的提高而提高的。从系统的层次来看，可分为高、中、低3个档次；从图像传感器的敏感区域看，又可分为可见光、红外、近红外、X射线、雷达、伽玛射线、超声波等图像处理系统；从采集部件与景物的距离上来说，还可以分成

21、遥感、宏观和微观图像处理系统；就应用场所而言，又能分成通用图像处理系统和专用图像处理系统。通用图像处理系统一般用于研究开发,因此，要求传感器敏感区间宽，线性度好；而专用系统一般用于特殊用途，是在通用系统研究基础上，研制开发的为现实某一个或几个功能的商用系统。因此，在保证性能的前提下，由价格因素决定系统的配置。1、高档图像处理系统采用高速芯片设计，完全适合图像和信号处理特有规律的并行阵列图像处理机。这类系统采用多CPU或多机结构，可以以并行或流水线方式工作。2、中档图像处理工作站以小型机或工作站为主控计算机，加上图像处理器构成。这类系统有较强的交互处理能力，同时，由于用通用机做主控机，因而在系统

22、环境下，具有较好的再开发能力。3、抵挡的微机图像处理系统由微机加上图像采集卡构成，其结构简单，是一种便于普及和推广的图像处理系统，也是本书着重介绍的系统。1.4.2 图像处理与识别系统的构成微机图像处理系统由图像的采集部件、主机和图像的输出部件3个部分组成。1、采集部件。原始的图像数据是通过图像采集部件进入计算机的，因此，图像采集部件的作用是采集原始的模拟图像数据，并将模拟信号转换成数字信号。计算机在接收到图像的数字信号后，将其存入内存。微机图像处理系统常用的图像采集部件有摄像头加上视频图像采集卡、图像扫描仪以及数码摄像机等。2、图像处理部件。在微机图像处理系统中，图像处理工作是由微机完成的，

23、微机的扩展槽上插有带帧存储器的采集卡，图像处理的过程通常包含从帧存储器读取数据到计算机内存、处理内存中的图像数据和送数据回图像帧存储器3个步骤。对于直接使用内存的采集卡，则只需和内存进行数据交换，计算机的内存越大,CPU的运算速度越快,图像处理的速度也越快。3、识别结果的输出部件。图像的输出是图像处理的最终目的。从广义的角度来讲，图像的输出形式可以分为两种：一种是根据图像处理的结果做出判断，例如质量检测中的合格和不合格，输出不一定以图像肮作为最终形式，而只需做出提示供人或机器做出选择。这种提示可以是计算机屏幕信息或是电平信号的高低,这样的输出往往用于成熟研究的应用上。另一种则是以图像为输出方式

24、，它包括中间过程的监视以及结果图像的输出。图像输出方式有屏幕输出、打印输出和视频硬拷贝输出。1.5 斑马线自动识别系统课题研究内容斑马线识别，最基本的就是对那些斑马线图标图片的识别，即是对图片的处理和识别，图像格式一般都是RGB等。主要是对输入的原始RGB图像进行处理.这一过程借用了大量的图像处理技术和算法，如图像滤波、图像增强、边缘检测等，以便从图像中抽取诸如角点、边缘、线条、边界以及色彩等关于场景的基本特征；这一过程还包含了各种图像变换（如校正）、图像纹理检测、图像运动检测等。对一幅图像进行一系列处理之后，提取出系统要求的感兴趣区域，最后和之前做好的模板匹配比较，就得出一组相关的比较系数，

25、从这一组系数中取出一个最大值，就可以识别出图像就是这个值指定的模板。斑马线自动识别系统图像处理与识别包括斑马线图像的预处理，图像的分割以及图像的匹配识别。处理识别流程如下:图1-1处理识别流程图第2章图像处理与识别及图像理解2.1 二值图像分析一幅数字图像是一个二维阵列，阵列元素值称为灰度值或强度值.实际上，图像在量化成数字图像前是一个连续强度函数的集合，场景信息就包含在这些强度值中.图像强度通常被量化成256个不同灰度级，对某些应用来说，也常有32、64128或512个灰度级的情况，在医疗领域里甚至使用高达4096(12bits)个灰度级,很明显，灰度级越高，图像质量越好，但所需的内存也越大

26、.在机器视觉研究的早期，由于内存和计算能力非常有限，而且十分昂贵，因此视觉研究人员把精力主要集中在研究输入图像仅包含两个灰度值的二值视觉系统上.人们注意到，人类视觉在理解仅由两个灰度级组成的线条、轮廓影像或其它图像时没有任何困难，而且应用场合很多.随着计算机计算能力的不断增强和计算成本的不断下降，人们普遍开始研究基于灰度图像、彩色图像和深度图像的视觉系统.尽管如此，二值视觉系统还是十分有用的，其原因如下：计算二值图像特性的算法非常简单，容易理解和实现，并且计算速度很快.二值视觉所需的内存小，对计算设备要求低.工作在256个灰度级的视觉系统所需内存是工作在相同大小二值图像视觉系统所需内存的八倍.

27、如若利用游程长度编码等技术。还可使所需内存进一步减少.由于二值图像中的许多运算是逻辑运算而不是算术运算，所以所需的处理时间很短.(3)许多二值视觉系统技术也可以用于灰度图像视觉系统上.在灰度或彩色图像中，表示一个目标或物体的一种简易方法就是使用物体模板(InaSk),物体模板就是一幅二值图像，其中1表示目标上的点,O表示其它点.在物体从背景中分离出来后，为了进行决策，还需要求取物体的几何和拓扑特性，这些特性可以从它的二值图像计算出来.因此，尽管我们是在二值图像上讨论这些方法，但它们的应用并不限于二值图像.一般来说，当物体轮廓足以用来识别物体且周围环境可以适当地控制时，二值视觉系统是非常有用的.

28、当使用特殊的照明技术和背景并且场景中只有少数物体时，物体可以很容易地从背景中分离出来，并可得到较好的轮廓，比如，许多工业场合都属于这种情况.二值视觉系统的输入一般是灰度图像，通常使用阈值法首先将图像变成二值图像，以便把物体从背景中分离出来，其中的阈值取决于照明条件和物体的反射特性.二值图像可用来计算特定任务中物体的几何和拓扑特性，在许多应用中，这种特性对识别物体来说是足够的.二值视觉系统已经在光学字符识别、染色体分析和工业零件的识别中得到了广泛应用.2.1.1 阈值运算视觉系统中的一个重要问题是从图像中识别代表物体的区域(或子图像)，这种对人来说是件非常容易的事，对计算机来说却是令人吃惊的困难

29、.为了将物体区域同图像其它区域分离出来，需要首先对图像进行分割.把图像划分成区域的过程称为分割，即把图像尸上刀划分成区域P,P2,P-使得每一个区域对应一个候选的物体下面给出分割的严格定义.定义分割是把像素聚合成区域的过程，使得： U着C=整幅图像（用是一个完备分割）. PjnPj=o,ij,（用是一个完备分割）. 每个区域匕满足一个谓词，即区域内的所有点有某种共同的性质. 不同区域的图像，不满足这一谓词.正如上面所表明的，分割满足一个谓词，这一谓词可能是简单的,如分割灰度图像时用的均匀灰度分布、相同纹理等谓词，但在大多数应用场合，谓词十分复杂.在图像理解过程中，分割是一个非常重要的步骤.二值

30、图像可以通过适当地分割灰度图像得到.如果物体的灰度值落在某一区间内，并且背景的灰度值在这一区间之外，则可以通过阈值运算得到物体的二值图像，即把区间内的点置成1,区间外的点置成0.对于二值视觉，分割和阈值化是同义的.阈值化可以通过软件来实现，也可以通过硬件直接完成.通过阈值运算是否可以有效地进行图像分割，取决于物体和背景之间是否有足够的对比度.设一幅灰度图像FUJI中物体的灰度分布在区间区石内，经过阈值运算后的图像为二值图像e，;力，即：F7JW =1如果O其它TlFiJT2如果物体灰度值分布在几个不相邻区间内时，阈值化方案可表示为:F7U,jl =1 如果 FzJJZO其它其中Z是组成物体各部

31、分灰度值的集合.图3.1是对一幅灰度图像使用不同阈值得到的二值图像输出结果.阈值算法与应用领域密切相关.事实上，某一阈值运算常常是为某一应用专门设计的，在其它应用领域可能无法工作.阈值选择常常是基于在某一应用领域获取的先验知识，因此在某些场合下，前几轮运算通常采用交互式方式来分析图像，以便确定合适的阈值.但是，在机器视觉系统中，由于视觉系统的自主性能(autonomy)要求，必须进行自动阈值选择.现在已经研究出许多利用图像灰度分布和有关的物体知识来自动选择适当阈值的技术.2.2图像区域分析图像中的区域是指相互连结的具有相似特性的一组像素.由于区域可能对应场景中的物体，因此，区域的检测对于图像解

32、释十分重要.一幅图像可能包含若干个物体，而每一个物体又可能包含对应于物体不同部位的若干个区域.为了精确解释一幅图像，首先要把一幅图像划分成对应于不同物体或物体不同部位的区域.2. 2.1区域与边缘图像区域划分有两种方法：一种是基于区域的方法，另一种是使用边缘检测的轮廓预估方法.在基于区域的方法中，把所有对应于一个物体的像素组合在一起，并进行标记，以表示它们属于一个区域，这一处理过程称为分割.在某一评判标准下，把像素分配给某一区域,就可以把这些像素同图像其余部分分开.图像分割中的两个最基本的原则是数值相似性和空间接近性.如果两个像素具有相似的强度特性,或它们之间十分靠近，则可以把它们分配到同一区

33、域，例如，两个像素之间的数值相似性度量可以是它们的灰度值之差，也可以是区域灰度值分布；它们的空间接近性度量可以是欧几里德距离，也可以是区域致密度.相似性和接近性原则来源于如下假设：同一物体上的点投影到图像上得到的像素点在空间上十分靠近，且具有相似的灰度值.很显然,这一假设并不是在任何情况下都成立.然而可以使用这一假设来组合图像中的像素，然后利用相关域知识来匹配物体模型和区域.在简单的情况下，可以通过阈值法和连通成份标记法来进行图像分割.对于复杂的图像，可以使用更高级的方法实现图像分割.分割也可以通过求取区域边界上的像素来进行.这些像素点（也称为边缘）可以通过搜寻邻近像素的方法来得到.由于边缘像

34、素是在边界上，在边界两边的区域具有不同的灰度值，这样，区域的边界可以通过测量邻近像素差值来求取.尽管边缘检测可能使用诱导特性（如纹理和运动）来检测边缘.但大多数边缘检测器仅使用强度特性作为边缘检测的基础.在理想的图像中，一个区域是由一条封闭轮廓线包围着.原则上,区域分割和边缘检测应该产生相同的结果，即使用边界跟踪算法可以得到区域的边缘（或封闭的轮廓线）；反过来，使用区域填充算法也可以得到边缘所包围的区域.但在实际的图像中，很少能够从区域中得到正确的边缘，反之亦然.由于噪声和其它因素的影响，不论是区域分割还是边缘检测，都无法提供完整的信息.2.3图像处理与识别及图像理解所研究的内容2. 3.1图

35、像处理技术1 .图像数字化其目的是将模拟形式的数字图像通过数字化设备变为数字计算机可用的离散的图像数据。2 .图像变换为了达到某种目的（通常是从图像中获得某种重要的信息）而对图像使用一种数学技巧，经过变换后的图像更为方便、容易地处理和操作。3 .图像增强图像增强的主要目标是改善图像的质量。采用某种特殊的技术来突出图像中的某些信息，削弱或消除某些无关信息，从而有目的地强调图像的整体或局部特征。常常用来改善人对图像的视觉效果，让观察者能看到更加直接、清晰、适于分析的信息。直方图修正、灰度变换、强化图像轮廓等都是常用的手段。4 .图像分割在图像的研究和应用中，人们往往仅对图像的某些部分感兴趣。它们一

36、般对应图像中特定的、具有独特性质的区域。图像分割就是把图像分割成各具特性的区域并提取出感兴趣的目标。5 .图像分析图像分析也可称为图像理解，主要研究从图像中提取有用的数据或信息，生成非图像的描述或表示。图像分析的内容分为特征提取、图像分割、符号描述、纹理分析、运动图像分析和图像的检测和配准。2. 3.2图像识别技术图像识别是近20年来发展起来的一门新型技术科学，它以研究某些对象或过程的分类与描述为主要内容。图像识别所研究的领域十分广泛，它可以是医学图像中的癌细胞识别；机械加工中的零部件的识别、分类；可以是从遥感图片中辨别农作物、森林、湖泊与军事设施；可以是自导引小车中的路径识别；邮政系统中自动

37、分炼信函；交通管制、识别违章行使的汽车牌照；银行的支票识别、身份证识别等。上述都是图像识别研究的课题。总得来说所研究的问题，主要是分类问题。1 .图像识别系统的组成一个图像识别系统主要包括3部分：图像信息获取；信息加工和处理、抽取特征；判断和分类。如图22所示。图22图像识别系统框图2 .图像识别方法图像识别的方法较多，大体上可以归纳为两类方法：统计方法（数学方法）和语言（或结构）学方法，后者亦称句法结构识别方法。统计方法以数学上决策理论为基础，根据这种理论建立了统计学识别模型。其基本模型是在对研究的图像进行大量统计分析，找出规律性认识，抽出反映图像本质特征进行识别。在这种方法中，大量工作在于

38、如何抽取图像的特征或决定统计参数，即所谓参数法。另外，还有非参数决策法，如邻近法则，它是一种跳过概率的估计而直接进行决策的方法。对于特征抽取，必须把图像的大量原始信息缩减为少数的特征，例如采用分差分布、特征向量法。对文字、符号等可只抽取几何图形特征，对声波信号可抽取频普特征。为了抽取特征，有时要对原始图像信息进行各种变换，空间投影，把多维的图像点简化到几个坐标分量上。句法结构识别法立足于分析图像的结构，一幅图像可以模仿语言构造，用一些语句来表达。语句的结构是由词、短语等组成，并按照一定的语法表达出来。也就是说，语句由短语组成，而短语由单词组成，其中最基本的元素就是单词。那么一些语句又怎么样和图

39、像发生联系呢？这可从图像的形成说起，任何一幅图像，总是由一些点、直线、斜线、弧线及环组成，分析图像的这些基本元素，看它们按怎样的规则构成图像，这就是结构分析的课题。这些基本元素就相当于言句中的单词；那些直线、曲线可看成短语，它们的全体按怎样的规则构成整个图像，就相当于语法结构。而对图像识别来说，就相当于检查图像所代表的某一类句型，是否符合事先规定的语法。若语法正确,则认为识别出结果。2.3.3图像理解图像理解的研究显然要涉及或包含研究获取图像的方法、装置和具体应用的实现，这就形成了所谓的计算机视觉。1、传感器引起失真的补偿人的图像是用灰度的二维阵列表示的，通常由于传感器的特性会引起几何学上或者

40、光学上的失真，因此需进行补偿。2、图像特征的提取图像凡是亮度发生急剧变化的地方，都是对应于不同物体面与面之间的边缘，这是一个重要特征，所以把图像中亮度急剧变化的点提取出来并对其性质进行描述（如边缘的方向、幅度、直方图等），对这些特征点的统计分布状况进行研究，可认识到物体的构造。如果把相邻的特征点连接起来则可以构成输入图像的曲线。3、景物特征的提取在观看物体时看到的不仅是亮度急剧变化的点，同时还有各个面的方向、距离、颜色反射率，这些特征与照明的情况和视点的位置无关，是物体所固有的特征。为了与图像上特征相区别，一般称为景物特征。4、景物的分割物体的发现利用景物的特征，把其性质大致相同的领域分割开来

41、，这与图像处理中把亮度相同的领域分割出来的领域法相同。5、物体的识别从景物所发现的各物体再参照物体的模型来识别物体，与此同时确定各物体的位置和方向。6、景物的识别研究各物体之间的连接关系，由这个连接关系和模型来认识更复杂的物体，从而可以对景物的全体进行描述。图2-3典型的图像理解系统2.4图像处理与识别及图像理解的关系在研究图像理解时，往往要进行图像的处理、识别及图像理解的过程，三者关系非常密切，互相交错。2.4.1图像处理在研究图像首先要对获得的图像进行预处理以滤去影响的因素，作为几何、彩色校正等。这样可提高信噪比：有时由于信息微弱，无法辨识，还得进行增强处理。并且为了从图像中找到需要识别的

42、东西,还得对图像进行分割，也就是进行定位和分离，以分出不同的物体。为了给观察者以清晰的图像，还要对图像进行改善，即进行复原处理，它是把已经退化了的图像加以重建或恢复的过程，以便改进图像的保真度。在实际处理中，由于图像信息量非常大，在存储及传送中，还要对图像进行压缩。上述工作必须用计算机来完成，因而要进行编码等工作。之前等等都是图像处理的工作，因此，图像处理包括图像增强，图像编码，图像压缩，图像复原，图像分割等。输入的是图像，输出的也是图像,过程如下所示：图像处理图像输入（编码、压缩、增强、分图像输出割、复原）2-4图像处理示意图图像识别是在上述分割后的每个部分中，找出它的形状及纹理等特征，即特

43、征抽取（有时也包括图像分割），以便对图像进行分类并对整个图像作结构上的分析。所以，对图像识别来说，输入的是图像，输出的是类别和图像的结构分析，如下图所示：图像图像处理类别+结构分析（编码、压缩、增强、分割、复原）2-5图像识别示意图2. 4.2图像理解所谓图像理解是一个总称。上述图像处理及图像识别的最终目的就在于对图像作描述和解释，以便最终理解它是什么图像。所以它是在图像处理及识别的基础上，再根据分类作结构句法分析，去描述图像和解释图像。图像处理、识别、及理解之间的关系如图：图像处理图像（编码、压缩、增强、分图像描述+解释割、复原）2-6图像理解示意图2.5图像处理工具MATLABMATLAB

44、语言的首创者CleveMoler教授在数值分析，特别是在数值线性代数的领域中很有影响，他参与编写了数值分析领域一些著名的著作和两个重要的Fortran程序EISPACK和LINPACK。他曾在密西根大学、斯坦福大学和新墨西哥大学任数学与计算机科学教授。1980年前后，当时的新墨西哥大学计算机系主任Moler教授在讲授线性代数课程时，发现了用其他高级语言变成极为不便，便构思并开发了MATLAB（MATrixLABoratory,即矩阵实验室），这一软件利用了当时数值线性代数领域最高水平的EISPACK和UNPACK两大软件包中可靠的子程序，用Fortran语言编写了集命令翻译、科学计算于一身的一

45、套交互式软件系统。MATLAB语言是当今国际上科学界（尤其是自动控制领域）最具影响力、也是最有活力的软件。它起源于矩阵运算，并己经发展成一种高度集成的计算机语言。它提供了强大的科学运算、灵活的程序设计流程、高质量的图形可视化与界面设计、便捷的与其他程序和语言接口的功能。MATLAB语言在各国高校与研究单位起着重大的作用。MATLAB的数字图像处理功能很强大，其自带的图像处理工具箱（ImageprocessingToolbox）包括了经典图像处理的许多方面，如图像的几何操作、邻域和区域操作、图像变换、图像的恢复和增强、线性滤波器设计、图像分析和统计、色彩、集合及形态操作等方面，同时，MATLAB

46、还提供了对多种图像文件格式的读写和显示，这使得在MATLAB的集成环境中可以轻松实现图像处理。在图像几何操作方面，MATLAB的图像几何操作提供了插值函数，图像尺寸调整，以及任意角度的图像旋转，可以对图像进行缩放、旋转和剪切等操作。在图像滤波方面，MATLAB图像片理工具箱提供了多个函数用于设计和实现多种滤波操作，图像的线性滤波操作即可用MATLAB预定义的多种滤波器进行滤波，也可以根据需要用MATLAB实现自定义的滤波器进行滤波。在图像变换方面，MATLAB图像处理工具箱提供了FoUrier变换，离散余弦变换，Radon变换以及这些变换的逆变换等，同时民可以利用MATLAB的小波变换工具箱来

47、实现图像的小波变换。在图像分析方面，MATLAB图像处理工具箱支持多种标准的图像处理操作，以方便用户对图像进行分析和调整。MATLAB图像处理工具箱提供了多个函数对图像的像素进行操作，包括：选定像素的灰度值，沿图像中某个路径的灰度值，图像的灰度的轮廓图，图像灰度直方图，图像灰度的摘要统计以及图像区域的特征度量。MATLAB图像分析技术可以提取图像的结构信息。如，MATLAB图像处理工具箱提供的多种边缘检测算子可以提取图像的边界信息。MATLAB图像处理工具箱己经实现了如Log算子、Canny算子、Sobel算子、Prewitt算子、Roberts算子等多种经典的检测边界检测算法,MATLAB中

48、的图像处理技术用于改善图像，包括对图像噪声的操作,滤波以减少噪音，以及对图像的颜色和灰度的调整，如，图像灰度直方图修下和直方图均衡化。第三章斑马线自动识别系统主要算法3.1 边缘检测边缘（edge）是指图像局部强度变化最显著的部分.边缘主要存在于目标与目标、目标与背景、区域与区域（包括不同色彩）之间，是图像分割、纹理特征和形状特征等图像分析的重要基础.图像分析和理解的第一步常常是边缘检测（edgedetection）.图像中的边缘通常与图像强度或图像强度的一阶导数的不连续性有关.图像强度的不连续可分为：（1）阶跃不连续，即图像强度在不连续处的两边的像素灰度值有着显著的差异；（2）线条不连续，即图像强度突然从一个值变化到另一个值，保持一个较小的行程后又返回到原来的值.在实际中，阶跃和线条边缘图像是很少见的，由

展开阅读全文

机器视觉设计和实现 电气工程工专业.docx

机器视觉设计和实现电气工程工专业.docx