毕业设计(论文)机器人视觉伺服控制中的目标识别.doc

上传人:文库蛋蛋多 文档编号:4070702 上传时间:2023-04-03 格式:DOC 页数:66 大小:1.11MB
返回 下载 相关 举报
毕业设计(论文)机器人视觉伺服控制中的目标识别.doc_第1页
第1页 / 共66页
毕业设计(论文)机器人视觉伺服控制中的目标识别.doc_第2页
第2页 / 共66页
毕业设计(论文)机器人视觉伺服控制中的目标识别.doc_第3页
第3页 / 共66页
毕业设计(论文)机器人视觉伺服控制中的目标识别.doc_第4页
第4页 / 共66页
毕业设计(论文)机器人视觉伺服控制中的目标识别.doc_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《毕业设计(论文)机器人视觉伺服控制中的目标识别.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)机器人视觉伺服控制中的目标识别.doc(66页珍藏版)》请在三一办公上搜索。

1、毕 业 设 计(论文)专 业: 学 号: 学生姓名: 所属学院: 指导教师: 2010年 6月中国民航大学本科生毕业设计(论文)机器人视觉伺服控制中的目标识别Target identification of vision robot servo-control 专 业:学生姓名: 学 号:学 院:指导教师: 2010 年 6月创见性声明本人声明:所呈交的毕业论文是本人在指导教师的指导下进行的工作和取得的成果,论文中所引用的他人已经发表或撰写过的研究成果,均加以特别标注并在此表示致谢。与我一同工作的同志对本论文所做的任何贡献也已在论文中作了明确的说明并表示谢意。毕业论文作者签名: 签字日期: 年

2、 月 日本科毕业设计(论文)版权使用授权书本毕业设计(论文)作者完全了解中国民航大学有关保留、使用毕业设计(论文)的规定。特授权中国民航大学可以将毕业设计(论文)的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交毕业设计(论文)的复印件和磁盘。(保密的毕业论文在解密后适用本授权说明)毕业论文作者签名: 指导教师签名:签字日期: 年 月 日 签字日期: 年 月 日摘 要为了实现四自由度机器人GRB-400机器人的准确抓取控制,本文进行基于视觉反馈的机器人伺服控制系统研究。首先进行了视觉图像处理研究,由机器人平台正上方

3、的摄像头捕获图像,采用中值滤波的方法进行图像滤波,直方图方法对图像进行增强,canny法对图像边缘检测和二值法图像分割,完成图像的预处理。其次对处理后的图像进行目标识别,提取图像特征,采用模板匹配的方法识别出目标工件。最后识别出的工件进行标定,图像中目标工件的位置决定了它在空间的位置。而对于分割后的二值图像,目标工件的中心位置与目标工件的质心相同,根据坐标计算公式求得质心位置坐标和角度值。由摄像头的线性模型标定目标工件的三维位姿,将结果反馈给执行模块,从而驱动关节正确运动,执行抓取工件操作。实验结果表明,所选择的算法简单实用,达到了预期的效果。关键词:工业机器人 图像处理 目标识别 摄像头标定

4、ABSTRACT In order to realize the accurate capture control of four degrees-of-freedom robot GRB-400 , this article carries on the servocontrol research of robot based on the visual feedback. First of all, the camera at the top of robot is used to capture images for the research of visual image proces

5、sing,.With the method of median filtering, image filtering, image enhancement histogram method, canny edge detection method and the binary image segmentation,it complete the image preprocessing. Second, recognize the processed image ,find out image feature extraction. Use matching method to identify

6、 target workpiece. Finally ,distinguishde the work piece is carried on the demarcation,. The goal work piece positionin the image has decided it in the spatial position.But the division two value image, the goal work pieces central place and the goal work pieces center of mass are the same, obtains

7、the center of mass position data and the angle value according to the coordinate formula.Through cameras linear model spotting work piece three dimensional pose, result feedback for executive module, thus actuates the joint correct movement, execution capture work piece operation. Experimental resul

8、ts show that the choice of algorithm is practical,getting the desired results. Key Words:industrial robot image processing target recognition servo control目 录第1章 绪论11.1课题发展现状11.2课题目的21.3课题内容2第2章 机器人视觉反馈中的图像处理32.1图像增强32.1.1直方图增强32.1.2 直方图均化42.1.3对比度增强42.2图像滤波62.2.1邻域平均法原理62.2.2中值滤波62.3边缘检测72.3.1微分算子法

9、72.3.2拉普拉斯高斯算子82.3.3 canny法92.4图像分割102.4.1灰度门限法112.4.2图像分割的方法112.5本实验中的图像处理过程122.6本章小结13第3章 图像目标识别143.1图像目标识别类型143.2图像目标识别的过程143.3图像目标识别的方法153.3.1图像目标识别的常用方法153.3.2图像目标识别的方法153.4图像的不变矩匹配173.4.1矩的概念173.4.2矩的有关变换203.4.3图像的不变矩特征表示223.5目标识别实验233.6本章小结24第4章 基于图像反馈的机器人视觉定位254.1系统标定概述254.2摄像机标定254.2.1标定的原理

10、264.3 GRB-400机器人运动学分析274.3.1坐标空间定义284.3.2求解运动学逆解的方法294.4摄像机成像模型344.5视觉系统需标定的参数及方法354.5.1坐标变换原理354.5.2 机器人臂抓取364.6 本章小结36结 论38参考文献39致 谢40附录A:程序清单41附录B:外文翻译资料46第1章 绪论1.1 课题发展现状 智能机器人是工业机器人从无智能发展到有智能,从低智能发展到高智能的产物。它的智能特征就在于它具有与外部世界、对象、环境和人相互协调的工作机能。在这方面,视觉、接机器人视觉是模拟人类视觉在机器人上的体现,所以机器人视觉被认为是机器人最重要的感觉能力。机

11、器视觉一般定义为自动获取分析图像得到描述一个景物或控制某种动作的数据,其本质是使计算机具有从单幅或系列二维图像阵列认知周围环境信息的能力,这种能力将不仅使机器能感知周围物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、识别与理解。它是一个综合性学科,它涉及数学分析、图像处理、图像理解、模式识别以及计算机硬件知识等。视觉伺服(Visual Servoing)和一般意义上的机器视觉有所不同,它是利用视觉传感器获取的图像作为反馈信息构造机器人的闭环反馈控制。机器人视觉伺服的实质是利用机器视觉的原理,从直接得到的图像反馈信息中快速进行图像处理,在尽量短的时间内给出反馈信息,参与控

12、制决策的产生,构成机器人闭环控制系统,带有视觉的机器人对外部环境变化的适应能力增强,也使机器人的应用领域得到扩大。因而使用视觉来提高机器的智能水平,具有重要的现实意义和研究价值。近觉、触觉和力觉具有重要作用,视觉是人类观察世界和认知世界的重要手段。视觉引导是机器人对物体识别与定位的应用领域中一个重要问题。对于工作在特殊环境下的机器人来说,为了完成对目标物体的操作即“识别抓取放置”动作,对目标物体定位信息的获取是必要的。首先,机器人必须从背景中识别标物体;其次,机器人必须知道目标物体的位姿,以保证机器人准确地抓取;最后是必须知道物体被操作后的目标位姿,以保证机器人准确地完成任务。在传统的工业机器

13、人应用场合,机器人只是按照固定的程序进行操作,物体的初始位姿和终止位姿是事先规定的。当机器人工作环境发生变化或者目标物体发生变化甚至环境条件未知时,带有传统传感器的机器人控制系统就显现许多局限性,甚至无法准确完成预先给定的任务,对机器人引入视觉装置,一方面使得机器人可以模仿人类的视觉能力来感知外部环境,二是它能够实现无接触位姿测量,第三它在一定程度上提高了机器人智能化和机器人自适应、自学习的能力。对于机器人视觉技术,我们的主要任务是为机器人建造视觉系统。如同人类视觉系统的作用一样,机器人视觉系统将赋予机器人一种高级感觉机构,使得机器人能以智能和灵活的方式去对周围的环境做出反应。由于对机器人系统

14、应用领域不断提出更高的要求,机器人视觉将越来越复杂。总之,机器人向智能化、类人化、多功能集成化发展是当前机器人发展的一个重要趋势,而机器人视觉伺服控制是智能机器人的一项关键技术。1.2 课题目的本课题以工业机器人识别、抓取为应用背景,利用单目视觉伺服系统来研究机器人的视觉伺服控制问题。1.3 课题内容主要针对机器人对目标的识别和定位,通过摄像头摄取图像,经过图像处理和伺服控制,实现机器人通过视觉对目标的识别和定位。主要内容:在机器人视觉伺服系统中,图像的实时采集与预处理。简单介绍了成像的原理以及图像预处理的方法和处理过程,针对具体目标物体,较详细地研究了图像分割技术和各种图像边缘检测方法,通过

15、比较研究和分析,选择了合适的边缘检测方法。摄像机标定技术研究和视觉机器人视觉伺服控制系统。在对GBR-400机器人运动学、运动学反解、轨迹规划等分析的基础上,利用视觉信息完成了机器人对单目标物体的识别抓取实验研究以及对多目标物体的识别、选择和抓取。第2章 机器人视觉反馈中的图像处理 本章主要研究了机器人视觉伺服中图像处理算法:图像增强、图像滤波、和边缘检测和图像分割。其中在图像增强过程中,对所得图像的灰度进行了调整。在图像滤波研究中研究了基本图像滤波算法,中值滤波算法的结果比较让人满意。在目标识别中,主要研究了基于图像矩的目标检测方法,应用了边缘检测技术,对各种边缘检测算法都进行了比较研究。本

16、章为后面的目标图像特征提取与视觉信息反馈计算奠定了基础。2.1 图像增强像增强是数字图像处理过程中经常采用的一种方法。为了改善视觉效果或者便于人和机器对图像的理解和分析,根据图像的特点或存在的问题采取的简单的改善方法或者加强特征的措施称为图像增强。获取和传输图像的过程往往会发生图像失真,所得到图像和原始图像有某种程度的差别。这种差异如果太大,就会影响人和机器对图像的理解。在许多情况下,人们不清楚引起图像降质的具体物理过程及其数学模型,但却能根据经验估计出使图像降质的一些可能原因,针对这些原因采取简单有效的方法,改善图像质量。图像信号变弱会使人们无法看清图像的细节,而采用增强对比度的方法可以使图

17、像更清晰一些。2.1.1 直方图增强图像的直方图是图像的重要的统计特征,它可以认为是图像灰度密度函数的近似。按照随机过程理论,图像可以看作是一个随机场,因此具有相应的统计特征,其中最重要的特征是灰度密度函数。通常图像的灰度密度函数与象素所在的位置有关,例如设图像在点(x,y)处的灰度分布密度函数为p(z;x,y),那么图像的灰度密度函数为:P(z)= (2-1) 其中D是图像的定义域,S是区域D的面积。一般来讲,要精确地得到图像的灰度密度函数是比较困难的,在实际中可以用数字图像灰度直方图来代替。灰度直方图是一个离散函数,它表示数字图像每一灰度级与该灰度级出现频率的对应关系。假如一幅数字图像的像

18、素总数为N,有L个灰度级,具有第K个灰度级的灰度rk的像素共有nk个灰度级或者说rk出现的频率为: hk= K=0,1,L-1 (2-2)2.1.2 直方图均化均匀量化的自然图像的灰度直方图通常在低值灰度区间上频率较大,使得图像中较暗区域中的细节常常看不清楚。为了使图像清晰,可将图像的灰度范围拉开,并且让灰度频率较小的灰度级变大,即让灰度直方图在较大的动态范围内趋于一致。用图像f(x,y)的直方图代替灰度的分布密度函数Pf(f),则直方图均化的图像g为:g=Tf= (2-3)对于数字图像,可以对上述公式做离散近似。设原图像的像素总是为N,灰度级的个数为L,第K个灰度级出现的频数为nk。若原图像

19、f(x,y)处的灰度为rk,则直方图均化后的图像g(x,y)在处的灰度sk为:Sk=Trk= (2-4)2.1.3 对比度增强对比度增强是图像增强技术中一种比较简单但又十分重要的方法。这种方法是按一定的规则修改输入图像每一个像素的灰度,从而改变图像灰度的动态范围。它可以使灰度动态范围扩展,也可以使其压缩,或者是对灰度进行分段处理,根据图像特点和要求在某段区间中进行压缩而在另外区间中进行扩展。设输入图像为f(x,y),处理后的图像为g(x,y),则对比度增强可以表示为下面的数学变换式: (2-5)其中T表示输入图像和输出图像对应点的灰度映射关系。实际中由于曝光不足或成像系统非线性的影响,通常照片

20、或电子系统生成的图像对比度不良,利用对比度增强变换可以有效地改善图像的质量。如果原图像f(x,y)的灰度范围是m,M,我们希望调整后的图像g(x,y)的灰度范围是n,N,那么下述变换:g(x,y)= (2-6)就可以实现这一要求。其变换曲线图1-1如下:Gamma校正也是数字图像处理中常用的图像增强技术。Gamma因子的取值决定了输入图像到输出图像的灰度映射方式,即决定了增强低灰度还是增强高灰度。当Gamma等于1时,为线性变换。Gamma因子大于1和小于1的映射方式如下图1-2所示: 图2-1灰度线性变换曲线图2-2Gamma校正曲线2.2 图像滤波 直接由摄像机获取的实际图像中往往都含有各

21、种噪声和畸变,图像质量较差,使原本均匀和连续变化的灰度突然变大或减小,形成一些虚假的物体边缘或轮廓,造成图像模糊,甚至淹没图像特征,给图像分析带来困难,因此,有必要对其进行图像滤波。图像滤波的作用主要有两个:抑制或消除图像噪声改善图像质量和抽取图像的特征。由于图像的噪声种类复杂(如加性噪声、乘性噪声、量化噪声等),所以图像滤波的方法也多种多样。在常用的空域法中有邻域均值法、空域低通滤波法和中值滤波法等。2.2.1 邻域平均法原理首先假设图像是由许多灰度恒定的小块组成,相邻的象素之间具有很高的空间相关性。而噪声是统计独立地叠加在图像上的,其均值为O。因此,可以利用像素邻域的各像素灰度值的平均值代

22、替原来的灰度值,以实现图像的平滑。假设某像素的灰度值为f(i,j)以其为中心,邻域像素组成的点集用S来表示,点集包含的像素个数为N。经过邻域平均法滤波后,像素f(i,j)的输出为: (2-7)即利用邻域像素的平均值取代了f(i,力原来的灰度值。邻域平均法可以有力地抑制噪声,但同时也引起图像的模糊现象,模糊的程度与邻域半径成正比。为了尽可能减少模糊失真,可以采用“超限邻域平均法”,公式如下: (2-8) 其中,为设定阂值,即当f(i,j)超过邻域平均值一定值时,才作为噪声处理,否则不变。2.2.2 中值滤波中值滤波是抑制噪声的非线性处理方法。对于给定的n个数值a1,a2,an,将它们按大小有序排

23、列。当n为奇数时,位于中间位置的那个数值称为这n个数值中值。当n为偶数时,位于中间位置的两个数值的平均值称为这n个数值的中值,记作med(a1,a2,an)。中值滤波就是这样的一个变换,图像中滤波后某像素的输出等于该像素领域中各像素灰度的中值。中值滤波的方法运算简单,易于实现,而且能较好地保护边界,但有时会失掉图像中的细线和小块的目标区域。领域的大小决定在多少个数值中求中值,窗口的形状决定什么样的几何空间中取元素计算中值。对二维图像,窗口A的形状可以是矩形、圆形及十字形等,它的中心一般位于被处理点上。窗口大小及形状有时对滤波效果影响很大。一维信号中值滤波具有如下重要性质:输入是阶跃信号或者斜坡

24、信号时,输出信号和输入信号相同;若输入是脉宽小于窗口一半的脉冲,则该脉冲被滤除,否则输出和输入相同;输入是三角信号时,输出时其顶部被削平。二维信号的中值滤波的性质与之相似。2.3 边缘检测 所谓边缘是指其周围像素灰度有阶跃变化或屋顶变化的那些像素的集合。边缘广泛存在于目标与背景之间、物体与物体之间、基元与基元之间。物体的边缘是由灰度不连续性反映的,因此一般边缘检测方法是考察图像的每个像素在某个领域内灰度的变化,利用边缘邻近一阶或二阶方向导数变化规律来检测边缘。边缘是图像最基本的特征,一幅图像主要信息是由它的轮廓边缘提供的。所以,边缘提取与检测在图像处理中占有很重要的地位,其算法的优劣将直接影响

25、所研制系统的性能。 由于噪声和模糊的存在,检测到的边界可能会变宽或在某些点处发生间断,因此,边界检测包括两个基本内容:首先抽取反映灰度变化的边缘点,然后剔除某些边界点或填补边界间断点,并将这些边缘连接成完整的线。最近的二十年里发展了许多图像边缘检测算法,并对图像的边缘检测产生了很大的影响。2.3.1 微分算子法 导数算子具有突出灰度变化的作用,对图像运用导数算子,灰度变化较大的点处算子得的值较高,因此可将这些导数值作为相应点的边界强度,通过设置门限的方法,提取边界点集。 一阶导数与是最简单的导数算子,它们分别求出了灰度在x和y方向上的变化率,而方向上的灰度变化可以用下面式子计算: (2-9)对

26、于数字图像,应该采用差分运算代替求导,相对应的一阶差分为: xf(i,j)=f(i,j)-f(i-1,j) (2-10)yf(i,j)=f(i,j)-f(i,j-1) (2-11)方向差分为:f(i,j)= xf(i,j)cos+yf(i,j)sin (2-12)Roberts算子的表达式为:max(f(i,j)-f(i+1,j+1),f(i+1,j)-f(i,j+1) (2-13)Sobel算子的表达式为: (2-14) x方向算子 y方向算子 利用Roberts算子提取的边缘的结果边缘比较粗,因此边缘定位不是很准确,而Sobel 算子对边缘的定位比较准确。2.3.2 拉普拉斯高斯算子拉普拉

27、斯高斯算法是一种二阶边缘检测方法。它通过寻找图像灰度值中二阶微分中的过零点来检测边缘点。其原理是,灰度缓变形成的边缘经过微分算子形成一个单峰函数,峰值位置对应边缘点;对单峰函数进行微分,则峰值处的微分值为0,峰值两侧符号相反,而原先的极值点对应二阶微分中的过零点。实际应用中,为了去除噪声影响,首先要用高斯函数对图像进行滤波,然后对滤波后的图像求二阶导数,即按照下式计算: (2-15)其中f(x,y)为图像,G(x,y)为高斯函数,上述两个处理步骤可以合成一个算子,由卷积和微分可交换顺序的性质知: (2-16)式中称为拉普拉斯高斯算子,经过运算可得: (2-17) 是关于原点对称的函数,其主瓣宽

28、度为: W=2 (2-18)在数字图象中,拉普拉斯算子可借助各种模板来实现。这里对模板的基本要求是对应中心像素的系数应是负的,而对应中心像素邻近像素的系数应是正的,且它们的和应该为零。拉普拉斯算子的特点是:各向同性,线性和位移不变,对细线和孤立点检测效果好但边缘方向信息丢失,常产生双像素的边缘,对噪声有双倍加强作用。2.3.3 canny法 Canny边缘检测是一种比较新的边缘检测算子,具有很好的边缘检测性能,得到了越来越广泛的应用。Canny边缘检测法利用高斯函数的一阶微分,它能在噪声抑制和边缘检测之间取得较好的平衡。具体步骤如下:(1)用高斯滤波器来图像滤波,可以去除图像中的噪声。(2)用

29、高斯算子的一阶微分图像进行滤波,得到每个像素梯度的大小|G|和方向。 (2-19)f为滤波后的图像。(3) 对梯度进行“非极大抑制”。 梯度的方向可以被定义为属于4个区之一,各个区用不同的领近像素用来进行比较,以决定局部最大值。(4) 对梯度取两次阀值得到两个阀值T1和T2,T1=0.4*T2。我们把梯度值小于T1的像素的灰度设为0,得到图像1。然后把梯度小于T2的像素的灰度设为0,得到图像2。由于图像2的阀值较高,去除了大部分噪声,但同时也损失了有用的边缘信息。而图像1的阀值较低,保留了较多的信息。我们可以以图像2为基础,以图像1为补充来连接图像的边缘。(5) 连接边缘的具体步骤如下: 对图

30、像2进行扫描,当遇到一个非零灰度的像素p时,跟踪以p为开始的轮廓线,直到该轮廓线的终点Q。 考虑图像1中与图像2中Q点位置对应的点Q的8-邻近区域。如果在Q点的8-邻近区域中有非零像素R存在,则将其包括到图像2中,作为点R。从R开始,重复第一步,直到我们在图像1和图像2中都无法继续为止。 当完成对包含p的轮廓线的连接之后,将这条轮廓线标记为已访回。回到第一步,寻找下一条轮廓线。重复这三步,直到图像2中找不到新轮廓线为止。2.4 图像分割图像分割是图像处理与机器视觉的基本问题之一,其任务是把图像划分成互不交迭区域的集合。这些区域的划分是有实际意义的,他们或者代表不同的物体,或者代表物体的不同部分

31、。图像分割的一个难点在于,在划分之前,不一定能够确定图像区域的数目。 按照通用的分割定义,分割出的区域需同时满足均匀性和连通性的条件。其中均匀性是指该区域中的所有像素点都满足基本灰度、纹理、颜色等特征的某种相似准则,而连通性是指在该区域内任意两点存在相互连通的路径。设F表示一幅图像中所有像素的集合,P()是某个均匀性的假设,分割就是把F划分成若干子集(S1,S2,,Sn), 其中各子集构成一个空间连通区域,且满足以下条件: (2-20) (2-21) 完全符合上述定义的分割计算十分复杂,目前大部分研究都是针对某一类图像或者某一具体应用的分割,人们仍在对图像分割的通用方法和策略进行研究。通常情况

32、下,利用目标区域和背景区域在灰度方面的差异,可以实现对图像的分割,即基于灰度的图像分割。2.4.1 灰度门限法设图像f(x,y)的灰度范围属于z1,z2,根据一定的经验及知识确定一个灰度的门限,或者根据一定准则确定z1,z2的一个划分Z1,Z2,其中Z1代表目标,Z2代表背景。根据像素的灰度属于这个划分的哪个部分来将其分类,称为灰度门限法,即:如果f(x,y)属于Z1,判断(x,y)像素属于目标。如果f(x,y)属于Z2,则判断(x,y)像素属于背景。根据划分方法的不同,可以将灰度门限法分为:直接门限法 、 间接门限法、多门限法2.4.2 图像分割的方法 一般图像阈值分割可以分成以下三步:1确

33、定阈值;2将阈值与图像中所有像素比较;3根据笔记结果,将像素归类; 阈值分割是利用图像中要提取的目标物体与背景在灰度上的差异,把图像分为具有不同灰度级的目标区域和背景区域组合的方法,它的实质是对图像进行二值化阈值分割的基本思想是确定一个阈值,然后将每个像素点的灰度值跟这个阈值相比较,根据比较的结果来确定该点是背景还是目标,然后将背景和目标的像素点的灰度值分别置为255和0。最简单的是全局阈值分割,设原始图像f(x,y),阈值为T,按上述方法分割后的图像g(x,y)可由下式(2-22)表示: (2-22)还有一种方法将规定范围内像素值置为1,而范围外像素值置为0,如(2-23)式: (2-23)

34、 图像分割流程如图2-4所示: 图2-4图像分割流程图2.5 本实验中的图像处理过程 在Visual C+环境下开发的系统集成软件,能够在固定窗口实时显示视频图像和图像处理结果,这样在实验过程中,对采集图像和处理结果的好坏会有一个直观的认识,以便随时调整。图像处理软件的主要任务就是让摄像机执行图像捕捉、图像处理、目标识别、特征提取、调试信息与结果显示等功能。图像捕获是指通过图像采集卡,对摄像头640*480像素的8bit灰度图进行高速采集;图像处理主要应用第二章中论述的原理,对采集的灰度图进行预处理、滤波去燥、二值化处理、边缘检测等操作;在图像处理的基础上,应用第三章中提出的单目标物体的匹配识

35、别算法识别出目标物体,对识别出的目标物体的特征进行提取,即获得该目标物体的质心、角度等特征参数。图5-2(a)为采用中值滤波算法对采集图像的预处理结果。 (a) (b)图2-5中值滤波及阈值分割结果 采用二值化方法对图像进行分割。最优阈值的选取采用(OTSU)最大类间方差法,其思想主要是计算目标图像与背景图像间的方差。在(0-255)间改变n,求使得式(1)取最大值的n值,此时的n即为OTSU自动阈值分割算法的最佳阈值。图5-2(b)是对经过滤波处理后的图像采用该分割算法处理后的结果,即:低于某一阈值n的灰度值属于目标物体,而高于这一阈值n的灰度值属于背景图像。2.6 本章小结本章主要描述了图

36、像的获取、图像预处理、图像分割和图像的边缘检测,首先分析了灰度线性变换和直方图均衡化在图像增强中的原理,然后应用中值滤波滤除噪声,其较好地保持了图像的边缘。在图象分割中应用直方图和实验法相结合的方法,确定了阈值,完成了图像的二值化处理,最后在边缘检测中,分析了各种检测方法的优缺点,最终确定了本文使用Roberts外边缘算子提取目标物体的边缘特征。第3章 图像目标识别 目标识别技术的研究始于六十年代,其含义是用计算机对图像进行加工处理,以得到某些预期的效果,并从中提取有用信息,从而实现人对事物或现象的分析、描述、判断和识别。它的主要目的是确定视野图像中是否存在目标。如果存在日标,给个合理的解释,

37、即判断出目标是什么及确定它的位置。它属于模式识别的范畴,也可以把模式识别狭义地理解为图像目标识别。 对目标的识别并确定其位置信息是机器人视觉伺服控制系统首先要解决的问题。通过前面章节介绍的图像预处理和图像分割及边缘检测等有效图像处理后得到了物体的二值化图像,该图像由一个一个的目标区域组成,本章的工作就是从这多个目标区域中找到我们需要的目标区域,即图像的识别问题。 图像识别就是从图像中找出与己知模板相似的目标图像,即识别出物体并确定出它在整幅图像中的位置和方向,这是计算机视觉系统中的关键和难点。3.1 图像目标识别类型 目标识别在概念上可以分为三种类型:物理模型、基于知识的方法和参数分类技术:

38、物理模型: 物理模型所采用的技术是根据物理模型直接计算实体的特征(时间域、信号、数据、频域数据或图像)。由传感器观测产生观测特征或图像,由身份判别过程把观测数据与预先存储的目标特征(一个先验的目标特征文件)或根据对观测数据进行预测的物理模型所得出的模拟特征进行比较。基于知识的方法:基于知识的方法有两个方面的内容:表示知识的技术;处理信息以得出结论的推理方法。它们可以在原始传感器数据或抽取的特征的基础上进行。基丁知识的方法的成功与否在很大程度上依赖于建立一个先验知识库。有效的知识库是用知识工程技术来建立的。 参数分类技术:参数分类技术包括统汁算法和应用信息论技术的方法统计算法有经典推理、Bayc

39、s方法、D-S方法等。基于信息论技术的方法有参数模板、聚类分析、自适应神经网络、表决法、熵法等,其中,聚类分析法对于探索新的数据关系提供一个有价值的工具。3.2 图像目标识别的过程从广义上讲,典型的图像目标识别技术过程由以下六部分组成:预处理、目标探测、图像分割、特征提取与选择、目标分类和目标跟踪。如图3-1所示: 图3-1目标识别的过程3.3 图像目标识别的方法3.3.1 图像目标识别的常用方法 将图像进行合理的分割以后,下一个重要问题就是图像的识别。图像识别的方法较多,大体上可以归纳为三大类:统计识别方法、结构识别方法和模糊集识别方法。 统计识别方法 统计识别方法以数学上的决策理论为基础,

40、根据这种理论建立统计学识别模型,基本模型是对研究的图像进行大量的统计分析,找出规律性认识,抽出反映图像本质特点的特征进行识别。在这种方法中,大量工作在于如何抽取图像的特征或统计参数。 句法结构识别方法 句法结构识别方法立足于分析图像的结构,主要利用了图像结构上的相互关系,一幅图像可以模仿语言结构,用一些语句来表达。对于图像识别来说,相当于检查图像所代表的某一句型,是否符合事先规定的语法。若语法正确,则给出识别结果。 模糊集识别方法所谓模糊集识别,是在模式识别过程中引入了模糊集的概念,模糊集的概念可以在模式识别系统的运用很广。若在特征提取或判别决策中引入,所求得的结果就是该模式特征与每一标准类的

41、隶属度,进而可求出隶属度最大的标准类为被识类。3.3.2 图像目标识别的方法匹配技术是统计识别方法中非常重要的一种。匹配指用存储在计算机中的模型去识别输入的未知视觉模式,并最终建立对输入的解释,及计算机模型与外部世界的对应性。对于每个具体的匹配,它都可以看作是对两个已有的表达找其对应性。当两个表达都代表了图像中的目标时,就称之为图像目标匹配。下面介绍一些常用的图像目标匹配方法。 (一)模板匹配 模板匹配是图像匹配中最常用、最简明的方法,也称子图像匹配或窗匹配,也有人称之为基于面积或邻域的匹配。若在被搜索图S中有待寻的目标,且同模板图像有一样的尺寸和方向,匹配的主要工作是将模板T(设模板T的大小

42、为MXM)在搜索图S(设搜索图s的大小为NXN)上平移并进行相关计算,相关值最大处即为匹配最好处。如果相关值大于给定的阈值,则认为在s上存在模板T所代表的图像区域。由相关法求匹配的计算量很大,因为模板要在(M+1)2个参数位置上做相关计算,除一点以外,其余都是在非匹配点上做无用功。而且,模板匹配法对于具有旋转和尺度变化的图像识别无能为力,故模板匹配法的应用有较大的局限性。在实际应用中常采用下面的特征内容匹配法来进行图像识别。 (二)特征内容匹配 在很多情况下,图像的内容比它的视觉质量更为重要。根据图像内容对图像进行识别的研究主要借助于图像的特征来进行。下面分别对几种常见的特征内容匹配法进行简要

43、的介绍。 颜色匹配 颜色是彩色图像一个重要的特征。常用的颜色空间有RGB和HIS空间。用图像颜色特征来描述图像主要利用其颜色统计直方图。在得到图像特征的统计直方图后,不同图像问的特征匹配借助计算机直方图间的距离来进行。 常见的几种较简单的方法有: (1)直方图相交法 (2)距离法 (3)中心距法 (4)参考颜色表法 形状匹配 利用形状进行匹配有几点需要注意: (1)首先,形状常与目标联系在一起,所以形状特,征可以看作是比颜色或纹理更高一层的特征。要获得有关目标的形状参数,通常需要对目标进行分割,因此形状特征会受到图像分割效果的影响。 (2)其次,至今还没有找到形状的确定数学定义使之能与人的感觉

44、相一致。人对形状的感觉不仅是一个视网膜的生理反映结果,而且是视网膜感受与入关于现实世界的知识这两者之间综合的结果。 (3)最后,从不同视角获取的图像中目标形状可能会有很大差别,为准确进行匹配,需要解决平移、尺度、旋转不变性的问题。目前常用的形状匹配法主要有几何参数法,边界方向直方图法,小波重要系数法,小波轮廓表示法和不变矩法。本文将重点研究不变矩的形状匹配方法。 3.4 图像的不变矩匹配 计算机系统在识别图像时,应具有的一个重要特性是对图像的平移、旋转及比例变换具有不变性。一个最直观的方法是要求图像特征本身具有“不变性”,即尽可能寻求图像本身的“不变性”特征。因此,不变性特征的研究一直是感知科学和计算机视觉的研究重点。不变矩算法

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号