机器视觉测量技术.doc

上传人:小飞机 文档编号:1630776 上传时间:2022-12-12 格式:DOC 页数:75 大小:253KB
返回 下载 相关 举报
机器视觉测量技术.doc_第1页
第1页 / 共75页
机器视觉测量技术.doc_第2页
第2页 / 共75页
机器视觉测量技术.doc_第3页
第3页 / 共75页
机器视觉测量技术.doc_第4页
第4页 / 共75页
机器视觉测量技术.doc_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《机器视觉测量技术.doc》由会员分享,可在线阅读,更多相关《机器视觉测量技术.doc(75页珍藏版)》请在三一办公上搜索。

1、机 器 视 觉 测 量 技 术 杨 永 跃合 肥 工 业 大 学2007.3目 录第一章 绪论1.1 概述1.2 机器视觉的研究内容1.3 机器视觉的应用1.4 人类视觉简介1.5 颜色和知觉1.6 光度学1.7 视觉的空间知觉1.8 几何基础第二章 图像的采集和量化2.1 采集装置的性能指标2.2 电荷藕合摄像器件2.3 CCD 相机类2.4 彩色数码相机2.5 常用的图像文件格式2.6 照明系统设计第三章 光学图样的测量3.1 全息技术3.2 散斑测量技术3.3 莫尔条纹测量技术3.4 微图像测量技术第四章 标定方法的研究4.1 干涉条纹图数学形成与特征4.2 图像预处理方法4.3 条纹倍

2、增法4.4 条纹图的旋滤波算法第五章 立体视觉5.1 立体成像25.2 基本约束5.3 边缘匹配5.4 匹域相关性5.5 从 x 恢复形状的方法5.6 测距成像第六章 标定6.1 传统标定6.2 Tsais 万能摄像机标定法6.3 Weng s 标定法6.4 几何映射变换6.5 重采样算法第七章 目标图像亚像素定位技术第八章 图像测量软件(多媒体介绍第九章 典型测量系统设计分析9.1 光源设计9.2 图像传感器设计9.3 图像处理分析9.4 图像识别分析附:教学实验1、 视觉坐标测量标定实验2、 视觉坐标测量的标定方法。3、 视觉坐标测量应用实验4、 典型零件测量方法等。3第一章 绪 论1.1

3、 概述人类在征服自然、改造自然和推动社会进步的过程中,面临着自身能力、能量的局限 性, 因而发明和创造了许多机器来辅助或代替人类完成任务。 智能机器或智能机器人是这种 机器最理想的模式。智能机器 能模拟人类的功能、能感知外部世界,有效解决问题。人类感知外部世界:视觉、听觉、嗅觉、味觉、触觉眼 耳 鼻 舌 身所以对于智能机器,赋予人类视觉功能极其重要。机器视觉:用计算机来模拟生物(外显或宏观视觉功能的科学和技术。机器视觉目标:用图像创建或恢复现实世界模型,然后认知现实世界。1.2 机器视觉的研究内容1 输入设备 成像设备:摄像机、红外线、激光、超声波、 X 射线、 CCD 、数字扫描仪、 超声成

4、像、 CT 等数字化设备2 低层视觉(预处理 :对输入的 原始图像进行处理(滤波、增强、边缘检测 ,提取角 点、边缘、线条色彩等特征。3 中层视觉:恢复场景的深度、表面法线,通过立体视觉、运动估计、明暗特征、纹理 分析。系统标定4 高层视觉:在以物体为中心的坐标系中,恢复物体的完整三维图,识别三维物体,并 确定物体的位置和方向。5 体系结构:根据系统模型(非具体的事例来研究系统的结构。 (某时期的建筑风格 据此风格设计的具体建筑1.3 机器视觉的应用工业检测 文件处理,毫微米技术多媒体数据库。许多人类视觉无法感知的场合,精确定量感知,危险场景,不可见物感知等机器视觉更 显其优越十足。1 零件识

5、别与定位4生产线 机器人足球赛2 产品检验外形、表面、装配位置、超声探测内部裂纹和气孔3 移动机器人双目识别恢复场景。无人驾驶汽车4 遥感图像分析航空摄影、气象卫星、资源卫星航空摄影:利用普通摄影机航拍。制图、制导用气象卫星:红外成像、气象云图海洋资源:合成孔径雷达,获取海辰形象。找矿农作物调查,自然灾害测报,生态环境检 测。5 医学图像分析X 射线、 CT (Computer Tomography 、核磁共振 MRI (magnetic resonance imaging ,超 声成像。作用:(1图像增强、标记、染色 (2专家系统,自动研制6 安全鉴别、监视跟踪车辆识别、车牌号识别人脸、眼底

6、、指纹、表情7 其他体育运动分析:游泳5制衣(人体扫描影视制作1.4 人类视觉简介1 人眼所能看到的光谱范围,只是电磁波辐射范围的很小的一部分,为 380nm -780nm ,可 见光谱2 人眼的构造角膜占表面的 1/6具有屈光作用晶状体、玻璃体等都有屈光作用视网膜:杆状细胞(暗 3 视觉信息处理(1 亮度 (2 形状(3运动(4颜色(5深度感(6通道(7并行人眼对运动物体特别敏感锥状细胞有三种,分别对 430、 540、 570,敏感,构成了三基色原理的基础。深度感 因视差而产生视觉过程: (1视觉的时间特性 视觉在时间上有累积效应对一般的物体进行观察时,接收光的总能量 E 与物体可见面积、

7、表面宽度 L 和时间距 (观察时间长度 T 成正比。另外:人对光的感觉有潜伏期,多次闪光会导致闪烁的知觉。降龙十八章(2视觉的空间特性小而弱的光点单独呈现时可能看不见, 但当多个连在一起作为一个大的光点时同时呈现 时便能看见了。视觉度表示人所能看到景物细节的准确性。认知 觉察 定位觉察:检测在视野中的某个给定物体是否存在 定位:对两物体相对位置精确辨别的能力解像:对一视觉形状各组成部分之间距离的辨别能力认知:综合的能力和方法,包括明度识别,一定的解像力和定位能力。 (3形状知觉:轮廓、图形、背景轮廓:轮廓把物体与视野中的其它部分区分开来,轮廓不等于形状。 轮廓只是边界,是局部概念,而形状则是全

8、体概念。 主观轮廓:主观轮廓产生的必要条件是有些不完整的因素出现将它完整起来就有一种把它变成简单和 稳定正规图案的倾向。 (4视觉的相对性视觉感知的结果不仅仅取决于刺激本身,还与经验对比有关系。 (早晨、中午的太阳哪 个更近 前景与背景:前景:视觉关心的主体。 背景则是与前景相关联的其它刺激 视觉知觉的对比:(1前景和背景可相互置换 (2前景受背景的影响(5视觉的选择性听而不闻视而不见。依赖先验知识而取向。 (6视觉的整体性对部分感知之和而产生的一种整体知觉经验 (7视觉的恒常性亮度恒常性:黑布、白布各自一半在阳光下,一半在阴影中,我们仍然能够判定它 为黑布白布。大小恒常性:物体在视网膜上的象

9、随距离而变化,但我们的感觉则并不是大小的变 化而是距离的变化。(感觉到远方的牛仍然比近处的狗大形状恒常性:直线投影为一点,通过经验加以矫正 颜色恒常性:在相当宽的光明变化条件中,能够感受到颜色的恒常。 (8视觉的组织性 相似性 接近性 封闭性封闭轮廓更容易够成图形。连续性 按列按行三列点列一条直线和曲线的多次交汇,心理上倾向于连续。 (9错视现象 高度 (10眼球微动现象1.5 颜色和知觉 牛顿用三棱镜研究白光的折射,就此便发现白光可被分解成一系列从紫到红的连续光谱。 从而证明白光是由不同颜色的光线相混合而形成的, 而这些光实际上是不同频率的电磁波。(1无颜色 白 灰 黑 黑白系列颜色(2有颜

10、色 除黑白系列之外的各种颜色色觉的产生: 光源的光 反射或透射 视网膜 人脑解释物体均匀的反射各种光 白色物体只反射某种或某几种颜色 彩色CIE 国际明度委员会R :700nm (570G :546.1nm (540 光的三基色B :435.8nm (430 二基色叠加形成三补色颜料的三基色正是光的三补色。人眼的锥状细胞有三种,分别对 430, 540, 570光谱敏感。设三种刺激量分别为:X 、 Y 、 Z 则:Z Y Z Yy += , Z Y X X x +=, Z Y X Zz +=为刺激量的比例系数,称为色系数。可见:x+y+z=1CIE1931色度图 1 三色比例系数 x 、 y

11、、 z 均大于零。 2 Y 的数值正好是彩色光亮度。 3 x=y=z 表示标准白光。这样:Hering 方格错觉=B G R 5943. 50565. . 05907. 40. 11302. 17517. 17689. 2 Z ( Y ( X ( 1 每一点对应一种颜色。 2 色度图边界上二点代表纯颜色。 3 连接两端点直线上的点可由二端点颜色合成。3端点三角形内的颜色可由三端点颜色合成。3基色不能组合出所有的颜色。补色律:两个以适当比例混合能得到白色或灰色的颜色,互称为补色。中间色律:两个非补色混合,便产生一个新的中间色或混合色,色调的混合比例确定。代替律:如颜色X+YB , A+BC 则有

12、 A +X +Y C颜色模型 RGB 模型 (面向显示器、打印机等硬设备规划为单位正方体则所有 RGB 的值在 0, 1R = 700 nmG =546.1 nmB =435.8 nm 根据不同需要提出了:RGB 、 CMY 、 XYZ 、YIQ 、 HSV (HIS 标准白色的 RGB 光通量 r 、 G 、 B 为:r :G : B = 1:4.5907:0.0601这样把光通量为 1Lm 的红色, 4.5079流明的绿光, 0.0601流明的蓝光作为三基色的单位基色量。这样某彩色光通量(C = R(R +G(G +B(B (C 表示光的明亮程度,其色度只取决于 R 、 G 、 B 之间的

13、比例关系。合B G R R r += , B G R G g += , B G R B b += r 、 g 、 b 为色度坐标, r + g + b = 1 CMY各种光也都可以用 CMY 三基色混合而成。RGB, 由黑 白,增色过程。CMY ,由白 黑,减色过程。 (绘图,打印机颜料。-=B G R Y M C 111 YIQ保证彩色电视和黑白电视的兼容。 NTSC(国际电视系统 协会。Y 对应于 XYZ 中的 Y ,为亮度信息。选择三色的基色量为 R=0.299, G=0.587, B=0.114 Y=0.299R+0.587G+0.114B规定:I =0.74(R -Y -0.27(B

14、 -Y Q=0.48(R -Y + 0.41(B -Y 综合有:-=B G R Q I Y 312. 0523. 0211. 0322. 0274. 0596. 0114. 0587. 0299. 0 这里 RGB 为 NTSC 制式 RGB HIS 模型H :色调。混合光谱中的主要波长。S : 饱和度。一定色调的纯度。纯光谱色是完全饱和,加入反光饱和度逐渐减小。I : 密度、亮度(与反射率成正比 RGB 到 HIS 转换(31B G R I += , , min(31B G R BG R S +-= ( (22B G G R G R BR G R H -+-+-=HIS 转到 RGB1, 0

15、, I S 1, 0, , B G R1(S I B -=H 0, 120I R =60cos(cos 1H H S -+ (3R B I G +-=发光强度定义:光源 Z H 的单色光,在指定方向辐射强度为 W1.6 光度学光度学:研究光的强弱的学科。 (Photometry 当光源足够小,或足够远,以至于眼睛无法分辨形状时,光源为点光源。点光源 Q 沿某个方向 r 的发光强度 I 定义为此方向上单位立体角内发出的光通量 0。 单位为流明(Lm 。以 r 为轴取一个立体角元 d , d 内的光通量为 d 沿 r 方向的发光强度为:=d d I (单位角内的光通量 发光强度的单位为 cd (坎

16、 德拉 , 1cd=11cd 发光强度的点发出的总光通量为 4lm 。sr 为球面度,球心对球面的总球面度为 4。实际中的光源总有一定的发光面积 扩展光源。扩展光源表面的每个面元 ds 沿某个 方向 r 有一定发光强度 dI 沿 r 观察,则 ds =ds cos 投影面积则面元 ds 沿 r 方向的光度学亮度 B 定义为在此方向上单位投影面积的发光强度。 高度:c o s c o s =dS d d dS dI dS dI B 单位:2m cd 被照表面照度:一个被光线照射的表面上的照度, 为照射在单位面积上的光通量, 设面 积 ds 上的光通量为 d , 则:照度 dSd E = 单位:1

17、(勒 克斯 1Lx = 1 2m lm/ 照度光学系统的像面照度和其他表面的照度是必须了解的光学量。参看图 1.4-1,从轴面上 的面元 dA 1、辐射到接收面上的面元 dA 2的辐射通量为:2d =LdA 1d , Cos 式中12221cos r dA d = 图 xx 辐射的传播而从物面辐射到接收面的总辐射通量为22112cos dA dA dA r L A A A = 设物面是朗伯面,即 L 与面元 dA 1的位置无关,则212112cos cos cos cos dA dA r dA dA r LA A A A A = 由此2112cos dA dA r cs F A A = 式中

18、F 12称为辐射传输系数, 它只与表面的形状、 位置、 大小和方向有关。 是一纯粹几何量。 F 12是一二重积分量,很难计算,不过现在已经对一些典型情况,计算出了结果,并且列出 了表格,可供查阅。像面照度光学系统像面上的照度会受两方面的影响:(1光学系统的会聚和发散作用; (2光学 系统的吸收、反射、散射和挡光的作用;为了简单起见,将忽略第(2种影响,而对于第(1种影响将通过光学系统的几何度 G 表示出来,并使这一计算变得很简单。几何度 G 的定义为 T A A A dA dA r A G =11cos cos 式中 212122121cos cos dA dA r A A T = 这是投影立

19、体角, 它是接收面 dA 2对物面 dA 1所张立体角在物面法线方向的投影的积分。 几何度 G 只和光源的几何尺寸、光源到光学系统的距离、光学系统的入瞳尺寸以及光 学系统的结构有关。 当光能通过光学系统且不存在损失时, G 是不变量, 即在光学系统内的 不同截面上, G 都是相同的。若从图 1.4-2观察则有Gs = Ge = Gx = Gi式中 Gs 、 Ge 、 Gx 、 Gi 分别是光学系统的物面 S 、入瞳面 e 、出瞳面 x 、像面 i的几何度。 图 1.4-2从上可以看出 ;(1几何度 G 可以表示光学系统传输辐射的能力;(2可以根据易于计算的截面上的 G 值,计算出任一截面上的照

20、度。例如:(1光能无损失的光学系统像面中心的辐射度由 i i LA =得到1(1 (4 ( (4422222-=f D L lf f D L l D L L A E i i式中, 是光学系统的纵向放大率。(2视场角为 处像平面上的辐照度。比较物方侧物点 1和轴上点 0所对应立体角的大小。对于物点 1,入瞳所对应的立体角 为33221cos cos cos /(cos =lA l A e e 式中 0是入瞳对轴上点 0所张的立体角,故轴外点像平面的辐照度为 cos 1(1 (4cos 1(1 (cos 4-=-=f D L f D L E i 上式说明:像面照度 i E 与光学系统的相对孔径 (

21、f D 的平面成正比,又和视场角 的余弦的 4次方成正比;需要特别注意的是:4cos i E ,这将严重影响像面照度的均匀性。但是,对于野外 景物,它并不是朗伯体,而是各向均匀发光体,则 3cos i E 。1.7 视觉的空间知觉人眼能在高和宽为 2D 空间上形成的视象得到一个 3D 视觉空间。 非视觉性深度线索眼睛聚焦调节:观察远点不同的物体时,眼睛调节晶状体,使成清晰象,这种调节活动给大脑提供信息,提供深度估计。据此共焦测距法双眼视轴的融合观察远近不同的物体,双眼自动调节使视轴对准视网膜中心,做幅合运动。提供距离信息 三角测距法 双眼深度线索 中央眼确定主观视觉方向,视觉是产生立体知觉和深

22、度知觉。 (单独产生(图像复合后相当于 1只眼睛看到 单眼深度线索大小:尺寸相近的物体,近:成像大;远:成像小物体的遮挡:遮挡来判断物体的前后距离光亮与阴影:近:物体明亮;远:物体灰暗颜色分布:近:黄或红;远:蓝空气透视:近:轮廓清晰;远:模糊不清纹理:近:纹理稀疏;远:纹理密集运动:近:视角变化大;远:视角变化小(坐车过电线杆,和远处的树第二章 图像的采集和量化2.1 采集装置的性能指标接受外界的激励并产生响应,把模拟的响应转化为数字化的信号,从而可被计算机利 用。采集装置功能: 接受辐射(光、声、电 进行模数转换。采集装置性能指标: 线性响应:输入物理信号的强度与输出响应信号的强度之间关系

23、是否线性。 灵敏度:绝对灵敏度用能拾测到的最小光子数表示。相对灵敏度用能使输出发生一级变化所需光子数表示。 信噪比:所采集的图像中有用信号与无用干扰的(能量或强度比值。 阴影(不均匀度 :输入物理信号为常数而输出的数字形式不为常数的现象。 象素形状:一般为正方形,但也有其它形状(如运动 。 频谱灵敏度:对不同频率辐射的相对灵敏度。 快门速度:采集拍摄时间。 读取速度:信号数据从敏感单元读取(传输的数率。2.2 电荷藕合摄像器件面阵 CCD 原理。 (帧转移型,隔列转移型,线转移型面阵 CCD 的基本特性参数: 光电转移特性光电转换因子 ,一般 99.7。 光谱响应 动态范围:输出信号峰值电压与

24、均方根噪声电压之比。噪声源:电荷注入器件引起的噪声。电荷转移过程中,电荷量变化引起的噪声。拾测时产生的噪声。 暗电流:正常工作时, MOS 电容处于未饱和的非平衡状态,但由于热激发产 生的少量载流子使系统趋向平衡。暗电流是判断一个系统好坏的重要标志。 分辨率:像元位数高的器件具有更高的分辨率。面阵 CCD ,只评价其水平分辨率,且用电视线数的评价方法。在一幅图像上,在水平方向能够分辨出的黑白条数分辨率。 填充系数 Fb电敏感区域占整个矩阵面的比例 b100=bb a a n F 拖影:由寄存器电荷移位时留下的剩余 电荷量产生。三管 CCD 彩色摄像机分光棱镜三色 三 CCD 接收 RGB 信号

25、单管 CCD 彩色摄像机栅状滤色器 三色 三 CCD 接收 RGB 信号(例举液晶显示器特种 CCD 图像传感器 微光 CCD 图像传感器(多帧积累直视夜视仪 微光透视图像传感器特点:便于图像处理,实现远距传输或遥控,实现自动控制直接用于制导、录像并长期保存。 红外 CCD 图像传感器(IR CCD用于夜视, 、跟踪制导、红外侦察、预警。 (海湾战争主动红外电视摄像:红外光源(红外光源,半导体激光器红外摄像器件(CCD 红外变像管:把不可见的红外线转变成可见光。 X 光 CCD 图像传感器 医疗影像+工业探测 目标:小剂量 X 光照射,图像远程传输。2.3 CCD 相机分类 : 彩色相机 黑白

26、相机 按灵敏度划分:普通型(照度 13 lux ,月光型(照度 0.1 lux星光型(照度 0.01 lux ,红外型(红外照明,天光线按 CCD 灵敏度尺寸分为 1/4 inch, 1/3 inch, 1/2 inch, 1 inch相机。按扫描方式:有面扫描和线扫描方式,面扫描又分为逐行扫描和隔行扫描。按同步方式:内扫描(普通相机 ,外同步功能相机。CCD 相机主要功能调节 同步方式选择:内同步(利用内置的同步信号发生器产生同步信号 ;外同步(外触发信号 ;电源同步(利用电源完成垂直同步 ; 自动增益控制:CCD 信号的视频放大器,对不同照度而随之改变增益,可使相机在较 大的光照范围内进行

27、工作。 背光补偿:自动补偿(AGC 以整个视场平均值来确定(亮背景,暗前景启动背光 补偿,则 AGC 只对前景视场求平均确定增益。 电子快门:CCD 仅输出快门开启时的光电荷信号, 其余时间则被泄放。 最短电子快门为 1/1000 S。 校正:L =V (机器视觉 =1光(L CCD 电(V 显示器 光。要保持二次转换中的综合特性具有线性。 自平衡(仅用于彩色相机 :对景物图像进行色温补偿,分为自动调节和手动调节两种。 CCD 相机接口: 光学接口 信号接口:RS422:双绞线,相机具有 110终端负载。Camera Link:控制信号、视频信号、串行通讯。LVDS (低振幅差分信号 :低电压

28、和低电压驱动实现了低噪声和低功耗。IEEE1394:串行接口(Firewire 400Mbps ,不需要集线器就可以连接 63台设备,连 接电脑可省去图像采集卡。2.4 彩色数码相机图像 镜头 CCD A/D 数字信息存储数码相机的最大特点是它的一系列的二进制数据和标准的图像存储方式把所摄图像存放在 机内存储器,并可以通过专用接口与通用计算机联机,实现图像传输和计算机处理的功能。 分辨率高达 30602036。主要性能:1. 分辨率:常有 16001200, 1024768, 640780。2. 色彩深度:专业的达到 36位或 24位。3. 焦距:可高达 10倍光学变焦,数码变焦。4. 光圈快

29、门:快门 1/50016 S 广角光圈 f2.5f16; 长焦光圈 f3.8f24。5. 图像存储:内置存储卡 JPG 格式 120K 。6. 取景器“观看拍摄效果和编辑修改(液晶 。7. 接口功能:RS232、 SCS1、 USB 。 1394接口。8. 其他接口:自动测光、自动调焦、自动闪光、自拍。2.5 常用的图像文件格式1. BMP2. GIF3. TIFF(TIF4. JPEG(JPG(依据数字图像处理内容简单扩展2.6 照明系统设计照明系统设计的基本因素: 镜头的视场:被测物尺寸 镜头视场 最佳照明(照亮整个视场 照明系统与工作间距:镜头到工作距离 照明系统到工作间距 光源到工作距

30、离 工件的外形,条纹及颜色:工作表面形状、平坦度、粗糙度、颜色 成像物镜自配:针对确定的成像物镜进行光源设计划痕、 缺陷、 印纹等能被清晰显现。 照度自配:根据 CCD 的光表面动态响应范围确定合适的像表面度。照明系统的选择: 直接型:沐光方式 高环形光 反射型低角度方式 低环形光 漫反射条形方式 条形光源聚光方式 聚光 高亮方式(激光 投射型:高亮投射照明导光面(光板投射照明线条光源 投射照明 同轴光照明:与光轴平行的平行光均匀照明工件。 不同频率光线照明(多彩第三章 二值图像分析一幅数字图像是一个二维阵列, 阵列元素值称为灰度值或强度值. 实际上, 图像在量化 成数字图像前是一个连续强度函

31、数的集合, 场景信息就包含在这些强度值中. 图像强度通常 被量化成 256个不同灰度级, 对某些应用来说, 也常有 32、 64、 128或 512个灰度级的情况, 在医疗领域里甚至使用高达 4096(12bits个灰度级.很明显,灰度级越高,图像质量越好, 但所需的内存也越大.在机器视觉研究的早期, 由于内存和计算能力非常有限, 而且十分昂贵, 因此视觉研究 人员把精力主要集中在研究输入图像仅包含两个灰度值的二值视觉系统上. 人们注意到, 人 类视觉在理解仅由两个灰度级组成的线条、 轮廓影像或其它图像时没有任何困难, 而且应用 场合很多,这一点对研究二值视觉系统的研究人员是一个极大的鼓舞.随

32、着计算机计算能力的不断增强和计算成本的不断下降, 人们普遍开始研究基于灰度图 像、彩色图像和深度图像的视觉系统.尽管如此, 二值视觉系统还是十分有用的, 其原因如 下: 计算二值图像特性的算法非常简单,容易理解和实现, 并且计算速度很快. 二值 视觉所需的内存小, 对计算设备要求低. 工作在 256个灰度级的视觉系统所需内存是工作在 相同大小二值图像视觉系统所需内存的八倍.如若利用游程长度编码等技术(见 3. 4节 还可使所需内存进一步减少. 由于二值图像中的许多运算是逻辑运算而不是算术运算, 所以 所需的处理时间很短. (3 许多二值视觉系统技术也可以用于灰度图像视觉系统上. 在灰度 或彩色

33、图像中, 表示一个目标或物体的一种简易方法就是使用物体模板 (mask,物体模板就 是一幅二值图像,其中 1表示目标上的点, 0表示其它点.在物体从背景中分离出来后,为 了进行决策, 还需要求取物体的几何和拓扑特性, 这些特性可以从它的二值图像计算出来. 因 此,尽管我们是在二值图像上讨论这些方法,但它们的应用并不限于二值图像.一般来说, 当物体轮廓足以用来识别物体且周围环境可以适当地控制时, 二值视觉系统 是非常有用的. 当使用特殊的照明技术和背景并且场景中只有少数物体时, 物体可以很容易 地从背景中分离出来,并可得到较好的轮廓, 比如,许多工业场合都属于这种情况.二值视 觉系统的输入一般是

34、灰度图像, 通常使用阈值法首先将图像变成二值图像, 以便把物体从背 景中分离出来, 其中的阈值取决于照明条件和物体的反射特性. 二值图像可用来计算特定任 务中物体的几何和拓扑特性, 在许多应用中, 这种特性对识别物体来说是足够的. 二值视觉 系统已经在光学字符识别、染色体分析和工业零件的识别中得到了广泛应用.在下面的讨论中,假定二值图像大小为 n m ,其中物体像素值为 1,背景像素值为 0.3. 1 阈值视觉系统中的一个重要问题是从图像中识别代表物体的区域(或子图像 ,这种对人来 说是件非常容易的事, 对计算机来说却是令人吃惊的困难. 为了将物体区域同图像其它区域 分离出来,需要首先对图像进

35、行分割.把图像划分成区域的过程称为分割,即把图像 , j i F 划分成区域 k p p p , , , 21, 使得每一个区域对应一个候选的物体. 下面给出分割的严格定义. 定义 分割是把像素聚合成区域的过程,使得:=i k i P 1 整幅图像 (i P 是一个完备分割 . j i P P j i =, , (i P 是一个完备分割 .每个区域 i P 满足一个谓词,即区域内的所有点有某种共同的性质. 不同区域的图像,不满足这一谓词.正如上面所表明的, 分割满足一个谓词, 这一谓词可能是简单的, 如分割灰度图像时用 的均匀灰度分布、相同纹理等谓词, 但在大多数应用场合,谓词十分复杂. 在图

36、像理解过程 中,分割是一个非常重要的步骤.二值图像可以通过适当地分割灰度图像得到. 如果物体的灰度值落在某一区间内, 并且 背景的灰度值在这一区间之外, 则可以通过阈值运算得到物体的二值图像, 即把区间内的点 置成 1,区间外的点置成 0.对于二值视觉,分割和阈值化是同义的.阈值化可以通过软件 来实现,也可以通过硬件直接完成.通过阈值运算是否可以有效地进行图像分割, 取决于物体和背景之间是否有足够的对比 度. 设一幅灰度图像 , j i F 中物体的灰度分布在区间 , 21T T 内, 经过阈值运算后的图像为二 值图像 , j i F T ,即:=其它 如果 0, 1, 21T j i F T

37、 j i F T (3. 1如果物体灰度值分布在几个不相邻区间内时,阈值化方案可表示为:=其它 如果 0, 1, Z j i F j i F T (3. 2 其中 Z 是组成物体各部分灰度值的集合.图 3. 1是对一幅灰度图像使用不同阈值得到的二 值图像输出结果.阈值算法与应用领域密切相关.事实上,某一阈值运算常常是为某一应用专门设计的, 在其它应用领域可能无法工作. 阈值选择常常是基于在某一应用领域获取的先验知识, 因此 在某些场合下,前几轮运算通常采用交互式方式来分析图像,以便确定合适的阈值.但是, 在机器视觉系统中, 由于视觉系统的自主性能 (autonomy 要求, 必须进行自动阈值选

38、择. 现 在已经研究出许多利用图像灰度分布和有关的物体知识来自动选择适当阈值的技术. 其中的 一些方法将在 3. 2节介绍. 图 3. 1 一幅灰度图像和使用不同阈值得到的二值图像结果.上左:原始灰度图像,上右:阈值 T=100;左下:T=128.右下:T1=100|T2=128.3. 2 几何特性通过阈值化方法从图像中检测出物体后, 下一步就要对物体进行识别和定位. 在大多数工业应用中, 摄像机的位置和环境是已知的, 因此通过简单的几何知识就可以从物体的二维 图像确定出物体的三维位置. 在大多数应用中, 物体的数量不是很多, 如果物体的尺寸和形 状完全不同, 则可以利用尺度和形状特征来识别这

39、些物体. 实际上在许多工业应用中, 经常 使用区域的一些简单特征,如大小、位置和方向,来确定物体的位置并识别它们.3. 2. 1 尺寸和位置一幅二值图像区域的面积(或零阶矩由下式给出:-=-=1010, n i m j j i B A (3. 3在许多应用中, 物体的位置起着十分重要的作用. 工业应用中, 物体通常出现在已知表 面(如工作台面上,而且摄像机相对台面的位置也是已知的.在这种情况下,图像中的物 体位置决定了它的空间位置. 确定物体位置的方法有许多, 比如用物体的外接矩形、 物体矩 心(区域中心等来表示物体的位置.区域中心是通过对图像进行“全局”运算得到的一个 点, 因此它对图像中的

40、噪声相对来说是不敏感的. 对于二值图像, 物体的中心位置与物体的 质心相同,因此可以使用下式求物体的中心位置:-=-=-=-=-=-=-=-=-=01010, , , , n i n i m j m j n i m j n i m j j i iB j i B j i jB j i B (3. 4其中 和 是区域相对于左上角图像的中心坐标.物体的位置为:Aj i iB Aj i jB n i m j n i m j -=-=-=-=-=, , (3. 5这些是一阶矩.注意,由于约定 y 轴向上,因此方程 3. 4和 3. 5的第二个式子的等号右边 加了负号.3. 2. 2 方向计算物体的方向比

41、计算它的位置稍微复杂一点.某些形状(如圆的方向不是唯一的, 为了定义唯一的方向,一般假定物体是长形的,其长轴方向被定义为物体的方向. 通常,二 维平面上与最小惯量轴同方向的最小二阶矩轴被定为长轴.图像中物体的二阶矩轴是这样一条线, 物体上的全部点到该线的距离平方和最小. 给出 一幅二值图像 , j i B ,计算物体点到直线的最小二乘方拟合,使所有物体点到直线的距离 平方和最小:220101=-=-r Bi j i j j m i n , (3. 6其中 r i j 是物体点 , j i 到直线的距离. 为了避免直线处于近似垂直时所出现的数值病态问题, 人们一般把直线表示成极坐标形式:sin

42、cos y x += (3. 7如图 3. 2所示, 是直线的法线与 x 轴的夹角, 是直线到原点的距离.把点 , (j i 坐标 代入直线的极坐标方程得出距离 r :22 sin cos (-+=y x r (3. 8 图 3. 2 直线的极坐标表示将方程 3. 8代入方程 3. 6并求极小化问题,可以确定参数 和 :-=-=-+=101022, sin cos (n i m j ij ij j i B y x (3. 9 令 2对 的导数等于零求解 得:sin cos (+= (3. 10 它说明回归直线通过物体中心 , (.用这一 值代入上面的 2,则极小化问题变为:222sin cos

43、 sin cos c b a += (3. 11其中的参数: , (, (2, (10210101010102j i B y c j i B y x b j i B x a n i m j ij n i m j ij ij n i m j ij -=-=-=-=-=-=-=-=-= (3. 12是二阶矩.表达式 2可重写为:2sin 212cos (21 (212b c a c a +-+= (3. 13 对 2微分,并置微分结果为零,求解 值:ca b -=2tan (3. 14 因此,惯性轴的方向由下式给出: 2222 (2cos (2sin c a b ca c a b b -+-=-+

44、= (3. 15 所以由 2的最小值可以确定方向轴.注意,如果 c a b =, 0,那么物体就不会只有唯一的 方向轴.物体的伸长率 E 是 2的最大值与最小值之比:minmax =E (3. 16 3. 2. 3 密集度和体态比区域的密集度(compact 可用下面的式子来度量:2p A C = (3. 17 其中, p 和 A 分别为图形的周长和面积.根据这一衡量标准,圆是最密集的图形,其密集 密度为最大值 4/1,其它一些图形的比值要小一些.让我们来看一下圆,当圆后仰时,形 状成了一椭圆, 面积减小了而周长却不象面积减小的那么快, 因此密集度降低了. 在后仰到 极限角时, 椭圆被压缩成了一条无限长直线, 椭圆的周长为无穷大,故密集度变成了零.对 于数字图像, 2p 是指物体尺寸(像素点数量除以边界长度的平方.这是一种很好的 散布性或密集性度量方法.这一比值在许多应用中被用作为区域的一个特征.密集度的另一层意义是:在给定周长的条件下,密集度越高, 围成的面积就越大. 注意 在等周长的情况下,正方形密集度大于长方形密集度.体态比定义为区域的最

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号