《目标跟踪的研究背景意义方法及现状.doc》由会员分享,可在线阅读,更多相关《目标跟踪的研究背景意义方法及现状.doc(5页珍藏版)》请在三一办公上搜索。
1、目标跟踪的研究背景意义方法及现状1目标跟踪的研究背景及意义11.1电视监控21.2视频压缩编码21.3智能交通系统21.4人机交互32研究现状及研究面临的问题32.1研究现状32.2研究面临的难题43目标跟踪的主要方法43.1基于检测的方法53.2基于识别的方法51目标跟踪的研究背景及意义 感觉是人类与外界联系的窗口和交流的桥梁,它的主要任务是识别周边物体,判断与这些物体之间的联系,使人类的思维与周围世界建立某种对应的关系。而视觉系统是人类感觉的最主要来源,是获取外界信息的最主要途径,它是一种高清晰度的媒介,为人类提供着丰富的外界资源信息。据统计,大约有80%的外界信息是通过眼睛被人接收的。然
2、而,由于人类的精力毕竟是有限的,人类的视野也是有限的,所以人类的视觉在各种领域的应用都受到很大限制甚至是低效的。 因而,随着数字计算机技术的飞速发展,让计算机能够处理视觉信息、完善人类视觉上的诸多短板就成了一项非常诱人的研究课题,也因此推动了计算机视觉这一学科的产生和发展。计算机视觉是融合了图像处理、计算机图形学、模式识别、人工智能、人工神经网络、计算机、心理学、物理学和数学等领域的一门交叉性很强的学科。计算机视觉研究的目的是使计算机感知环境中的物体的几何信息,包括它的形状、位置、姿态、运动等,并对其进行描述、存储、识别与理解,因此成为当今最热门的课题之一。运动目标跟踪属于视频分析的内容,而视
3、频分析则融合了计算机视觉研究领域的中层和高层处理阶段,即对图像序列进行处理,从而研究运动目标的规律,或者为系统的决策报警提供语义和非语义的信息支持,包括运动检测、目标分类、目标跟踪、行为理解、事件检测等。视频目标跟踪方法的研究和应用作为计算机视觉领域的一个重要分支,正日益广泛地应用到科学技术、国防建设、航空航天、医药卫生以及国民经济的各个领域,因而研究目标跟踪技术有着重大的实用价值和广阔发展前景。目前,目标跟踪技术已经被广泛应用于众多生活和工作领域。主要应用如下所示:1.1电视监控在现阶段,电视监控系统作为公共安全领域中的一项重要技术已经得到了广泛的应用。但是大多数电视监视系统的功能仅仅停留在
4、监控者对视频信号的人工监视和事后录像分析上,浪费了大量的人力物力。在计算机智能监控系统中,监控系统首先对图像进行预处理去除噪声,然后通过适当的检测算法确定运动目标,继而通过跟踪算法在摄像机视野内跟踪运动目标,同时进行报警以及保存视频数据等一系列工作。而在这个系统中,其核心部分就是运动目标检测与跟踪算法技术,这个技术是保证整个系统实现其功能的关键。1.2视频压缩编码在新一代的视频图像压缩编码标准MPEG4中,提出了一个不同于以前的视频编码的新概念视频对象平面(Video Object Planes,VOP),以实现基于图像内容的压缩。在压缩编码过程中,视频中的场景被分割成若干个VOP,不同的VO
5、P根据其特点采用不同的编码策略,例如,场景中的背景在很多情况下基本上保持不变或只有很少部分的变化,则可以在连续的多帧图像中使用相同的编码或只有很少改动的编码来表示背景,从而大大提高了压缩效率。这种方案具有很高的压缩比,同时还具有良好的视觉效果,便于进行基于内容的交互和查询。但是,这一压缩编码的技术难点在于如何在任意场景下实现对运动目标的自动提取与分割,而这些问题也正是目标检测与跟踪所要解决的关键问题。1.3智能交通系统智能交通系统是目前世界各国交通运输领域竞相研究和开发的热点。中国在北京申奥成功后,为解决北京市的交通状况,政府也在智能交通的研究上加大了投入力度。车辆的实时检测与跟踪技术是智能交
6、通系统的重要技术之一,计算机在不需要人的干预或者只需要很少人干预的情况下,通过对摄像机拍录的视频序列进行分析,实现车辆检测与跟踪,并在此基础上分析和判断车辆的行为,对车辆的行为给出语义描述,做到了既能完成日常管理,又能在发生异常情况时及时做出反应,从而提供了一种更加先进和可行的监控方案。,1.4人机交互目前键盘和鼠标是我们和计算机交互的接口方式,我们希望有更简洁的、智能化和人性化的人机交互方式。计算机无接触式地收集人类在计算机前的视频信号,利用计算机视觉的相关理论分析视频信号,做到分辨人类的动作,明白人类的意图,即我们希望计算机能尽可能地“理解”我们。近些年的工作主要集中在姿态分析,面部表情及
7、其它的运动,以便计算机能够识别和理解这些动作。这也是智能机器人研究的重点。此外,目标跟踪在基于视觉的控制、农业自动化、医学图像、视觉重构等领域均有应用。而目标跟踪处于整个计算机视觉系统的底层,是各种后续高级处理如:目标分类、行为理解等的基础,因而目标跟踪具有非常重要的研究价值。2研究现状及研究面临的问题2.1研究现状目标跟踪是视觉领域研究的热点问题,随着计算机技术的发展而得到迅猛的发展,目标跟踪技术也由此取得了长足的进步。上世纪对图像的处理主要是集中于单幅图像的处理,即使在动态图像序列中跟踪运动目标,也带有浓厚的静态图像处理的特点。直到上世纪80年代 HomBK等人提出了光流法,目标跟踪研究才
8、真正意义上步入了动态图像序列的研究领域。光流法对于现阶段的计算机处理速度提出了极大的挑战,在实际应用领域很难满足实时性的要求。另外,视频序列存在的噪声会对光流法跟踪产生极大的干扰,因此光流法现阶段很难应用到实际场合。基于视觉跟踪的巨大实用价值和计算机技术的迅速发展,视觉跟踪技术的强烈需求,欧美等发达国家对视频跟踪技术进行了大量深入的研究。 1997年,由美国国防高级研究项目署(Defence Advanced Research projects Agency,DARPA)牵头,以美国卡耐基梅隆大学为首,麻省理工学院等高校参与了视觉监控项目VSAM即(Visual surveillance an
9、d Monitorings)的研究开发,研究应用于战场及民用场景的监控,卡内基梅隆大学由此建立了第一个校园监控系统。在智能监控方面,Maryland大学研发的实时监控系统W4实现了人的跟踪,可用于对人的行为监视,并可以判断人是否携带物体等简单行为。英国雷丁大学的车辆交通监控系统则是对车辆和行人的跟踪及交互作用识别相关方面的研究。在国内,视觉跟踪技术自1986年开始立项研究,视觉跟踪领域的理论和技术也有了长足的发展,中国科学院、浙江大学、武汉大学等高校和研究所在目标跟踪、运动行人的检测识别方面取得了一定的成果。以上介绍的主要是视觉跟踪在民用方面的应用,军事上视觉跟踪同样有着广泛的应用。现代军事战
10、争中,利用飞机在空中对特定目标进行打击是行之有效的军事手段,Kumar R等人针对Avs(Aerial video surveillance)系统进行了深入的研究,并取得了一定的成果。Tsao和wen针对军事战场上的敌方运动目标跟踪进行研究,以期在不同的战场环境中,对敌方运动目标进行准确快速的搜索和跟踪,稳定而又可靠的跟踪为军事决策提供了可靠的信息保障。在视觉跟踪领域的跟踪算法层出不穷,在跟踪效果上都能满足某些应用背景的要求,但缺乏通用性。1975年Fukunaga等人在一篇关于概率密度梯度函数的估计中首次提出Mean shift(均值偏移)概念,Yizong zheng于 1995年在“Me
11、an shift mode seeking and clustering”中拓展了 Meanshift的适用范围,研究人员在此基础上对 MeanShift展开了深入的研究。2.2研究面临的难题虽然用mean-shift算法对目标跟踪有着速度快,具有较强的抗干扰能力,引起国内外的广泛关注。但是该算法对不同环境、不同运动特性的目标进行跟踪,也会产生一些影响跟踪稳定性的因素。比如对复杂背景下目标的跟踪,对运动中发生了形变、缩放、遮挡等变化的目标进行长时间跟踪。针对这些问题,虽然可从以下4个方面进行解决:合理的目标特征选取机制;有效的核函数带宽自适应更新机制;适时的特征模板更新机制;连续的目标跟踪预测
12、与遮挡检测机制。然而在很多不同的应用环境下,要做到以上四点并不是件容易的事情,虽然有很多学者针对这些做了很多研究,并在不同程度上解决了上述问题,但要么是算法复杂难以满足实时性,要么就是有许多前提条件,从而使实际的跟踪效果并不理想。3目标跟踪的主要方法 对目标跟踪技术的研究进行了多年,目前己经提出了许多算法。这些算法有的是通过选取好的跟踪特征来提高目标的搜索匹配速度和匹配的正确程度,比如针对刚性目标与非刚性目标的跟踪、针对提高跟踪匹配的准确性而提出的跟踪算法;有的算法是针对缩小目标搜索范围提出的,这类算法的主要特点是通过某种方法预测目标下一时刻可能出现的位置,通过缩小目标的搜索范围来缩短目标搜索
13、时间。虽然目标跟踪的方法有很多,但是迄今为止,并没有权威的分类方法,目前的目标跟踪技术大致可以分为基于检测的方法与基于识别的方法。3.1基于检测的方法 基于检测的方法一般是利用目标的特征直接在图像序列中提取目标。这种方法的主要的思想是:从全局出发,找出目标和背景之间的差别。其主要优点是只需要突出目标和非目标在不同时域或者空域的差别以及具有检测多个目标的能力。目标检测方法中应用最广泛的是基于运动分析的方法。背景的运动相对要更缓慢,因此通过对序列图像的运动分析,检测背景与目标之间具有相对速度的位置来定位目标,可以比较容易分离出目标。运动分析的方法可以分为三种:基于帧间差分的方法、基于背景差分的方法和基于运动场估计的方法。3.2基于识别的方法基于识别的方法也称为基于匹配的方法。这种方法与基于检测的方法不同之处在于,它不要求得到背景(或非目标)部分的描述,不需要描述目标和背景的区别,而仅仅需准确描述目标自身的特征。按照匹配原理的不同,该方法可以分为区域匹配、模型匹配、频率域匹配和特征匹配。