基于梯度方向直方图的行人检测方法研究.doc

资源描述

《基于梯度方向直方图的行人检测方法研究.doc》由会员分享，可在线阅读，更多相关《基于梯度方向直方图的行人检测方法研究.doc（5页珍藏版）》请在三一办公上搜索。

1、基于梯度方向直方图的行人检测方法研究倪恺，肖志涛，张芳（天津工业大学信息与通信工程学院，天津 300160）【摘要】为满足汽车安全性的要求，基于图像的梯度方向直方图特征，利用支持向量机的方法，实现了行人检测。该方法提取正负样本图像的局域梯度直方图特征，利用支持向量机进行样本训练，得到行人分类器。利用训练好的分类器进行检测，实验结果表明，该方法可

2、以有效检测出前方出现的行人，并达到了较好的检测效果。【关键词】梯度方向直方图；行人检测；支持向量机【中图分类号】 TN919.8；TP391【文献标识码】 AStudy on Method of Pedestrians Detection Based on Histograms of Oriented GradientsNI Kai, XIAO Zhitao, ZHANG Fang（School of Information and Communication Engineering,

3、Tianjin Polytechnic University, Tianjin 300160, China ）【Abstract】 To meet the requirement of vehicle safety, a method based on Histograms of Oriented Gradients (HOG) and Support Vector Machine （SVM） which can be used to detect the preceding human is presented. Calculation is done to get some part of

4、 HOG feature in some positive and negative training examples. Then the algorithm of SVM is used to do the training to get ahuman classifier. Then, the classifier is used to make human detection. Experiment results are performed practically and show that the proposed method can detect preceding perso

5、n effectively.【Key words】 HOG; pedestrians detection; SVM响，在灰度分布的区域上并没有明显的不同。基于以上考虑，笔者研究了一种利用梯度方向直方图（Histograms of Oriented Gradients，HOG）特征1的方法，提取图像中局部区域的梯度方向直方图特征，利用支持向量机（Support Vector Machine，SVM）的方法形成分类器，作为 HOG 特征训练的分类，从而实现行人检测。HOG引言行人检测是目标检测的重要分支，是近年来智能汽车

6、领域中的前沿方向和研究热点，它在智能汽车中的监控系统、驾驶员辅助系统方面拥有广泛的应用前景。检测方法多种多样，其本质是利用行人特征将行人从背景中分割出来，将检测问题转化为模式分类的问题。行人检测在物体检测领域有特殊性，对于人体形态而言，人体是一个非刚性的、形变大的、多角度的物体，同时还受到光照、衣着以及复杂背景环境的影响，多视、多态的人体检测具有很大难度与挑战。目前广泛的资料中，行人检测的方法包括背景提取和

7、形状模型匹配的方法，该方法通过对当前图像与参考背景进行逐个做差来得到运动目标，再与相对应的行人形状模型进行匹配，但仅能处理一系列的图像帧，不能处理单独的一帧图像，而且行人的多态性使算法变得复杂，使模型匹配很难达到理想的结果。应用 Haar 特征的方法，从训练样本中提取 Haar 特征，应用该特征并进行逐层训练，得到强分类器，通过强分类器进行行人的识别。 Haar 特征检测方法已成功应用0表示的是边缘梯度的结构特征，因此可以描述局部区域的形状信息，能对

8、局部对象外观和形状进行很好的表征，事实证明可以很好地应用在行人检测中。特征11.1HOGHOG 特征的定义HOG 特征算法2-3 由 Dalal 在 2005 年提出。 Dalal 使用了表达能力强的 HOG 特征，由于计算机性能的提高，Dalal 使用了上千维的特征，在 MIT 和 INRIA 行人库中，Dalal 在万分之一的误报率下取得了近 90%的检测率。与 SIFT 特征4 类似，HOG 特征通过提取局部区域的边缘或梯度分布，可很好地表征局部区域内目标的边缘或梯度结构，进而表征目标的形状，对辐射差异和配准误差有较强的

9、稳健性。Dalal 提出的 HOG 特征对于大小为 64128 的训练样本，按照 88 像素的单元（cell）进行划分，这样就形成于人脸检测，但是行人较人脸有很大不同，Haar 特征是基于灰度分布的区域特征，而行人由于不同衣着的影block重叠的 blockcellC1 C2C3 C4Image图 2 样本图像中 block 和 cell 的关系543627180图 3 HOG 梯度方向的划分了 816=128 个 cell，然后再将每相邻的 4 个 cell 划分为l 块（b

10、lock）。采用 Dalal 提出的方法，图 1 为 HOG 特征模板，其中宽（W）与高（H）的比率为 11。 block 的形成是中像素点（x，y）的水平方向梯度、垂直方向梯度的幅值。样本中像素点（x，y）的梯度幅值为G（x，y）= 姨Gx（x，y）2+Gy（x，y）2样本中像素点（x，y）的梯度方向为（3）按照每个 cell 进行滑动生成的，由此原训练样本（64 128）便具有 715=105 个 block 。样本图像中 block 和 cell 之间的关系如图2 所示。（x，y）=arctan

11、（ Gy（x，y））（4）Gx（x，y）然后计算 9 个区间（bink）上各个像素点在分量区间上的幅值WH=11图 1 HOG 特征模板Vk（x，y）= 埸G（x，y），（x，y）bink，1k9（5）0，（x，y）埸bink为了消除光照等影响，进行归一化处理对块中每个单元的区间分量 Vk（x，y）+f（Ci，k）= （x，y）Ci（6） Vk（x，y）+（x，y）B式中：f（Ci，k）表示在某个单元 Ci 中，第 k 个区间的累计强度在 Ci 所属的块 block 中所占的比例，其中 i=1，2，3，4。

12、式（6）中加一个较小的数，避免出现分母为 0 的情况，本文中取=0.001。由式（6）可知每个单元的特征可由 1 个 9 维向量表示，而每个块由 4 个单元组成，从而块的特征可由一个 36 维向量表示。本文的 HOG 特征可以表示为对于划分后的每个 cell，将其中所有像素的梯度方向进行投影，形成每个 cell 各自的梯度方向直方图。这f（Ci，k）|i=1，2，3，4，k=1，2，9分类器的选择（7）里的方向区间（bin）数量设定为 9，如图 3 所示，即每 202一个区间，然后再

13、将每个 block 中的 4 个 cell 的梯度方向直方图数据串联起来，则每个 block 便是一个 36 维的向量。再将所有的 block 依次串联起来，便形成了对每个训练图像的 36105=3 780 维编码5-6。笔者选择的分类器为线性 SVM 分类器 8，线性 SVM分类器运算简单，推广能力好，并且在 Dalal 的工作中已经证明，结合 HOG 特征可以很好地区分人体和非人体。训练过程中，大小为 l 的训练样本集（xi ，yi ），i =1，2，，l由二类别组成，如

14、果 xiRN 属于第 1 类，则标记为正（yi =1），表示为行人，如果属于第 2 类，则标记为负（yi=-1），表示为非行人，训练的目标是构造判别函数将测试的行人相关数据尽可能正确地分类。如果存在分类超平面wx+b=0使得（8）1.2 HOG 特征的计算HOG 特征的计算7过程如下，其中 H（x，y）表示图像在像素点（x，y）处的灰度值。首先计算梯度，采用-1，0，1模板计算每个方向的梯度幅值和方向埸wxi+b-1，yi=1wx +b1，y =1ii，i=1，2，l（9）则称训练集是线性可

15、分的，其中 wx 表示向量 wRN 与 xRN 的内积。对于式（9），可写成如下形式Gx（x，y）=H（x+1，y）-H（x-1，y）Gy（x，y）=H（x，y+1）-H（x，y-1）（1）（2）yi（wx+b）1，i=1，2，l（10）由统计学理论知，如果训练样本集没有被超平面错计算得 Gx （x，y），Gy （x，y），分别表示训练样本图像误分开，并且距超平面最近的样本数据与超平面之间的距C1C2C3C4a 正样本b 负样本图 5 正负样本例图离最大，则该超平面为最优超平面，由此得到判别函数线行人f（x）=

16、sgn（wx+b）（11）其泛化能力最优，其中 sgn （）为符号函数，最优超平面的求解需要最大化 2/w，即最小化 1 w2，进2而可将求最优分类面问题转化为求带有约束条件为不等式的条件极值问题。构造 Lagrange 函数线样本llL（w，b）= 1 w2-iyi（xi w+b）+i，0，2i=1，2，li=1i=1（12）坠坠应满足条件L （w，b）=0，L （w，b）=0，即坠w坠bw=iyixi 和iyi=0。将其代入 Lagrange 函数中，消去w 和 b，经运算得到对偶最优化问题iilllmax W（）=i- 1 ijyi

17、yjxixjj=nwindow？满足iyi=0i=12i=1i，ji0，i=1，2，l，（13）式中：其解是原最优化问题的整体最优解，解出各个最佳*值 i（表示为 i ）后，利用 w =i yixi 确定最优超平面，*ib* 值可由 iyi （wxi+b）-1=0 式中对 i 不为 0 的数据求得，至此分类器的训练算法完毕。对行人进行在线检测时，对于待分类向量 x，选择某l图 4行人检测流程图有野外的、繁华街道的、海边散步的等，由此训练出来的分类器具有较强的通用性。*一特定类型的核函数

18、 K （x，xi ），计算 f （x）=sgnyiii = 1K（xi，x）+b*为+1 或-1，决定 x 属于哪一类。行人目标检测流程行人目标检测的流程如图 4 所示，主要分为 2 部分，包括离线样本训练和在线行人检测，检测过程中对待检测的图像先进行分层处理，根据图像的大小可计算出图像的层数 level，然后按照一定比例进行放缩，在放缩后的多个图像中用一定大小的窗口进行穷举搜索和判别，最后将所有尺度下的检测结果进行融合合并，融合合并后的窗口是单一的，是最终的行人位置窗口。3实验结果笔者选用 INR

19、IA 和 MIT 行人库，其中训练数据包括2 416 张正样本训练图像（大小为 12864），如图 5a 所示，1 218 张没有人的图像作为负样本（大小为 12864），如图 5b 所示。该数据图像集的特点是衣服、姿态、光照和视角等变化大，图像中的人体是在不同的场景中获得的，4在开始检测打开待检测图像计算图像层数 levelFor i=1level离开始训练补齐图像尺寸打开样本图像计算窗口个数 nwindow样本 HOG特征提取For

20、j=1nwindow计算 HOG 特征SVM训练分类器检测N分类器NYi=level？Y行人定位重叠窗口合并End行人窗口图 6 正确的检测结果图 7 漏检结果图 8 虚警结果为了验证准确性，用数码照相机 Sony WX1 采集了一组非连续的图像，与训练样本之间的相关性差，作为测小结研究了智能车辆的一个重要部分：前方行人的检测。通过一个线性的 SVM 分类器与梯度方向直方图（HOG）特征相结合，对一种应用的行人检测算法进行了研究，对

21、单幅图像有很好的检测效果。实验结果表明，该算法性能保持了一定的准确性，对图像中的单一行人检测有较高的正确率。5试集，包括 264 幅图像，其中包含 775 个完整的人体。采集的图像中既有单一的行人，也包括在复杂背景下的多个行人。实验表明，经训练好的分类器可成功检测到 617个人体，漏检 57 个，虚警 158 个，正确检测率达到近80%。采集的图像中，当行人过小，该行人检测会失败，这是由于采集图像的大小远远大于训练样本的大小，故需逐层缩小待检测图像，直至其行数小于 128 或列数

22、小于64，小于该大小的区域不在待检测的考虑范围之内，而且参考文献：1DALAL N, TRIGGS B. Histograms of oriented gradients for humandetectionC/ Proc. IEEE Conference on Computer Vision and PatternRecognition， 2005. Beijing：IEEE Press， 2005：886-893.PORIKLI F. Integral histograms ： a fast way to extract histograms in cartesian space

23、s C/Proc. IEEE Conference on Computer Vision and Pattern Recognition, 2005. San Diego, CA ： IEEE Press, 2005： 829-836.DALAL N. Finding people in images and videos D. France ： the French National Institute for Research in Computer Science and Control，INRIA， 2006.LOWE D G. Distinctive image features f

24、rom scale-invariant keypoints J. International Journal of Computer Vision ， 2004， 60（2）： 91-110. 朱文佳 . 基于机器学习的行人检测关键技术研究 D.上海：上海交通大学，2008.黄茜，顾杰峰，杨文亮. 基于梯度向量直方图的行人检测J.科学技术与工程，2009，9（13）：3646-3651.周柯. 基于 HOG 特征的图像人体检测技术的研究与实现 D.武汉

25、：华中科技大学，2008.李同治，丁晓青，王生进 . 利用级联 SVM 的人体检测方法 J. 中国图象图形学报，2008，13（3）：566-570.笕在车辆行驶中行人在图像中会越来越明显，检测的几率会逐渐增高。图 6 为正确的检测结果，图 7 为一些漏检的情况，图 8 则为虚警的情况，背景比较复杂或者和行人比较接近的时候，将背景的部分区域也检测为行人。2345678作者简介：倪恺（1981- ），硕士生，主要研究方向为图像处理与模式识别；肖志涛

26、（1971- ），教授，主研图像处理与模式识别、机器视觉、智能信号处理等；张芳（1981- ），讲师，主研光电图像处理与模式识别。责任编辑：丁雪收稿日期：2010-10-27笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕笕（上接第 95 页）image processingJ. International Jou

27、rnal of Computer Vision，1997，23（1）：48-57.ZHANG Zhengyou. A flexible new technique for camera calib - ration J . IEEE Transactions on Pattern Analysis and Machine Intelligence，2000，22（11）：1330-1334.Vaibhav Vaish. Light field camera calibration EB/OL. 2010 -05 -07. http：/graphics.stanford.edu/vaibhav/

28、projects/lfca_calib/#design. Vaibhav Vaish . The stanford calibration grid detector EB / OL .2010-01-06. http：/graphics.stanford.edu/software/findgrid/.笕作者简介：傅瀛，硕士，主研信号与信息处理；王永芳，女，博士，副教授，主研视频编码及三维视觉；廖小僮，女，硕士，主研信号与信息处理；张兆阳，博士，教授，主研视频编码及

29、三维视觉。56责任编辑：闫雯雯收稿日期：2010-05-257file:/D|/我的资料/Desktop/新建文本文档.txtAppliance Error (configuration_error)Your request could not be processed because of a configuration error: Could not connect to LDAP server.For assistance, contact your network support team.file:/D|/我的资料/Desktop/新建文本文档.txt2012-07-12 20:42:52

展开阅读全文