《基于SIFT和Hough变换的人脸识别.doc》由会员分享,可在线阅读,更多相关《基于SIFT和Hough变换的人脸识别.doc(3页珍藏版)》请在三一办公上搜索。
1、2012 年 7 月July 2012计算机工程Computer Engineering第 38 卷第 14 期Vol.38No.14人工智能及识别技术文献标识码:A文章编号:10003428(2012)14014403中图分类号:TP391SIFTHough基于和变换的人脸识别叶汉能 1,姚茂群 1,赵武锋 2(1. 杭州师范大学信息科学与工程学院,杭州 310036;2. 浙江大学信息与电子工程学系,杭州 310027)摘 要:针对光照、表情、遮挡、几何变化等情况下的人脸识别问题,提出一种基于尺度不变特征变换(SIFT)和增强 Hough 变换的人脸识别方法。利用 SIFT 的位置、尺度、
2、方向和描述符 4 个信息,通过增强 Hough 变换消除错配,将候选匹配点和离散点距离进行加权累计获 得高辨别力的匹配分。在 AR 人脸数据库上的测试结果表明,在只选取每人 1 幅图像作为模板的情况下,能够获得近 99.6%的识别率。 关键词:尺度不变特征变换;Hough 变换;人脸识别;特征提取;匹配策略Face Recognition Based on SIFT and Hough TransformYE Han-neng1, YAO Mao-qun1, ZHAO Wu-feng2(1. College of Information Science and Engineering, Han
3、gzhou Normal University, Hangzhou 310036, China;2. Department of Information Science & Electronic Engineering, Zhejiang University, Hangzhou 310027, China)【Abstract】Aiming at the difficulties of face recognition such as change in illumination, expression variation, partial occlusion and geometricalt
4、ransformation, a face recognition method based on Scale-invariant Feature Transform(SIFT) and enhanced Hough transform is proposed. By using four parts of SIFT features and the enhanced Hough transform, the false matches are removed effectively, and the score having high discriminationability is obt
5、ained through weighting more information. Experimental results performed on the AR face database demonstrate that about 99.6% ofrecognition rates are achieved under selecting only one image per person as template.【Key words】Scale-invariant Feature Transform(SIFT); Hough transform; face recognition;
6、feature extraction; matching strategyDOI: 10.3969/j.issn.1000-3428.2012.14.043D(x, y,s ) = L(x, y, ks ) - L( x, y,s )(2)1概述人脸识别在过去几十年中受到了各领域的广泛重视,如 生物识别技术、视频检索和接入控制。但受光照、表情、姿 势等因素影响,人脸识别技术依旧具有极大的挑战。有效标征人脸是人脸识别过程中很重要一个环节,主要然后在 DoG 金字塔中进行极值检测,以初步确定候选关键点的位置和所在尺度。(2)关键点的精确定位。通过拟合三维二次函数以精确确 定候选关键点的位置和尺度,
7、同时去除低对比度的关键点和 不稳定的边缘响应点。(3)关键点方向确定。利用关键点邻域像素梯度方向分布 特性为关键点指定方向参数,使算子具备旋转不变性。(4)关键点描述矢量生成。首先将坐标轴旋转为关键点的方向,确保旋转不变性。在以关键点为中心的 44 小块上计 算 8 个方向的梯度方向直方图,小块内每个像素梯度幅值经1.5 倍关键点所在尺度加权累计构成每个梯度方向值,这样 对于一个关键点就可以产生 448=128 个数据,然后归一化 (降低光照影响),最终形成 128 维的 SIFT 特征向量。根据上述步骤获得的人脸 SIFT 特征见图 1、图 2。方法有:主成份分析法 (Principal C
8、omponentPCA)1 ,线性判别式分析法 (Linear DiscriminantAnalysis,Analysis,LDA)1,局部二值模式法(Local Binary Patterns, LBP)2及弹性束图匹配3。由于实际应用场合条件比较苛刻,如人脸的 遮挡、非刚性人脸的变形,因此严重阻碍了这些方法性能的 提高。尺度不变特征变换(Scale-invariant Feature Transform, SIFT) 算法4 因在刚性目标识别应用中的优异性能成为国内 外特征点匹配研究的热点,但用于非刚性目标如人脸识别的 研究不多。文献5-6利用 SIFT 特征匹配算法对非刚性目标人脸进行了
9、研究,但没有考虑错配影响,且须人脸位置对齐。本文提出一种基于 SIFT 和增强 Hough 变换的人脸识别 方法通过消除错配影响,增强算法的鲁棒性。2 尺度不变特征变换SIFT 是基于尺度空间的特征提取方法。SIFT 特征对图像尺度、旋转及平移具有不变性,甚至对仿射失真、视角变 化、亮度变化和噪声也保持一定程度的稳定性。SIFT 特征包 含 4 个成分的信息:位置(坐标值),尺度,方向及 128 维邻 域描述矢量。SIFT 特征提取主要包括 4 个阶段。(1)尺度空间极值检测。 以 k 倍变化率按式(1)对图像进 行叠代高斯卷积,建立宽尺度范围高斯金字塔。图 1 模板人脸的 SIFT 特征作者
10、简介:叶汉能(1986),男,硕士研究生,主研方向:图像识别,L( x, y,s ) = G(x, y,s ) * I ( x, y)根据式(2)建立 DoG(Difference of Gaussian)金字塔。(1)智能控制;姚茂群,教授、博士;赵武锋,讲师、博士收稿日期:2011-09-05E-mail:yehanneng第 38 卷 第 14 期叶汉能,姚茂群,赵武锋:基于 SIFT 和 Hough 变换的人脸识别145由式(3) 结果可得旋转角度 q = arctg(m2 / m1 ) 、尺度比例s = m1 / cos(q ) 、x 轴平移 tx 和 y 轴平移 t y 。将上述
11、4 个参数作为 Hough 变换的参数空间,并按 spacing _ q 、 spacing _ s 、 spacing _ t 间隔离散参数空间,以 最近有效机制将所有候选匹配点对与参数空间离散点距离进 行加权累计,投入最大峰值的点对即为正确匹配点对。图 4 是对候选点对搜索后的匹配效果。图 2 夸大表情人脸的 SIFT 特征3匹配策略好的匹配算法不仅能从众多的特征库中搜索匹配点对,而且还能有效去除错配。基于此,本文提出如下匹配策略。3.1 匹配模板库的构建每个个体选择一幅或多幅典型人脸灰度图像,提取出图 4 错配去除后的 SIFT 特征匹配效果3.4 匹配分计算假设匹配点对与相邻 Houg
12、h 变换参数空间离散点的位移 权值为 trans _ wght ,旋转权值为 rot _ wght ,描述符向量距离权值为 dist _ wght ,则匹配分 score 为:Nscore = trans _ wght j * rot _ wght j *dist _ wght jj =1以上权值都归一化为 01,N 为正确匹配点对数目。4实验步骤和结果表情、光照、遮挡等因素对人脸识别率的影响很大,为了评测本文方法对上述影响因素的鲁棒性,选择 AR 人脸库 第一阶段的 75 人,共 975 幅图像做测试7。所用 PC 配置为 AMD 双核,主频 2.71 GHz,内存 1.75 GB,软件为
13、Matlab。 实现过程如下:将图像进行简单的归一化,按第 2 节的 方法提取 SIFT 特征集,每人第 1 幅图像的特征集共 75 个作 模 板库, 其余 900 幅 图 像 用于测 试;取 threshold =0.8 、 spacing _ q =/4、 spacing _ s =4、 spacing _ t =1.5 倍的图像最大尺寸,按第 3 节的方法计算匹配分 score 。图 5图 8 为第 33 人 4 幅特别图像(一般、表情、光照、tempSIFT 特征集。剔除相同特征后获得综合特征集 Ktemp = f1 ,f2 ,L, fn ,其中,temp 为模板类别编号;n 为特征点
14、个temptemp数,各特征包含位置、尺度、方向和描述符 4 个信息,即temptemp , temp temp tempfi = f pi fsi, foi , fdi 。模板库由大量个体 SIFT 综合特征集构建。3.2 候选匹配点对确定 匹配点对搜索采用文献4介绍的基于 SIFT 描述符的最近邻欧 氏距 离 搜索策 略 。 假设测试 图像 特 征集为 Ktest =test testtest f1 , f2 ,L, fn ,确定测试特征集中任一特征与模板库中个体特征集 Ktemp 的某一特征匹配,方法如下:(1) 利用描述符矢量计算测试集特征与模板库中个体特征集的所有特征的欧氏距离: D
15、 = d ( f test , K) ,其中,k 为Kdktemp测试集编号; d () 为欧氏距离计算函数。(2)取最小值 first(Dk ) 和次最小值 second (Dk ) 。(3)若 first (Dk ) / second (Dk ) threshold ,则认为匹配,将2 个特征的索引放入匹配点对数组中,否则继续。 错配去除前的匹配效果如图 3 所示。遮挡)匹配分 score 的分布图。子图中上面的人脸图像为模板。图 3 错配去除前的 SIFT 特征匹配效果3.3 错配去除在获得匹配点对后,利用位置、尺度和方向 3 个信息,经Hough 变换去除错配。假定伸缩系数各向同性,特
16、征对 ( fl , fm ) 的位置信 息 x, y T 、 u, vT 之间的仿射变换公式为: m1 图 5 一般条件下的匹配分0 m2 = u x- yx10(3) 1 tx yv t y 其中, m1 、 m2 表示旋转和伸缩; tx 、 t y 表示平移。考虑到SIFT 特征的 另 2 个信 息 即尺度 和方 向 ,另一 位置 点 对 x , y T 、 u , v T 可通过下式获得: x , y T = x, yT + 10 f *cos( f)T)sin( fslololu , v T = u, vT + 10 f *cos( f)T)sin( f图 6 夸大表情条件下的匹配分s
17、momom146计算机 工 程2012 年 7 月 20 日图 10 阈值为匹配分比率的错误识别率和不可识别率文献8 罗列了部分算法的测试结果,大部分识别率在97%以下。本文识别方法在相近的验证条件下,获得了最高 达 99.6%的识别率。由此可见,该方法对光照、表情等影响 具有更高的鲁棒性。5 结束语本文提出了 SIFT 和 Hough 变换相结合的人脸识别方法。利用 SIFT 对仿射变化的鲁棒性提取稳定的特征集来表征人 脸图像,采用 Hough 变换匹配策略获取有效的匹配点对,同时考虑到人脸图像是非刚性的,且会受到各种变化影响,在 计算匹配分时充分利用了位置、方向、正确匹配点对数目和 描述符
18、向量距离信息。在 AR 人脸库上的测试结果表明识别 率为 99.6%。若已知测试图像位移和尺度变化范围,通过约 束 Hough 变换参数空间离散范围,性能可进一步提高。由于 人脸图像变化对正确匹配点对数目影响很大,因此下一步将改进 SIFT 算法以适应这些非刚性特点。参考文献图 7 光照变化条件下的匹配分图 8 遮挡条件下的匹配分图 5 和图 6 显示在一般和夸大表情的情况下同一人的图 像与模板图像的匹配分接近 60,而不同人图像与模板图像的 匹配分小于 5。图 7 和图 8 显示在光照变化和遮挡的情况下 虽然最高匹配分低于前 2 种情况,但与不同人图像的匹配分 相比,同一个人图像的匹配分仍高
19、出很多,接近 30。由于人脸图像是非刚性的,正确匹配点对数目受各种变 化影响,而匹配分的高低直接受正确匹配点对数目影响,为 减少误判,下面以 3 种判定原则对人脸识别率作了测试:(1)最高原则。将测试图像判定为具有最高匹配分所属的 类别,识别情况为:正确识别数 896,错误识别数 4,识别率为 99%。(2)匹配分大于阈值最高原则。将测试图像判定为具有最 高匹配分且大于阈值所属的类别,结果如图 9 所示。1Belhumeur P N, Hespanha J P, Kriegman D J. Eigenfaces vs.Fisherfaces: Recognition Using Class S
20、pecific Linear Projec- tionJ. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19(7): 711-720.Ahonen T, Hadid A, Pietikainen M. Face Recognition with Local Binary PatternsC/Proc. of the 8th European Conference on Computer Vision. Prague, Czech Republic: s. n., 2004.Wiskott L, Fe
21、llous J M, Kruger N, et al. Face Recognition by Elastic Bunch Graph MatchingJ. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19(7): 775-779.纪 华, 吴元昊, 孙宏海, 等. 结合全局信息的 SIFT 特征匹 配算法J. 光学精密工程, 2009, 17(2): 439-444.Luo Jun, Ma Yong, Takikawa E, et al. Person-specific SIFT Features
22、 for Face RecognitionC/Proc. of IEEE International Conference on Acoustics, Speech, and Signal Processing. Hawaii, USA: IEEE Press, 2007.Parua S, Das A, Mazumdar D, et al. Determination of Feature Hierarchy from Gabor & SIFT Features for Face Recogni- tionC/Proc. of the 2nd International Conference
23、on Emerging Applications of Information Technology. Kolkata, India: s. n.,2011.张奇志, 周亚丽. 基于 SIFT 特征的单训练样本人脸识别J.北京信息科技大学学报: 自然科学版, 2011, (4): 35-38.Tan Xiaoyan, Chen Songcan, Zhou Zhihua, et al. Face Recognition from a Single Image per Person: A SurveyJ. Pattern Recognition, 2006, 39(9): 1725-1745.编辑
24、 张正兴23456图 9 阈值为匹配分的错误识别率和不可识别率(3)比率大于阈值最高原则。将测试图像判定为具有最高 匹配分且前 2 个最高分比值大于阈值所属的类别,结果如 图 10 所示,其中,匹配分比率指 2 个最高匹配分相除得到 的比例。可以看出,本文方法尽管只选取每人 1 幅图像作为 模板,在测试图像包含光照、表情、遮挡多种变化情况下, 按原则(1)获得了 99.6%的识别率,且不需要统计方法中的人 脸位置对齐和训练过程。若允许有不能识别状态,按原则(3) 性能更优,在错误识别率为 0 时,不可识别率不到 1%,正 确识别率超过 99%,按原则(2)只能获得 98.8%的正确率。78识别率/(%)