《毕业设计(论文)人脸面部识别系统设计.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)人脸面部识别系统设计.doc(39页珍藏版)》请在三一办公上搜索。
1、1 引 言1.1课题的背景随着安全入口控制和金融贸易方面应用需要的快速增长,生物统计识别技术得到了新的重视。目前,微电子和视觉系统方面取得的新进展,使该领域中高性能自动识别技术的实现代价降低到了可以接受的程度。而面部识别是所有的生物识别方法中应用最广泛的技术之一,面部识别技术是一项近年来兴起的,但不大为人所知的新技术。人们更多的是在电影中看到这种技术的神奇应用:警察将偷拍到的嫌疑犯的脸部照片,输入到电脑中,与警方数据库中的资料进行比对,并找出该嫌疑犯的详细资料和犯罪记录。这并非虚构的情节。在国外,面部识别技术早已被大量使用在国家重要部门以及军警等安防部门。在国内,对于面部识别技术的研究始于上世
2、纪90年代,目前主要应用在公安、金融、网络安全、物业管理以及考勤等区域。1.2相关领域研究历史与现状现在人脸识别技术已经应用在许多领域中,并起到了举足轻重的作用,人脸识别研究开始于1966年PRI的Bledsoe的工作,经过三十多年的发展,人脸识别技术取得了长足的进步, 现在就国内外相关领域研究历史与现状来进行展述。(1)国外研究历史与现状面部识别研究开始于1966年PRI的Bledsoe的工作,1990年日本研制的人像识别机,可在1秒钟内中从3500人中识别到你要找的人。1993年,美国国防部高级研究项目署 (Advanced Research Projects Agency)和美国陆军研究
3、实验室(Army Research Laboratory)成立了Feret(Face Recognition Technology) 项目组,建立了feret 人脸数据库,用于评价人脸识别算法的性能。美国陆军实验室也是利用vc+开发,通过软件实现的,并且FAR为49%。在美国的进行的公开测试中,FAR,为53%。美国国防部高级研究项目署,利用半自动和全自动算法。这种算法需要人工或自动指出图像中人的两眼的中心坐标,然后进行识别。在机场开展的测试中,系统发出的错误警报太多,国外的一些高校(卡内基梅隆大学(Carnegie Mellon University)为首,麻省理工大学(Massachuse
4、tts Institute of Technology )等,英国的雷丁大学(University of Reading)和公司(Visionics 公司Facelt 人脸识别系统、Viiage 的FaceFINDER 身份验证系统、Lau Tech 公司Hunter系统、德国的BioID 系统等)的工程研究工作也主要放在公安、刑事方面,在考试验证系统的实现方面深入研究并不多7。(2)国内研究历史与现状人脸识别系统现在在大多数领域中起到举足轻重的作用,尤其是用在机关单位的安全和考勤、网络安全、银行、海关边检、物业管理、军队安全、智能身份证、智能门禁、司机驾照验证、计算机登录系统。我国在这方面也
5、取得了较好的成就,国家863项目“面像检测与识别核心技术”通过成果鉴定并初步应用,就标志着我国在人脸识别这一当今热点科研领域掌握了一定的核心技术。北京科瑞奇技术开发股份有限公司在2002年开发了一种人脸鉴别系统,对人脸图像进行处理,消除了照相机的影响,再对图像进行特征提取和识别。这对于人脸鉴别特别有价值,因为人脸鉴别通常使用正面照,要鉴别的人脸图像是不同时期拍摄的,使用的照相机不一样。系统可以接受时间间隔较长的照片,并能达到较高的识别率,在计算机中库藏2300人的正面照片,每人一张照片,使用相距1-7年、差别比较大的照片去查询,首选率可以达到50%,前20张输出照片中包含有与输入照片为同一人的
6、照片的概率可达70% 。2005年1月18日,由清华大学电子系人脸识别课题组负责人苏光大教授主持承担的国家十五攻关项目人脸识别系统通过了由公安部主持的专家鉴定。鉴定委员会认为,该项技术处于国内领先水平和国际先进水平6。1.3面部识别的研究意义随着经济社会的日趋发展,快速有效的自动身份识别的要求日益迫切,这使得面部识别技术的发展变得越来越重要。然而,面部识别技术由于其具有复杂、难度大且起步晚的特点,当前发展还不是很成熟,这极大地限制了它的应用。面部识别是机器视觉和模式识别领域最富有挑战性的课题之一,同时也具有较为广泛的应用意义。面部识别技术是一个非常活跃的研究领域,它覆盖了数字图像处理、模式识别
7、、计算机视觉、神经网络、心理学、生理学、数学等诸多学科的内容。如今,虽然在这方面的研究已取得了一些可喜的成果,但是面部的检测与定位在实际应用中仍面临着很严峻的问题,因为人脸五官的分布是非常相似的,而且人脸本身又是一个柔性物体,表情、姿态或发型、化妆的千变万化都给正确识别带来了相当大的麻烦。如何能正确识别大量的人脸并满足实时性要求是迫切需要解决的问题。1.4已有面部检测方法综述面部检测有很多方法,下面从方法论的角度概要性地总结一下现有的几种主要面部检测思想。(1) 基于知识的自顶向下的方法这种方法是基于我们在认识人脸的过程中所总结出来的一些先验知识,把它们归结成为一些复杂程度由简而繁的规则。例如
8、:“正面人脸都包括两只位置相互对称的眼睛”、“灰度图像中眼睛要比脸上其他地方暗”等。找到一系列规则后,把它们应用到输入图像中,搜索出符合规律的人脸区域。(2) 基于人脸特征的自底向上的方法这种思想首先用各种数字图像的处理办法对输入图像进行处理,根据处理结果提取出来的某些特征与人脸的某些共性特征进行比较,借此来判断某一区域是否为人脸。举例来说,我们可以用数字图像处理中常用的提取边界的方法在输入图像中寻找边界,然后试探哪些边界能像正面人脸的左边线、右边线和发髻线那样构成人脸的轮廓;还可以利用从图像中提取出来的色彩和纹理信息与人脸的色彩和纹理模型进行比较,得出可能的人脸区域。当然各种人脸特征的综合运
9、用对于提高检测算法的性能会有很大帮助。(3) 模板匹配的方法首先,建立并存储一些人脸模板作为标准,可以包括正面人脸或是单独的眼睛、鼻子、嘴等。利用一些算法来计算各待测区域与标准模板的相似程度或称相关性,利用这一相似程度来判决某一区域是否为人脸。(4) 基于人脸外观的方法这种思想是指通过搜集大量的人脸和非人脸样本作为训练集,用人工神经元网络、支持向量机(SVM)等方法训练出一个分类器来检测人脸。这种思想和其他思想的不同之处在于,他并不首先人工的对人脸进行分析或是抽取模板,也不对输入图像进行复杂的处理,而是利用大量的人脸整体外观用结构化的方法来训练出人脸检测的分类器。在这一类方法中,特征向量、统计
10、学、信息学等思想也得到了运用。上述各种方法都存在着自身的优缺点和适用领域,很多学者在各自所面临的问题的范围内不断探索,也发明了许多卓有成效的检测算法。但各种检测算法都存在着效率与性能上的矛盾,即在正确率、鲁棒性能等方面更好的算法往往会花费更多的时间及系统消耗3。1.5本论文目的本论文主要对该人脸识别系统进行模块划分,并介绍各模块的功能,重点介绍图像预处理模块,对其内的子模块的功能和算法进行详细讲述,主要介绍光线补偿、二值化、直方图,通过以上处理能够成功标记出人脸区域,图像预处理模块在整个系统中起着极其关键的作用,图像处理的好坏直接影响着后面的定位和识别工作,最后介绍人脸特征标记与定位的方法。2
11、 系统分析2.1 需求分析2.1.1需求分析概述随着经济社会的日趋发展,快速有效的自动身份识别的要求日益迫切,这使得面部识别技术的发展变得越来越重要。其在安全验证系统、信用卡验证、医学、档案管理、视频会议、人机交互、系统公安(犯罪识别等)等方面有着巨大的应用前景,因此,面部识别技术越来越成为当前模式识别和人工智能领域的一个研究热点。然而,面部识别技术由于其具有复杂、难度大且起步晚的特点,当前发展还不是很成熟,这极大地限制了它的应用。2.1.2可行性分析面部识别系统现在在大多数领域中起到举足轻重的作用,尤其是用在机关单位的安全和考勤、网络安全、银行、海关边检、物业管理、军队安全、智能身份证、智能
12、门禁、司机驾照验证、计算机登录系统。人脸识别系统现在应用于许多领域中,但是人脸识别技术也是一项近年来兴起的,且不大为人所知的新技术。在我国以及其他国家都有大量的学者正在研究之中,不断的更新人脸识别技术,以便系统的识别准确率达到新的高度。日后的应用前景十分广阔。2.1.3技术分析图像的处理方法很多,我们可以根据需要,有选择地使用各种方法。在确定脸部区域上,通常使用的方法有肤色提取。肤色提取,则对脸部区域的获取则比较准确,成功率达到95%以上,并且速度快,减少很多工作。图像的亮度变化:由于图像的亮度在不同环境的当中,必然受到不同光线的影响,图像就变得太暗或太亮,我们就要对它的亮度进行调整,主要采取
13、的措施是对图像进行光线补偿。去噪声处理:在图像的采集过程中,由于各种因素的影响,图像中往往会出现一些不规则的随机噪声,如数据在传输、存储时发生的数据丢失和损坏等,这些都会影响图像的质量,因此需要将图片进行消除噪声处理。人脸分割:经过光线补偿和消除噪声处理后对图像进行提取边界处理,确定出人脸的位置。特征标注:特征标注在人脸识别、验证和建模中都具有重要意义,因为眼睛、鼻子和嘴巴等特征集中了人脸的大部分信息。对于人脸建模来说,不仅要检测出这些特征,而且要准确地加以定位。2.2 开发运行环境2.2.1开发环境(1)硬件环境硬件配置原则:具有可靠性,可用性和安全性,具有完善的技术支持。能够满足个人学习和
14、设计需要。运行软件所需硬件资源:CPU:800M以上;内存:128M以上。(2)软件环境系统软件配置原则:能够满足该软件的可靠性,可用性和安全性的要求。系统软件配置方案:配置有持续工作能力、高稳定性、高度可集成的开放是标准的操作系统。配备符合ANSI/ISO标准的高级程序设计语言处理软件。如:Visual C+6.0。熟悉C+高级程序设计语言。2.2.2安装运行环境CPU要求:500M及以上内存:64M以上操作系统:Windows系列操作系统支持软件:Microsoft Visual Studio2.3 开发工具选择本次设计所用的开发工具是Microsoft Visual C+ 6.0。 Vi
15、sual C+ 6.0是Microsoft公司推出的一种可视化编程工具。它支持多平台和交叉平台的开发,将各种编程工具如编辑器、连接器、调试器等巧妙的结合在一起,构成一个完美的可视化开发环境。用户无需通过繁杂的编程操作,即可完成Windows下应用程序的编辑、编译、测试和细化等工作。3系统总体设计3.1 系统规划本系统主要研究的对象是图像,系统应该对图像进行光线补偿、二值化、直方图、标记特征区域等,每个小模块的实现都有许多相应的算法。下面将本系统采用的算法进行介绍:光线补偿 :由于光线原因,所照的图像可能会存在光线不平衡的情况而造成色彩偏差,为了抵消这种整个图像中存在的色彩偏差,本系统采用的解决
16、方法是:将整个图像中的所有像素的亮度从高到低进行排列,取最亮的像素,然后线性放大,使这些像素的平均亮度达到255。实际上就是调整图片像素的RGB值,然后将其他像素点按照这个比例依次调整。消除噪声处理:在图像的采集过程中,由于各种因素的影响,图像中往往会出现一些不规则的随机噪声,如数据在传输、存储时发生的数据丢失和损坏等,这些都会影响图像的质量,因此需要将图片进行消除噪声处理。本系统采用一种滤波方法莱消除噪声。二值化:经过光线补偿和消除噪声处理的图像,通过公式计算,是人脸区域的标记为1,不是人脸区域的标记为0,使图像的脸部区域标记出来。直方图:使用该模块的目的是直观的显示肤色像素点在灰度级中所占
17、比例的关系。标记特征区域:确定人脸的位置之后,首先根据脸部上灰度级较大的区域,及先验知识确定眼睛的位置,再根据眼睛的位置利用几何方法确定出鼻子和嘴的位置。3.2 系统流程分析用户使用这款软件时,要按照一定的流程来进行操作。首先要打开一张BMP格式的图片,其中应该包括人的脸部,打开图片之后可以选择两种标记人脸的方法,第一种方法要对图片进行相似度计算目的是为了光线补偿,之后是二值化,这时可以看图像的水平直方图和垂直直方图,成功标记出人脸区域。另一种方法是对图像进行皮肤区域和头发区域进行分析,可以查看脸的直方图和头发的直方图,成功标记出人脸区域。在标记出人脸区域之后,可以开始特征标注,首先是边缘提取
18、,然后确定眼睛的位置,在根据眼睛的位置标记出鼻子和嘴巴的位置,标记结束程序也就运行结束。这样的流程决定了程序所应具有的功能,程序功能流程,如图3-1所示: 面部检测与定位系统打开图像退出程序人脸区域检测基于相似度的方法相似度计算水平直方图基于皮肤区域、头发区域的方法二值化垂直直方图标出人脸和头发区域脸的直方图标记人脸区域头发直方图特征标注边缘提取标记眼睛标记嘴巴标记鼻子图3-1 系统流程图3.3 系统总体设计原则(1)开放性、可扩充性、可靠性原则开放系统是生产各种计算机产品普遍遵循的原则,遵循这种标准的产品都符合一些公共的、可以相互操作的标准,能够融洽的在一起工作。开放系统使得各种类型的系统互
19、连简单、标准统一,容易扩展升级。从而适应广大用户需求的多变性和产品的更新换代。(2)良好的用户操作界面用户操作界面美观、方便、实用,使用户能在较短的时间内掌握其使用方法。(3)实用性原则任何系统的设计都要考虑其实用性,系统开发的目的是为了实现业务处理自动化、规范化,提高工作效率,减轻工作人员的劳动强度,减少开支。(4)工作平台设计原则能适应不同的操作平台。(5)先进、成熟技术性原则采用较为先进的技术力量,保证应用程序在技术上具备一定的优势。采用成熟的技术,保证应用程序的安全性和可靠性。(6)节省资源原则应用程序充分利用现有的资源,尽量减少不必要的再投资。(7)代码可读性原则编写的代码必须严谨易
20、读,代码的解释必须清楚明白,为应用程序的再开发提供应尽的责任。3.4 各模块功能概述下面介绍系统中的各模块的功能及算法:3.4.1 人脸区域获取该系统中图像里人脸区域的获取,主要是根据肤色来进行获取,通过肤色非线性分段色彩变换来实现。这一非线性分段色彩变换得到的肤色模型属于色彩空间中的聚类模型,这一类肤色模型的建立首先要选取一种合适的色彩空间。图像预处理就是对获取得来的图像进行适当的处理,使它具有的特征能够在图像中明显的表现出来。该模块中的子模块有如下4个,下面对它们进行概述:(1)光线补偿因为系统得到的图片可能会存在光线不平衡的情况,这会影响我们对特征的提取,同时系统中要用到YCrCB色彩空
21、间,所以有必要对图像进行光线补偿。尽可能将它的特征在图像中表现出来。YCrCB是一种色彩空间,它用于视频系统中,在该色彩空间中,Y分量表示像素的亮度,Cr表示红色分量,Cb表示蓝色分量,通常把Cr和Cb称为色度。YCrCB色彩空间是以演播室质量标准为目标的CC601编码方案中采用的彩色表示模型。(2)消除噪声处理以每一个肤色像素点为中心的5*5邻域内统计肤色像素点的个数,超过半数时中心点保留为肤色,否则认为是非肤色。(3)二值化一幅图像包括目标物体、背景还有噪声,要想从多值数字图像中直接提取出目标物体,最常用的方法就是设定一个阈值T,用T将图像的数据分成两部分:大于T的像素群和小于T的像素群。
22、这是研究灰度变换的最特殊的方法,称为图像的二值化(BINARIZATION)。图像的二值化,就是将图像上的像素点的灰度值设置为0或255,大于T的像素群设为255,小于T的像素群设为0,可以用一个比特表示一个像素,“1”表示黑色,“0”表示白色,当然也可以倒过来表示,这种图像称之为二值图像。这便有利于我们对特征的提取。该设计中采用组内方差和组外方差来实现二值化。也就是将整个图像呈现出明显的只有黑和白的视觉效果。以便于分析理解和识别并减少计算量。这有利于我们对特征的提取。(4)直方图直方图均衡化是图像处理领域中利用图像直方图对对比度进行调整的方法。这种方法通常用来增加许多图像的局部对比度,尤其是
23、当图像的有用数据的对比度相当接近的时候。通过这种方法,亮度可以更好地在直方图上分布。这样就可以用于增强局部的对比度而不影响整体的对比度,直方图均衡化通过有效地扩展常用的亮度来实现这种功能。直方图均衡化的目的是使一输入图像转换为在每一灰度级上都有相同的象素点数,它的处理的中心思想是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布,它的研究思路是:通过直方图变换式来进行直方图的均衡处理,直方图变换式是(3-1)但是直方图均衡化存在着两个缺点:1)变换后图像的灰度级减少,某些细节消失;2)某些图像,如直方图有高峰,经处理后对比度不自然的过分增强3。3.4.2 特征定位与提
24、取模块人脸定位是将典型的脸部特征(如眼睛,鼻尖,嘴唇等等)标记出来,在本系统中,定位的特征是眼睛,鼻尖和嘴巴三个。由于眼睛具有对称性,因此可以很快就能标记出来,而鼻子是在眼睛下面,且嘴巴在鼻子下面,所以只要眼睛标记好,鼻子和嘴巴也能相应的标记出来。特征提取按以下4个步骤进行:(1)提取两只眼睛的距离(2)眼睛的倾角度(3)眼睛、嘴巴的重心(4)用三个十字星标出每一个特征4系统详细设计该软件最主要的功能就是要能识别出人脸,首先该系统需要对一个BMP人脸图片进行一系列处理才可进行下一步的工作,该处理过程也称图像预处理。预处理这个模块在整个面部识别系统的开发过程中占有很重要的地位,只有预处理模块做得
25、好,才可能很好地完成后面的人脸定位和特征提取这两大关键模块。因此本设计中所要完成的主要功能如下所述:(1) 图像获取功能该模块主要是从图片库中获取图片,获取后的图片可以在软件的界面中显示出来,以便进行识别。(2) 图像预处理功能该模块主要包括图像相似度计算、二值化、标记皮肤区域和头发区域、直方图变换等。(3) 人脸定位功能该模块主要是将处理后的人脸图片进行定位,将眼睛、鼻子、嘴巴标记出来。4.1 基于肤色的人脸检测算法4.1.1 色彩空间与色彩空间的聚类根据计算及色彩理论,对一种颜色而言,在计算机中有不同的表达方式,这样就形成了各种不同的色彩空间。当然各种色彩空间只不过是色彩在计算机内不同的表
26、达形式而已,每一种色彩空间也都有其各自的产生背景、应用领域等。主要的色彩空间有以下几种:(1)RGB格式(红、绿、蓝三基色模型)由于彩色图像是多光谱图像的一种特殊情况,对应于人类是觉的三基色即红、绿、蓝3个波段,是对人眼的光谱量化性质的近似。因此利用R、G、B三基色这3个分量来表征颜色是很自然的一种格式。而且多数的图像采集设备都是以CCD技术为核心,直接感知色彩的R、G、B这3个分量,这也使得三基色模型成为图像成像、显示、打印等设备的基础,具有十分重要的作用。(2)HIS格式(色度、饱和度、亮度模型)这种格式反应了人类观察色彩的方式,同时也有利于图像处理。在对色彩信息的利用中,这种格式的优点在
27、于它将亮度(I)与反应色彩本质的特性的两个参数色度(H)和饱和度(S)分开。在提取一类物体(比如现在研究的人脸)在色彩方面的特性时,经常需要了解其在某一色彩空间的聚类特性,而这一聚类特性往往体现在色彩的本质特性上,且经常受到光照明暗等条件的干扰影响。光照明暗给物体颜色带来的直接影响就是亮度分量,若能将亮度分量从色彩中提取出来,而只用反应色彩本质特性的色度、饱和度来进行聚类分析,会获得比较好的效果。这也正是HIS格式在色彩图像处理和计算机视觉的研究中经常被使用的原因。(3)YCbCr(YUV)格式这种色彩空间是以演播室质量标准为目标的CCIR601编码方案中采用的彩色标识模型,被广泛的应用在电视
28、的色彩显示等领域中。它同样具有HIS格式中将亮度分量分离的优点,但由于他可以从RGB格式线性变化得到,所以直接应用于物体色彩聚类分析的情况不多,相比之下,在其基础上的变换模型的应用更为普遍。在人脸检测中也常常用到YCrCb空间,因为一般的图像都是基于RGB空间的,在RGB空间里人脸的肤色受亮度影响相当大,所以肤色点很难从非肤色点中分离出来,也就是说在此空间经过处理后,肤色点是离散的点,中间嵌有很多非肤色,这为肤色区域标定(人脸标定、眼睛等)带来了难题。如果把RGB转为YCrCb空间的话,可以忽略Y(亮度)的影响,因为该空间受亮度影响很小,肤色会产生很好的类聚。这样就把三维的空间变为二维的CrC
29、b,肤色点会形成一定得形状,如:人脸的话会看到一个人脸的区域,手臂的话会看到一条手臂的形态,对处理模式识别很有好处,根据经验某点的CrCb值满足:133Cr173,77Cb127 那么该点被认为是肤色点,其他的就为非肤色点。4.1.2 肤色模型(1)光线补偿(Lighting Compensation)处理光线补偿想法的提出主要是考虑到肤色等色彩信息经常受到光源颜色、图像采集设备的色彩偏差等因素的影响,在整体上偏离本质色彩而向某一方向移动,即我们通常所说的色彩偏冷、偏暖,照片偏黄、偏蓝等。这种现象在艺术照片中更为常见。针对实际图像中光照过亮、过暗等情况,提出了一种光线补偿方法。通过将图像亮度灰
30、度范围内的两端区域进行压缩,降低过亮和过暗区域的对比度;再用对数函数做非线性变换函数,使变换后图像的对比度增加。该方法能够对过亮、过暗以及中间区域的像素灰度值进行修正,为后续的肤色分割、人脸检测奠定基础。为了抵消整个图像中存在着的色彩偏差,将整个图像中所有像素的亮度(是经过了非线性校正后的亮度)从高到低进行排列,取最亮的像素,就将他们的亮度作为“参考白”(Reference White),即将它的色彩的R、G、B分量值都调整为最大的255。整幅图像的其他像素点的色彩值也都按这一调整尺度进行变换。(2)非线性分段色彩变换(Nonlinear Color Transformation)这一非线性分
31、段色彩变换得到的肤色模型属于色彩空间中的聚类模型,这一类肤色模型的建立首先要选取一种合适的色彩空间。YCbCr色彩空间具有如下一些优点。YCbCr色彩格式具有与人类视觉感知过程相类似的构成原理。YCbCr色彩格式被广泛地应用在电视显示等领域中,也是许多视频压缩编码如MPEG、JPEG等标准中普遍采用的色彩表示格式。YCbCr色彩格式具有与HIS等其他一些色彩格式相类似的将色彩中的亮度分量分离出来的优点。相比HIS等其他一些色彩格式,YCbCr色彩格式的计算过程和空间坐标表示形式比较简单。试验结果表明在YCbCr色彩空间中肤色的聚类特性比较好。同时,正如前面所分析的那样,YCbCr色彩格式直接由
32、RGB色彩格式通过线性变换得到,所以其亮度分量Y并不是完全独立于色度信息而存在的,肤色的聚类区域也是随亮度分量的不同而呈现非线性变化的趋势。在YCbCr色彩空间中,肤色聚类是呈两头尖的纺锤形状,也就是在Y值较大和较小的部分,肤色聚类区域也随之缩减。简单地排除Y分类,按照传统的做法在二维的CbCr子平面中寻求肤色的聚类区域是不可行的,必须考虑Y之不同造成的影响,从而对YCbCr色彩格式进行非线性分段色彩变换。用4个边界来限制肤色聚类区域可以很好地适应亮度过明或过暗的区域,从而使肤色模型的鲁棒性大大提高。经过了非线性分段色彩变换得到的色彩空间我们用YCbCr来表示。YCbCr坐标空间到YCbCr坐
33、标空间的变换过程推导如下。(1)将肤色区域的中轴线分别用Cb(Y)和Cr(Y)来表示,可以得到 Cb(Y)和Cr (Y)的表达式为: 108+(Ki-Y)*(118-108)/(Ki-Ymin) if(YKi)Cb(Y) = 108+(Y-Kh)*(118-108)/(Ymax-Kh) if(KhY) (4-1)154+(Ki-Y)*(154-144)/(Ki-Ymin) if(YKi)Cr(Y) = 154+(Y-Kh)*(154-132)/(Ymax-Kh) if(KhY)其中, Ki和Kh为常量,即非线性分段色彩变换的分段域值,分别为: Ki=125, Kh =128。Ymax和Ymin
34、也是常数,它们是实验数据的得到的肤色聚类区域中Y分量的最小和最大值:Ymin=16, Ymax =235(2)同样,将肤色区域的宽度分别用Wcb(Y)和Wcr(Y)来表示,这也是一个分段函数,其表达式为:WLci+(Y-Ymin)*(Wci- WLci)/(Ki-Ymin) if(YKi)Wci(Y)= (4-2)WHci+(Ymax-Y)*(Wci- WHci)/(Ymax-Kh) if(KhY)其中i代表b或r,Ki、Kh、Ymin和Ymax同(1)中的数据。Wc、WLc和WHc也是常数他们分别为:Wcb=46.97,WLcb=23,WHcb=14Wcr=38.76,WLcr=20,WHc
35、r=10(3)最后,根据上面的结果得到如下的非线性分段色彩变换公式:(Ci(Y)- Ci(Y)*Wci/ Wci(Y)+ Ci(Y)if(YKi)or(KhY) Ci(Y) = (4-3)Ci(Y) if(YKi,Kh)按照传统的方法,可以用一个椭圆来近似肤色区域。我们得到它的解析表达式为:(x-ecx)2/a2+(y-ecy)2/b2=1,其中,xcossinCb-cxy -cossinCr-cy (4-4)解析式中的常量分别为:cx=109.38,cy=152.02ecx=1.60,ecy=2.41a=25.39,b=14.034.1.3 人脸区域分割(1)系统结构图人脸区域分割的系统结构
36、图如图4-1所示。图像中的肤色和非肤色像素点人脸区域分割算法包含人脸区域在内的一系列矩形区图4-1 系统示意图在上面的示意图中,输出的一系列矩形就将取代原来的整幅图像作为后面的人脸检测算法的输入。对于这些矩形的要求如下。这一系列矩形应该尽可能的包含待检测图像中的所有人脸对于距离较近或者是有接触多个人连,分割后得到的肤色区域自然距离较近或者是连在一起,这时可以用一个矩形区域覆盖它们。不漏检、不降低正确率是整个肤色分割与处理的前提,也是人脸区域分割算法的首要前提。根据前面对肤色模型的分析,无论什么样的肤色模型都存在着判断失误的现象,所以算法输出的一系列矩形应该尽量包含所有的人脸区域便显得尤为重要。
37、这一系列矩形应该少包含非肤色区域即相对原来的整幅图像,经过肤色分割与处理后的这一系列矩形的大小要明显小于原来的整幅图像。这也正是肤色分割预处理能够提高人脸检测算法的时间效率的原因,也是肤色分割预处理能够降低误报率的关键。(2)人脸区域分割算法根据上面对肤色区域分割算法结果的要求,也就是对于算法本身的要求,本系统采用了如下的人脸区域分割算法。物体分割方法大体上有3大类方法:基于像素的方法,基于边界的方法和基于区域的方法。利用肤色模型像素点的提取相当于已经应用了基于像素的方法,在此基础上要将这一个个分散的肤色像素点构成一个个人脸区域,再用这些人脸区域的外接矩形来表征它们。基于边界的方法由于处理的像
38、素数量相对较少,各像素点间的相邻关系也相对简单,所以处理起来的速度要比基于区域的方法快;但另一方面,由于基于边界的方法是从局部特性来求图像整体的分割,因此在全局宏观性质的考虑上不如基于区域的方法。本程序采用将基于边界的方法和基于区域的方法相结合的算法:基于边界的方法主要用于前期初始矩形序列的产生,争取快速的得到包含人脸区域的外接矩形;然后用基于区域的方法,全局考虑,对初始矩形序列进行区域归并,得到最终的输出矩形。算法的流程如图4-2所示。输入经过了肤色分割的图像去噪声处理提取边界对边界的连通关系作处理由边界的连通性和闭合性得到初始的一系列矩形将初始的矩形序列进行归并处理输出最终的矩形图4-2
39、区域分割算法流程图解释以上的算法流程的主要步骤。去噪声处理在完全没有先验知识的情况下,对于一些独立的肤色像素点,想将它们归为一个个人脸区域,很自然会想到找连通区的方法。属于同一个人脸区域的肤色像素点应该是相互连通的;反之,一个人脸区域也应该是由一些连通的肤色像素点构成的。但由于噪声普遍存在于数字图像中,还有基于肤色模型的分割结果存在判断失误的情况,都会在连通的人脸区域中产生非肤色的噪声。所以进行人脸区域分割之前要进行去噪声或者滤波的处理。本程序采用了一种基于像素“密度”的滤波方法来去除噪声。这是一种类似“卷积”的滤波方法。直观地讲,就是在以每一个肤色像素为中心的5*5领域内统计肤色像素的个数,
40、超过半数时中心点保留为肤色,否则认为是非肤色。提取边界、对边界的连通关系作处理并由边界的连通性和闭合性得到初始的一系列矩形在得到了是否是肤色的相当于是二值化的图像以后,我们就可以提取出每一个人脸区域的边界。为提高人脸区域提取算法的速度,本程序采用如下的肤色区域边界提取算法:扫描图像一遍,将与非肤色像素点相邻的肤色像素点提取出来作为肤色区域的边界。显而易见,经过了肤色分割以及去噪声处理后的图像提取出来的边界都是各自闭合的,即每一段边界都是首尾相接的,各自包围着一个个的连通的肤色区域。由上面所述的边界提取算法得到的肤色区域边界,这样的边界上点和点之间的相邻关系是遵循四连通原则的,即在以一个像素点为
41、中心的3*3领域内,按照上、下、左、右4个方向来跟踪边界。直观的称这种边界为“原始四连通边界”。但是,后边的寻找初始的人脸区域外接矩形的算法是基于边界的,所以边界点数目越少越有利于提高算法性能。而且过多冗余的边界点也会给基于边界找外接矩形的方法带来更多可能失误的情况。例如:过于接近的边界点会导致不应该出现的小矩形的出现;2*2的小正方形中的4个像素点如果都是边界点就会导致边界跟踪失败。所以需要对“原始四连通边界”上的像素点在进一步处理,抛弃不与肤色像素点相邻的边界点。这样一来,冗余的边界点被减少,边界相邻关系也更加简答,利用四连通原则来判断边界的连通和闭合关系就会减少失误和跟踪失败的现象。这样
42、做以后,就可以由边界的连通性和闭合性来找每一段边界的外接矩形。基于如下几条论据,可以知道“简化四连通边界”得到的外接矩形可以找到人脸区域的外接矩形。论据一:如果找到的“简化四连通边界”是闭合的,则显然闭合区域的外接矩形就是肤色区域的外接矩形。闭合的“简化四连通边界”内部还可能存在闭合的或者不闭合的“简化四连通边界”,也就是说可能还存在连通的非肤色区域,但考虑到预处理的前提是尽可能包括肤色即人脸区域,所以在没有其他先验知识的情况下,应该讲这样的肤色区域用一个矩形包围起来,参加后面的人脸检测。另外,在前面对肤色模型的分析中也可以清楚地看到,由于高光等影响,人脸的额头、颧骨等处经常被误检为不是肤色,
43、而周围的以一个环状区域被误检的可能性就小的多,所以更应该将这种肤色区域中间包围非肤色区域的情况用一个大的外接矩形包围起来参加后面的人脸检测,才能保证不漏检。论据二:由于受到噪声和边界提取并不完全精确等因素的影响,找到的“简化四连通边界”也并不一定都是闭合的。但即使这样,每一个连通的肤色区域的边界也一定是有一些不闭合的“简化四连通边界”段组成,这些边界段各自的外接矩形一定是相互接触或有重叠的,在后面的区域归并算法中将对这样的情况进行处理,用这些矩形的公共外接矩形来包围整个区域,显然这样得到的一个公共外接矩形也是原肤色区域应有的、正确的外接矩形。下面就是由边界的连通性和闭合性得到的初始的一系列矩形
44、即提取人脸区域外接矩形的具体算法。第1步:给每一个边界点增加一个标志域:“边界跟踪的起始点”、“已检测过的边界点”和“未检测过的边界点”。第2步:在图像中的边界点中从下到上、从左到右寻找一个未检测过的边界点,即标志域为“未检测过的边界点”的点。如果找得到,将其标志域改为“边界跟踪点的起始点”,为这一新的跟踪建立一个外接矩形,初始化其上、下、左、右4个边界,转第3步;若找不到转第7步。第3步:从这一“边界跟踪的起始点”开始,按照四连通的原则,在其上、下、左、右的4个邻接点中寻找“未检测过的边界点”,因为不存在孤立的边界点,所以这个点一定能找到,将其标志域改为“已检测过的边界点”,并将其作为当前操
45、作点,转第4步。第4步:从当前操作点开始,按照四连通的原则,在其上、下、左、右的4个邻接点中寻找“未检测过的边界点”或“边界跟踪的起始点”。如果找到,转第5步;否则转第6步。第5步:如果新找到的点是“未检测过的边界点”,则将其标志域改为“已检测过的边界点”,将其作为当前操作点,再转回第4步。如果新找到的点是“边界跟踪的起始点”,要判断这一点与当前操作点是否“互相找到对方”,如果是,仍以原来那个当前操作点开始,转回第4步;如果不是,将“边界跟踪的起始点”的标志域改为“已检测过的边界点”,并转第6步。第6步:将第2步中建立的外接矩形的四个边界值确定,并转第2步寻找新的人脸区域。第7步:整个图像中的人脸区域寻找完毕,得到了一系列外接矩形。在算法中每找到一个新的“未检测过的边界点”就判断其坐标值能否改变外接矩形4个边的位置,这样所有的边界点找完,外接矩形也就自然确定下来。将初始的矩形序列进行归并处理前面分析过,基于边界的人脸区域分割方法有快速、便捷的优点,但它是从局部特性出发,没有考虑图像整体因素,会造成得到的初始的矩形序列中的矩形相互覆盖、重叠等现象,所以要对这一初始矩形序列进行归并处理。尤其可能出现一个封闭的肤色连通区的边界被跟踪成了几小段的情况,所以这一步的归并处理也显得必不可少。具体的