学术论文网
人脸检测与识别系统的设计与实现
发布日期:2024-09-14 09:05:02

  绪论

  1.1 课题研究的背景与意义

  随着现代计算机技术的发展,人脸检测与识别技术在安全验证、人机交流、公安系统等方面得到了广泛的使用,并且在视频会议、档案管理、医学医疗等方面也发挥着很大的作用。人脸检测与识别系统与其他人体生物特征识别系统(如指纹、虹膜等)相比,人脸图像更容易获取,特别是在非接触环境的情况下,人脸识别的优越性远远超越其他识别技术。所以,人脸检测与识别技术己经逐渐成为人们在人工智能领域研究的重点课题。

  人脸检测是人脸识别的基础,是指计算机在包含有人脸的图像中检测出人脸,并给出人脸所在区域的位置和大小等信息的过程。我们人类自身能够快速、准确的进行面部识别,但并不表示计算机也能如此,相反利用计算机进行人脸检测和识别是一个相当复杂和困难的任务。原因是多方面的,如人脸是一个存在局部变形的三维固体表面,存在弹性形变的人脸是在不同的光照、视角、年龄和化妆等条件下获取的。也就是说,对于一张给定的人脸,由于人脸可以出现在图像中的任何地方,光照和姿态变化因素可以引起千万种情况。为了消除光照和姿态变化对人脸识别算法的影响,相关工作者也做出了深入的研究,识别判断时通过与各种不同光照下的样本比较,但是,这样就大大减低了识别算法的速度,在实时性上又不能满足人脸识别的产品要求。当然现在人们致力于人脸3D模型重建算法,可以有效的克服大部分不良因素产生的影响,采用人脸检测与识别技术,建立自动人脸识别系统,用计算机实现对人脸图像的自动识别。因此,借助计算机进行人脸识别一直是生物特征识别研究中的一个热点问题,也是具有很好应用发展前景和重要的研究意义。

  1.2 课题研究的国内外现状

  1.2.1 国外的研究现状

  在20世纪60年代末70年代初,人们就一直着力于人脸检测与识别技术领域的研究。在各国研究学者的共同努力下,人脸的检测和识别算法得到了不断的改进与优化。并且人脸检测与识别技术逐渐成熟和发展,在人类的生活中得到越来越广泛的应用。后来,随着社会经济的快速发展和高速高性能计算机的出现,人脸检测与识别方法有了更加重大突破,人脸检测与识别进入了真正的机器自动检测与识别阶段。

  国外有许多大学在此方面取得了很大进展,他们研究涉及的领域很广。其中有从感知和心理学角度探索人类识别人脸机理的,如美国Texas at Dallas大学的Abdi和Toole小组,主要研究人类感知人脸的规律;由Stirling大学的Bruce教授和Glasgow大学的Burton教授合作领导的小组,主要是研究人类大脑在人脸认知中的作用,并在此基础上建立了人脸认知的两大功能模型,他们对熟悉人脸和陌生人脸的检测与识别规律,以及图像序列中的人脸检测与识别规律也进行了研究;也有从视觉机理角度进行研究的,英国Aberdeen大学的Craw小组,主要研究人脸视觉表征方法,他们对空间频率在人脸识别中的作用也进行了分析;荷兰Groningen大学的Petkov小组,主要研究人类视觉系统的神经生理学机理,并在此基础上发展了并行模式识别方法。由于计算机的出现,更多的学者则从事利用输入图像进行计算机人脸检测与识别的研究工作。

  1.2.2 国内的研究现状

  国内对人脸检测与识别技术的研究起步较晚,始于上世纪80年代,在近30多年的研究中,取得了一系列的研究成果。国内自上世纪90年代以来,在国家自然科学基金和863计划等资助下,清华大学(电子系、自动化系和计算机系)、哈尔滨工业大学计算机系、中科院(计算所、自动化所)、南京理工大学、上海交通大学等很多单位展开了人脸检测与识别技术研究,北京工业大学(信号与信息处理研究室)也在人脸检测与识别方面取得了较好的研究成果。国内已经举行过数届生物识别学术会议,都取得了很好的成果,而且大大推动人脸检测与识别技术研究的发展。中科院的模式识别重点实验室,专门对模式识别方面进行研究,在国内模式识别领域取得了很多很好的成果。但是,目前国内的研究水平仍低于国际水平,许多核心技术被国外大公司所掌握。国内更需要在人脸检测与识别技术中多多投入研究。

  国内的研究工作主要是集中在三大类方法的研究:基于几何特征的人脸正面检测与识别方法、基于代数特征的人脸检测与识别方法和基于连接机制的人脸检测与识别方法。目前,国内人脸检测与识别已有的应用有:2005年,公安部出入境管理局实施“深圳-香港生物护照旅客快速通关系统”采用人脸检测与识别系统,每名旅客过关时间只需约6秒,识别率达到99%。2006年,人脸检测与识别系统在国内金融部门的金库开始使用,使其成为国内首个用人脸来“把守”大门的金库。运行以来,工作稳定可靠,经受了实际应用的检验。2008年,北京奥运会开闭幕式入场券实行实名制管理,要求入场券持有者提交个人信息和身份照片,并利用人脸检测与识别技术进行门票实名制身份验证,目的在于消除潜在的安防漏洞,提高奥运安全防范和科技反恐水平。

  1.3 本课题主要研究的内容

  本文从对国内外人脸检测和识别的研究现状出发,总结了他人在这方面的研究成果,在人脸检测算法和人脸识别算法上作了一些理论和实验研究工作,力图使现有的方法能够更加完善。下面简要介绍本课题主要的内容。

  (1)对人脸检测与识别技术的研究背景和涉及的学科作了简单介绍,并对一些具有代表性的人脸检测和识别方法进行了分析。

  (2)通过比较现有的基于肤色的人脸检测方法,引入本文采用的方法,即肤色检测与面部特征提取相结合的方法。首先建立颜色空间和肤色模型,对图像进行肤色分割;接着,对分割结果依据人脸的特征去掉部分非肤色区域;最后,在所得区域内检测出人脸区域。

  (3)提出了基于几何特征的人脸识别方法。首先将人脸中的重要特征点眼睛、嘴巴和鼻子的信息记录下来,充分利用记录的特征信息构建关系。两只眼睛和嘴巴三个点构成的三角形关系,利用欧式距离分别求出其各个边的长度。依次打开两个图像并完成系统中的操作,就可以进行匹配,判断是否为同一人。

  (4)实现了人脸识别仿真系统,进行实验和测试。分析了系统的组成和操作流程,实现了人脸识别仿真系统。实验结果表明该系统不仅适用于多表情的人脸识别,还对不同类型样本选取有很好的鲁棒性,具有较好的实用价值。

  人脸检测与定位技术

  2.1 人脸检测方法的分类

  在任意给定的图像中,通过人脸检测的算法,找出是否有人脸的存在,如果存在,则标识出人脸的位置,这种方法就是人脸检测。人脸检测的方法主要分为三类:基于先验知识的方法、基于模板匹配的方法和基于统计的方法。图2-1给出了这三类检测方法,下面对这几类方法做简要的介绍。

  图2-1 人脸检测方法

  2.1.1 基于先验知识的方法

  由于所有的人脸都有一个共性,那么该系统可以把一些典型的人脸组成一个规则库,然后通过该规则库,釆用基于先验知识的检测方法,是通过抽取灰度、纹理和几何形状等特征形成一定的规则,然后检验这些规则是否符合人脸先验知识的方法。因此,基于先验知识的人脸检测算法,也可以称之为基于规则的人脸检测算法,而这个规则是科研人员根据其已有的研宄成果和人脸检测的知识理论的基础上指定的。

  该系统可以从人脸图像中发现,人的眼睛位于人脸的上部分,并且两只眼睛是相互对称的,嘴巴位于人脸的下半部分,而鼻子位于眼睛和嘴巴的中间部分,几乎在人脸的中央位置,并且通过观察可以发现,两只眼睛连成的线与鼻子和嘴巴连成的线是垂直的关系,几乎所有的人脸都可以用这种单一的规则来表示。那么,基于先验知识的人脸检测的基本思想就是首先要对给定的人脸图提取特征,然后再按照规则库,标识出人脸的区域范围。当然,所标识出的人脸的区域中人脸的各个局部特征必须符合上述该系统说所得单一的规则,如果这些规则都是成立的,那么对于给定图像中的人脸检测基于肤色的人脸检测与特征定位系统的设计与实现就成功了。

  2.1.2 基于模版匹配的方法

  模板匹配法操作简单,直观性比较好,其思想是利用人脸部分或全部标准特征模板和输入图像中所有的区域进行匹配,通过模板和区域之间的匹配度来检测人脸。模板匹配算法的思想是这样的:首先给出一个“固定目标模板”,这个固定目标模板可以是一个事先设定好的,也可以使用相关函数对这个模板进行参数化处理,接着把给定的待检测的图像与第一步中的标准模板进行比对,计算出两幅图像所对应的特征和边缘之间的相关系数,即得出差异性,利用这个差异性来判断给定的图像中是否包含人脸。虽然这种方法操作相对比较简单,只需计算出待检测图像与标准人脸模板的相似度即可,但是由于本系统预先设定的标准的人脸模板一般情况下是正面的,所以这种预先设定好的人脸模板难以涵盖所有的情况。所以如果检测角度不同的同一个图像,就导致检测的速度下降,而且误检率较高。

  2.1.3 基于统计的方法

  基于统计的方法依靠统计分析和机器学习来训练人脸样本与非人脸样本,从而将人脸区域检测出来。此方法在某种程度上比其他的人脸检测算法有更好的实用性,它的本质不是从单个人脸出发,而是基于人脸某种通用特征训练相应的人脸模型。当然代表人脸的通用特征就显得很重要了,是否有个好的人脸统计特征是此算法是否可以很好的工作的基础。如有这种通用特征,经过大量的人脸训练相应的人脸检测分类器来检测其他图片中的人脸,然后通过特定的判别式判断检测图像是属于哪一类,是人脸还是非人脸。

  此方法在某种程度上有一定的复杂性,基于统计学的方法的检测效果比起其他检测算法好很多,但这种方法因为需要训练尽量多的样本,所以计算量很大、耗时多。因此,在解决复杂环境的人脸检测的时候,更多的是采用此方法,而综合各种因素,这种方法不适合本设计。

  对于人脸区域,肤色是占主导地位的色彩。针对彩色图像的人脸检测,肤色检测最为简单有效。基于肤色的人脸检测方法利用图像的彩色信息,在一定的色彩空间中构造肤色模型,该方法在不同的视角中均能检测到人脸,具备稳定性,不受尺寸、表情和姿态变化的影响。本文针对静止单一的正面人脸彩色图像,主要采用人脸检测方法中的肤色建模方法。

  2.2 颜色空间与肤色模型

  人脸检测及定位的实现具体步骤如下:

  1)选择颜色空间与肤色模型。

  2)计算得到相似度灰度图。

  3)根据相似度灰度图将图像二值化。

  4)垂直方向和水平方向投影。

  5)标识人脸区域。

  根据人脸检测及定位的实现步骤,首先要选择合适的颜色空间和肤色模型,下面将具体介绍这两个方面。

  2.2.1 颜色空间

  归一化RGB颜色空间

  RGB 颜色空间也称为红、绿、蓝基色模型。为标准化起见,CIE在1931年选择红色,绿色,蓝色三种单色光作为颜色系统的三基色,这就是RGB颜色空间。在RGB颜色空间中,三个颜色分量R、G、B不但表示各自的色彩,也包含了各自的亮度分量。研究表明,如果图像中的两个像素点[R、G、B]和[R'、G'、B']对应成比例且比值不等于1,如式(2-1)所示。则表明两个像素色彩相同,其不同则体现在亮度上。

(2-1)

  因此,在色度空间中去除亮度分量,即形成肤色空间,得到归一化的RGB颜色空间,如式(2-2)所示。

(2-2)

  由于r+g+b=1,从而忽略任何一个变量,经过上述变换其中两维都是独立的,大大减少了亮度分量的影响,相当于将三维的RGB空间降低成二维的r-g空间。

  HSI颜色空间

  HSI(Hue-Saturation-Intensity,HSI)颜色空间用H、S、I三个参数描述颜色特性,它是由Munseu提出的一种颜色模型。其中H定义颜色的波长,称为色调;S表示颜色的深浅程度,称为饱和度;I表示强度或亮度。HSI颜色空间反映了人的视觉对色彩的感觉。

在HSI颜色空间中,色调H和饱和度S包含了颜色信息,而强度I与彩色信息无关。图2-2中的色环描述了HSI空间中的色调和饱和度两个参数。色调H由角度表示,它反映了颜色最接近哪种光谱波长,即光的不同颜色,如红、蓝、绿等。通常假定表示的颜色为红色,的为绿色,的为蓝色。的色相覆盖了所有可见光谱的彩色。

  图2-2 HSI颜色空间色环

  饱和度S表征颜色的深浅程度,饱和度越高,颜色越深,如深红,深绿。饱和度参数是色环的圆心到彩色点的半径的长度。由色环可以看出,在色环的边界上的颜色饱和度最高,其饱和度值为1,在中心的区域则是中性影调,其饱和度为0。

  颜色空间在视觉上是均匀的,与人类的视觉特性有很好的一致性。如果去掉其亮度成分I,使用H和S分量对图像进行肤色分割,也可以得到很好的效果,但是它也有很大的不足:

  1)三个分量H、S、I是由三基色R、G、B经过非线性变换得到的,因此计算复杂度很高,计算效率较低。

  2)HSI颜色空间中存在着奇异点,即色度点在I轴上时,其S值为零,而H没有定义。而且在奇异点附近R、G、B值的较小变化会引起H、S、I值的较大变化。饱和度S越小,颜色越浅时,色调H值越不稳定。

3. 颜色空间

在JPEG(Joint Photographic Experts Group)标准中,RGB图像被转换到亮度-色度空间,通常称之为色彩空间。颜色空间的Y亮度分量和色度分量和基本分离,比较适合肤色聚类。除此颜色空间还显示了其他一些良好的特性:

  该空间具有与人类视觉感知过程相类似的构成原理。

色彩空间被广泛地应用在电视显示等领域中,也是许多视频压缩编码,如MPEG和JPEG等标准中普遍采用的颜色表示。

的计算过程和空间坐标表示形式简单,与RGB之间的转换为线性,容易实现,避免了非线性空间的奇异性。

颜色空间是离散的,采用颜色空间比较易于实现肤色聚类的算法。

Anil K.Jain等人绘制了853571个肤色点的统计图像,其结果表明,肤色在颜色空间的肤色聚类效果较好。

  2.2.2 肤色模型

选定好颜色空间后,接下来就是在此颜色空间中进行肤色建模。所谓肤色模型是指用一种代数的、解析的或查表等形式来表示肤色的聚集特性,或者表征出某一像素的颜色与肤色的相似程度。常用的肤色模型有直方图模型、椭圆模型和高斯模型。下面简单介绍这几种模型。

  直方图模型

  直方图模型是一种非参数化模型。此模型通过选定的颜色空间对肤色进行统计得出其各颜色分量直方图,由直方图显现出的规律来选定阈值,通过该阈值来对整个图像进行肤色与非肤色的判别。尽管此模型在三维直方图中效果比较好,但由于其训练样本数量庞大而且训练时间较长。因此,在肤色模型中较少使用。

  椭圆模型

肤色在空间中也可以用椭圆分布来描述,根据式(2-3)和式(2-4)来匹配椭圆分布两个色度分量的距离。

(2-3)

(2-4)

其中,和分别和的统计平均值。式中的参数=1.60,=2.41,=25.39,=14.03,=114.38,=160.02,。

  高斯模型

  高斯模型主要是利用了统计学的原理。肤色符合正态分布的随机样本,在特征空间中的分布则符合高斯分布,高斯函数平面图如图2-3所示。高斯分布的数字表达形式简单且直观,又是统计学中研究比较深入的正态模型,因此借助此模型具有一定的优越性。它主要通过统计分析,预测高斯分布的参数,或通过统计直接求得颜色空间中每个分量的均值与协方差。这种方法分为两步:首先选择方法确定模型参数,其次利用该模型来判别新的像素或区域是否为肤色。

  图2-3 高斯函数平面图

  高斯模型相对其他模型能更好的表示肤色分布,相对来说它的肤色检测率也高得多,并且模型的参数也易于计算,因此借助此模型具有一定的优越性。

 1/3    1 2 3  
Copyright © 2008-2020 学术论文网 版权所有 粤ICP备16093775号