人脸识别方法报告人脸识别(Face Recognition)是指给定一个静止或动态图像,利用已有的人脸数据库来确认图像中的一个或多个人。
人脸自动识别系统包括人脸检测与定位和特征提取与人脸识别两个主要技术环节,如图所示:1.人脸检测与定位部分检测图像中是否有人脸图像,若有,将其从背景中分割出来,并确定其在图像中的位置。
在某些控制拍摄条件的场合,如证件照等,背景相对简单,定位比较容易。
而在复杂背景下获得的图像,由于人脸在图像中的位置是未知的,此时人脸的检测与定位将受到以下诸因素的影响:( 1) 人脸在图像中的位置、旋转角度和尺度的变化;( 2) 发型和化妆会遮盖某些特征;( 3) 图像中的噪声。
2.特征提取与人脸识别这部分主要分为三个部分,分别是图像预处理、特征提取、人脸识别。
图像预处理:为了更精确地获得图像的有效特征信息,在特征提取前一般需要对图像做几何归一化和灰度归一化的处理。
前者是指根据人脸定位结果将图像中的人脸位置、尺度调整到同一位置和同样大小;后者主要是采用光照补偿等处理方法解决光照变化对检测的影响。
特征提取:进行特征提取时根据所采取识别方法的不同,具体提取的特征形式也不相同。
如在基于几何特征的识别方法中,需要提取特征点,然后构造特征矢量;在基于统计的特征脸方法中则是提取图像相关矩阵的特征矢量来构造特征脸;在模板匹配法中提取相关系数做为特征;而在基于神经网络的识别中一般不需要专门的特征提取过程。
人脸识别:特征提取结束后,下一步就是人脸识别。
在数据库中预先存放了已知的人脸图像或有关的特征值,识别的目的就是将待识别的图像或特征与数据库中数据进行匹配。
识别任务分为两类:人脸辨认,确定输入图像为库中哪一个;人脸证实,验证某人的身份是否属实。
常用的人脸识别方法有:1.基于几何特征的人脸识别方法基于几何特征的人脸识别方法,是在抽取人脸图像上显著特征的相对位置及其参数的基础上进行识别。
早期的人脸识别是用手工确定人脸特征点的位置并将其输人计算机中,其工作的流程:检测出面部特征点,通过测量这些关键点之间的相对距离(欧式距离),得到描述每个脸的特征矢量,如眼睛、鼻子和嘴的位置和宽度,眉毛的厚度和弯曲程度等,以及这些特征之间的关系。
用这些特征来表示人脸,未知脸和库中已知脸中的特征矢量比较,寻找最佳匹配。
Yuille提出基于弹性模板的人脸检测方法。
弹性模板是由一个根据被测物体形状而设定的参数可调模板和与之对应的能量函数构成,能量函数可依据图像的灰度信息、被测物体轮廓等先验知识来设计。
用弹性模板进行人脸检测时,将可调模板在待测图像中移动,并动态地调整其参数,计算能量函数,当能量函数到达最小值时,根据其位置和参数所决定的可调模板形状即是与人脸形状的最佳拟合,这样就检测到了一幅人脸.这种方法的优点是由于所使用的弹性模板可调,所以能够检测不同大小、不同偏转角度的人脸物体,其缺点是检测前必须根据待测人脸的形状来设计弹性模板的轮廓,否则会影响收敛的结果;当对图像进行全局搜索时,由于要动态地调整参数和计算能量函数,计算时间过长。
基于几何特征的识别算法具有存储量小、对光照不敏感的特点,但该方法对获得图像的质量要求很高,对特征点的定位要求非常准确,倘若人脸有一定的侧向或有装饰物则会影响识别率。
所以这种方法做为早期的识别方法,现在常是作为其它识别方法的辅助手段。
2.基于统计特征的人脸识别方法基于统计特征的人脸识别方法,不只针对人脸的某一特征,它是从整个人脸的角度出发,利用统计原理,从多张人脸图像中提取出人脸共有的一些规律,利用这些规律来进行人脸的识别。
由于人脸图像的复杂性,人脸特征的显式描述具有很大困难,因此基于统计的方法越来越受到重视。
典型的方法是特征脸( Eigenface)方法、Fisher脸方法和隐马尔可夫模型( HMM)方法。
(1)本征脸(Eigenface)方法本征脸方法是由Turk和Pentland等人首先提出的,是从主成分分析( PCA)导出的一种人脸识别和描述技术。
PCA由K-L展开的网络递推实现,K-L变换(最优正交变换)首先应用于图像的压缩,其生成矩阵由训练样本的总体散度矩阵构成。
其中,x k为第k个训练样本的图像向量,m k为训练样本集的平均图向量,N为训练样本总数。
本征脸方法是将包含人脸的图像区域看作随机向量,采用K- L变换获得其正交K-L基,对应其中较大特征值的基具有与人脸相似的形状,因此又称之为特征脸,如图所示:利用这些基的线性组合可以描述、表达和逼近人脸图像,因此可以进行人脸识别与合成。
其识别过程是将人脸图像映射到由本征脸张成的子空间上,通过比较待测人脸与已知人脸在本征脸空间中的位置差别来识别。
本征脸方法产生的最大特征向量(本征脸)考虑了图像之间所有的差异,但是它不能区分这些差异是由人脸本身带来的还是外在因素带来的,所以该方法有一定的局限性。
研究者在此基础上提出了许多改进的方法,如双子空间法、相形歧义分析方法、Fisher脸方法等。
(2)Fisher脸方法Fisher脸方法是Belhumeur提出的,该方法又称为线形判别分析( LDA)方法。
用LDA方法可找出使类内数据尽量集中,类间数据尽量分散的线性变换关系。
它是本征脸方法的一种最优改进,所以可以得到较好的识别结果。
其变换公式如下:由于LDA方法需要使用PCA降维,而PCA方法在降维的同时丢失了很多帮助判别的有用信息,因此很多人开始寻找直接使用LDA降维的方法。
Yu和Yang提出的DLDA方法,大量实测结果表明:Fisher脸方法优于本征脸方法,即FLDA的降维效果要优于PCA的降维效果;而基于直接进行LDA降维的人脸识别方法优于Fisher脸方法。
两者的区别就在于不使用PCA降维,使判别信息得到了最大程度的保留。
(3)LBP特征脸方法使用LBP 手段描述人脸,具体表现为运用纹理描述符对人脸局部展开详细的绘制处理,然后将其组合成一体。
其中是窗口中心像素,p是相邻像素个数,i c是窗口中心像素的灰度值,i n是相邻像素的灰度值,s是一个符号函数,定义如下:人脸图像被分割成几个局部区域,从这些不同的区域提取纹理描述符,并共同构成人脸的整体视图。
把脸部区域分成确定的m 份R0、R1、R2、…、Rm-1,直方图将依序计算每个区域,M 的直方图计算结果整合在一起形成空间,空间增加M×N大小的直方图,其中的n表示一个直方图的大小。
空间增强的直方图可以有效地描述3个不同层次的脸部,具体的3个层次分别为:直方图LBP 标识包含一个像素级别的信息;地域级是由小的区域上的标志集结构成的;这些区域的直方图连接起来,最终形成完整的人脸。
(4)隐马尔可夫模型(HMM)方法一种人脸识别方法的效果取决于图像的原始信息的利用程度。
所以一些研究者尝试用一组数值特征来描述人脸的各个器官,并且利用这组数值特征对人脸进行识别。
仅简单地利用一组数值特征并不能使人脸识别问题得到满意地解决,而应当把人脸作为一个整体来描述,不仅包括各个器官的数值特征,还应当包括各个器官的不同表象和相互关联。
隐马尔可夫模型已成功应用于语音识别,在该模型中,观测到的特征可看作是一组不可观测“状态”产生的一系列实现,可用不同的HMM参数来表征不同的人脸,同一个人由于姿态和表情变化产生的多个观测序列可以通过同一个HMM模型来表征,所以在理论上获得了很大的进步。
下图为人脸图像的一个典型HMM模型:多数研究者在利用HMM进行人脸识别时,都采用矩形窗口进行某种变换的方法来提取特征,常见的变换有2D-DCT、KLT、小波变换、奇异值分解等。
得到观察向量,构建HMM人脸模型,然后用EM算法训练。
利用该模型就可以算出每个待识别人脸观察向量的概率,从而完成识别。
为解决一维HMM识别率不高的问题,可以采用二维HMM方法。
二维HMM方法在AT& T人脸库测试的结果获得了较高的识别率。
(5)Harr特征脸方法Haar-like特征最早是由Papageorgiou等应用于人脸表示,Viola和Jones在此基础上,使用3种类型4种形式的特征。
Haar特征分为三类:边缘特征、线性特征、中心特征和对角线特征,组合成特征模板。
特征模板内有白色和黑色两种矩形,并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。
Haar特征值反映了图像的灰度变化情况。
例如:脸部的一些特征能由矩形特征简单的描述,如:眼睛要比脸颊颜色要深,鼻梁两侧比鼻梁颜色要深,嘴巴比周围颜色要深等。
但矩形特征只对一些简单的图形结构,如边缘、线段较敏感,所以只能描述特定走向(水平、垂直、对角)的结构。
对于图中的A, B和D这类特征,特征数值计算公式为:v=Sum白-Sum黑,而对于C来说,计算公式如下:v=Sum白-2*Sum黑;之所以将黑色区域像素和乘以2,是为了使两种矩形区域中像素数目一致。
通过改变特征模板的大小和位置,可在图像子窗口中穷举出大量的特征。
上图的特征模板称为“特征原型”;特征原型在图像子窗口中扩展(平移伸缩)得到的特征称为“矩形特征”;矩形特征的值称为“特征值”。
利用积分图可以快速求出所有矩形特征;然后通过AdaBoost算法来训练和分类。
公式如下:3.基于连接机制的人脸识别方法(1)弹性图匹配(DLA)方法弹性图匹配是基于动态链接结构( DLA)的方法,用格状的稀疏图表示人脸,图中的节点由图像位置的Gabor小波分解得到的特征向量标记图的边用连接节点的距离向量标记,如下图所示:匹配时,首先寻找与输入图像最相似的模型图,再对图中的每个节点位置进行最佳匹配,这样产生一个变形图,由节点位置逼近输入图像模型图的对应点的位置进行识别。
Wiscott使用弹性图匹配方法,用FERET图像库数据实测,识别准确率达到97. 3%。
弹性图匹配方法对光照、位移、旋转及尺度变化都不敏感,是一种优于本征脸的人脸识别方法。
此方法的主要缺点是需要对每个存储的人脸计算其模型图,计算量和存储量都较大。
Wiskott在原有方法的基础上提出聚束图匹配,在聚束图中,所有节点都已经定位在相应目标上。
对于数据量很大的库,可以大大减少识别时间。
利用聚束图还能够匹配不同人的最相似特征,因此可以获得关于未知人的性别、胡须和眼镜等相关信息。
(2)神经网络方法Kohonen自联想映射网络是早期用于人脸识别的一种神经网络,主要用于人脸的“回忆”,当输入图像上的人脸受噪声污染严重或部分缺损时,Kohonen网络可恢复原来完整的人脸,Cottrell 使用级联BP神经网络进行人脸识别,该方法对部分受损人脸、光照有所变化人脸的识别效果较好。
BP神经网络的公式为:E. Osuna提出的基于支持向量机网络( SVM)结合BP神经网络的人脸识别方法,可以避免BP网络结构设计上的盲目性,学习目标函数的凸性,使网络训练过程从根本上避免了局部最优等非线性优化问题。