当前位置:文档之家› 人脸识别算法

人脸识别算法

基于人工神经网络的人脸识别系统童志军090739第一部分:引言在计算机控制上可靠的个人身份识别的需求引发了用生物特征替代密码和身份证进行识别的趋势。

由于密码会被泄露给不合法的用户并且身份证会被骗子盗取所以密码和身份证会被轻易的破坏,生物特征识别的出现能够很好的解决传统分类方法的问题。

生物特征包括人的虹膜、视网膜、面部轮廓、指纹、签名力度变化和语音等特征,这些特征可以用于人物识别。

由于生物特征不能被轻易的盗取和分享,所以生物特征识别相比于传统安全措施有很大的优势,人脸识别系统积极稳固的特点使它在人物识别中脱颖而出。

人脸识别系统包括人脸核实和人脸识别两个阶段。

在核实阶段,系统根据人物特征的先验知识进行核实,这就是说,系统要判断当前待识别人物是否为骗子。

在人脸识别阶段,先验特征并不知道,系统只能根据最大似然准则进行识别。

这篇文章的最初目的是对使用人工神经网络来人脸检测和识别的性能进行评价,文章的剩余部分就是这样组织的:第二部分描述了系统的过程图和人脸识别系统的各个模块;第三部分详尽说明了预处理、特征提取和目标系统的分类的方法;第四部分展示了和讨论了实验结果,第五部分得出结论。

第二部分:系统综述正如图1所示,推荐的人脸识别算法包含入学和识别/分类两个阶段,它包含图像获取,人脸检测、学习、识别和核实。

图1 人脸识别系统结构图A 入学阶段使用网络照相机获得图片并储存在数据库中,然后对图片进行检测和训练。

训练时,使用几何学和光学标准化方法对脸部图片进行预处理,采用几种特征提取的方法提取脸部图片特征,然后把这些特征数据存在数据库中作为用户标识。

B 识别/实验证明阶段再次获得用户脸部生理数据,此系统使用数据辨别用户或者分类用户标识。

虽然身份鉴定需要把获得的生物特征信息与数据库中所有用户的数据进行模板匹配,身份核实仅需要把生物特征信息与主要特性进行模板匹配,所以身份识别与实验证明在内在复杂性上截然不同。

识别阶段包含图像获取、面部检测、面部识别几个模块。

1)图像获取/人脸检测模块人脸检测通常检测和提取与人脸特征相关的恰当信息,图像需要几何和尺寸校正以便可以识别。

在这个模块中需要去除与脸部不相关的背景或场景。

这个系统不仅能够实时识别脸部而且在不同的光照、不同的肤色、有胡须和刘海的情况下也能很好的工作。

图像检测中的图像获取模块是为了寻找和提取只含有脸部的部分,这个系统是基于使用Adaboost算法的长方形特征,系统输出的是包含面部特征的长方形和包含面部特征提取的图像。

2)人脸识别/核实模块人脸识别模块包含预处理、特征提取、子模块分类,系统输入是来源于照相机和数据库的面部图像,首先把它变为几何和光照上标准化的形式,在特征提取阶段,用矢量特征代表图像,识别的分类结果由匹配的的程度决定。

第三部分:方法论A 预处理预处理是为了减少和消除由于光照引起的面部的失真,它通过标准化和增强面部图像来提高系统识别率。

由于系统的稳定性取决于预处理的好坏,所以预处理很关键。

通过明确的标准化过程,系统增强了抵抗尺寸、姿势、面部表情和光照的能力。

光学标准化包括去除几何标准图像的平均值,以标准化值缩放像素比例,估计整个扭曲的图像。

光学标准化技术包括直方图均衡和同态滤波。

1)直方图均衡直方图均衡是最通用的直方图规格化和灰度转换方法,它的目的是为了处理后的图像在所有的灰度级均匀分布。

为了增强图像质量和提高人脸识别的性能通常将它用于太亮或太暗的图像,它改变了图像灰度相对范围,使一些重要特征变得显而易见。

直方图均衡的步骤如下:1.对一个N*M的图像,创建两个长度为G的矩阵H和T,并将它们初始化为0 2.形成图像直方图:扫描每一个像素值,并把对应每一个像素值的数目记在H矩阵中H[p]=H[p]+13.累加直方图H,并保存在H中H[0]=H[0]H[p]= H[p-1]+ H[p]For p=1 to G-1 step 14.G-1T[p]=H[p]MN,重新扫描图像并且输出图像灰度级像素q,其中q=T[P].2) 同态滤波同态滤波算法与Horn 算法类似,就是将照射低频成分与反射高频成分通过傅里叶高通滤波分离。

如果信号中两种频率成分都有,事实上一般信号高频和低频时加性的,通常可以用高通滤波器来分离和抑制低频成分且通过信号中高频成分。

然而,在照射/反射问题上低频照射系数与高频反射系数是乘性的,不是加性的。

为了能继续使用高通滤波器,算法需要变乘为加。

同态滤波后,由于高通滤波的效果I(X,Y)照射成分应该减少很多,而反射系数 R (X,Y )应该得到增强,也就是说,由于表面色彩受光照影响很弱,色彩性质几乎不变。

算法步骤如下:1. 输入光照信号给算法:'''L(x,y)logL(x,y)=log[R(x,y)I(x,y)]=logR(x,y)+logI(x,y)R (x,y)+I (x,y)2. 对信号进行2维傅里叶变化:'''L(x,y)R (x,y)+I (x,y)='''L(u,v)L(x,y)R (x,y)+I (x,y)R(u,v)+I(u,v)F F F =其中R(u,v),I(u,v)和L(u,v)分别是'R (x,y),'I (x,y)和'L(x,y)的傅里叶变换。

3. 抑制傅里叶域的低频分量H(u,v)L(u,v)H(u,v)R(u,v)+H(u,v)I(u,v)=其中H(u,v)是频率滤波器,低频部分系数比1小来抑制低频照射系数,高频部分为1以保证高频反射系数不变。

4. 进行傅里叶反变换'111''L(x,y)[H(u,v)L(u,v)][H(u,v)R(u,v)]+[H(u,v)I(u,v)]R (x,y)+I (x,y)F F F ---=5. 进行指数操作'''''L(x,y)exp[L(x,y)]exp[R (x,y)+I (x,y)]=exp[R (x,y)]exp[I (x,y)]R(x,y)I(x,y)=B. 特征提取特征提取的目的是提取特征向量或者代表面部的信息,特征提取的算法包括PCA 和LDA1) 主分量分析参考文献中【1】【2】【3】【5】中的主分量人脸识别主要是基于信息论的方法,它提取人脸图像的相关信息并尽可能的有效编码。

它构造出训练人脸图像数据空间的子空间并且去除像素间的相关性。

人脸图像的经典代表可以通过将图像投影到主分量构成的坐标系统来获得,这些投影完成信息压缩、去相关和降维,能够更好的做出决断。

在数学方面,人脸分布的主分量或者是人脸集合的相关矩阵的特征向量可以通过将图像看做一个高维空间向量来获得。

详细解释见参考文献【6】【12】【16】。

2) 线性判别式分析线性判别分析用于机器学习中发现一种很好的特征的线性组合,这种线性组合能够很好的将两类或多类物体或事件进行分类,这种线性组合叫做线性分类器。

它同样可以看做分类之前的特征降维,将多维空间映射到低维空间。

线性判别分析用于许多相关应用,其中之一就是人脸识别,分类前包含很多像素的每个人脸图像被减少到线性组合中的很少的集合中,运用LDA 获得的线性组合这种方法称为Fisher 线性分类器。

LDA 用于基于特征线性判别的人脸识别,将人脸图像数据投影到非零特征值相关的Fisher 面上,产生了能够进行判别的代表成分。

LDA 选择线性子空间φ来最大化以下比值T b T w S S φφφφ 类间散布度矩阵11()()c T b k k k S c μμμμ==--∑ 类内散布度矩阵11()()i k c T w i k i kk x c S x x M μμ=∈=--∑∑其中c 是客户数目,M 是人脸训练图像数目,i x ,μ是全局平均,k μ是k c 类的平均值。

直观上,LDA 是对数据投影的线性分类。

C. 分类子模块分类的目的是将测试数据空间的特征与模板中标号数据的离散集进行匹配。

分类方法包括人工神经网络、欧氏距离、相关系数法。

1)人工神经网络人工神经网络这种机器学习算法已经用于很多的模式分类问题,例如性别分类,人脸识别和面部表情分类。

人工神经网络分类器具有不可思议的归纳、学习能力。

它把特征矢量作为输入,把网络训练成能够分类的一种复杂映射,避免了简化分类的需要。

由于能够提供很好的归纳和学习能力,人工神经网络已经应用于人脸识别。

广泛应用的神经网络是多层前向神经网络。

多层前向神经网络是一种非线性网络,它包含一个输入集(组成输入层)、由非线性神经元组成的一个或多个隐藏层、一个由非线性神经元组成输出层,如下图2所示图2 多层前向神经网络由于有很强的适应非线性结构能力,多层前向神经网络是处理很多模式识别和衰退困难任务的理想方法。

对于特定任务训练网络,每个神经元的权重ij ω是根据有监督的学习算法(也叫误差逆传播)来确定的。

如图3所示,为了得到特定的输出,重复输入训练集中的数据给网络,并调整网络权重。

本质上是一种梯度下降法,当调整权重矩阵时,沿着最陡方向下降。

学习常量η必须很谨慎的选择,如果选的太大,算法会经常冲出解析解范围之外,导致慢收敛或者根本不收敛。

然而,如果选的太小,算法会很慢的接近解析解,同样导致慢收敛并且增加算法收敛到局部最小值的概率。

动量法和自适应学习这两种方法能够克服这种问题。

图3 BP 网络流程图对于动量法,如果我们一直沿着同样的方向,我们希望在这个方向上建立一些动量,可以使我们越过局部最小点并加快收敛速度。

标准:()()w t E t η∆=-∇动量法:()()(1)w t E t w t ηα∆=-∇+∆-其中α是动量参数。

对于自适应学习法,动态调整学习速率,通常以一个大的值开始,为了防止过冲当接近解析解时减小数值,训练的输入数据来自于特征提取模块的输出。

2)欧氏距离欧氏距离法是分类器中最平凡的,一般由下式来进行判决(,)E k d x w =当(,)E k d x w 低于阈值Ek τ客户就被接受,否则拒绝。

3)相关系数法相关系数法是基于下式做决定,如果(,)C k d x w 超出阈值Ck τ就接受。

1(,)T k C k kx w d x w x w =第四部分 实验结果这个实验的目的是评价通过光学归一化、同态滤波、和直方图均衡后人脸识别系统的性能。

人脸图像来源于图像数据库的人脸正面图,数据库中包含20个人,每个人10张人脸图像。

为了核实,使用了两种评价性能指标,分别是错误接受率和错误拒绝率。

错误接受率描述的是将非数据库中的人判为数据库中的,而错误拒绝率是将数据库中的判为非数据库中的人,公式如下:FAR=IA/I, FRR=CR/C其中IA 是错误接受数目,I 是非数据库中人脸的数目,CR 是拒绝的数据库中的人脸数目,C 是数据库中人脸数目。

相关主题