当前位置:文档之家› 多尺度PCA及其应用综述

多尺度PCA及其应用综述

基于Gabor特征的人脸识别算法的研究摘要:Gabor特征能从不同方向和尺度有效表示人脸图片的局部特征,但是利用传统Gabor特征的方法却忽略原始人脸图片所包含的全局特征.文中把Gabor特征和原始图片信息结合起来,构成增强的Gabor特征,并结合直接分步线性判别分析算法,提出一种人脸识别方法.在Yale、ORL和Georgia Tech人脸库的仿真实验结果表明,相对于传统Gabor特征,增强Gabor特征能够有效提高人脸识别率.关键字:Gabor,人脸识别近些年,“生物特征识别技术”因其良好的安全性越来越多地应用于身份识别,人脸识别技术因造价低、使用友好等优点成为其中很有前景的一部分。

由于在一个场景中找到一张脸并且识别它的能力在人类生活中是很重要的,因此将这项任务自动化是非常有意义的。

人脸识别是一个非常具有挑战性的问题。

首先因为人脸图像的获取过程不同,导致二维图像信息在质量、几何、光线上都有内在的不同,此外还有脸部受到遮挡和化妆等因素的影响。

但是,更内在的原因是,人脸是具有高度相似性的非刚体。

人脸不同于普通物体,不同人的脸具有高度的相似性,同一人的脸又具有不同的状态,这使得人脸识别问题不同于普通物体的识别问题。

目前,许多研究机构致力于这一领域的研究,取得了丰硕的理论成果并有不同的应用软件应运而生。

人脸识别领域中,判别主成分分析算法是最有效的算法之一。

主成分分析(PCA)基于人脸的全局特征,不能有效提取局部特征。

局部特征分析(LFA)可以提取人脸图像的局部特征,但由于人脸特征点定位不准确通常会导致系统性能下降。

与图像灰度信息特征相比,Gabor特征通常具有更好的鲁棒性。

.生物学研究发现H J,Gabor小波可较好地模拟大脑皮层中简单细胞感受野的轮廓,能够捕捉空间定位、方向选择等视觉属性.特别是Gabor小波可像放大镜一样放大灰度的变化,人脸的一些关键功能区域(眼镜、鼻子、嘴、眉毛等)的局部特征被强化,从而有利于区分不同的人脸图像.因此,Gabor小波特征在人脸识别领域得到广泛应用,如弹性图匹配旧J、基于Gabor特征的增强Fisher判别分析局部Gabor直方图序列等.但是,这些方法往往只利用Gabor 特征,捕获人脸图像的局部特征,却忽略人脸图像原始的灰度值信息所代表的全局特征.1.Gabor算法的实现与原理分析1.1Gabor算法的分类和实现原理1.11EGM算法EM 算法是 Dempster,Laind,Rubin 于 1977 年提出的求参数极大似然估计的一种方法,它可以从非完整数据集中对参数进行 MLE 估计,是一种非常简单实用的学习算法。

这种方法可以广泛地应用于处理缺损数据,截尾数据,带有讨厌数据等所谓的不完全数据(incomplete data)。

假定集合Z = (X,Y)由观测数据 X 和未观测数据Y 组成,Z = (X,Y)和 X 分别称为完整数据和不完整数据。

假设Z的联合概率密度被参数化地定义为P(X,Y|Θ),其中Θ表示要被估计的参数。

Θ的最大似然估计是求不完整数据的对数似然函数L(X;Θ)的最大值而得到的:L(Θ; X )= log p(X |Θ) = ∫log p(X ,Y |Θ)dY ;EM算法包括两个步骤:由E步和M步组成,它是通过迭代地最大化完整数据的对数似然函数Lc( X;Θ )的期望来最大化不完整数据的对数似然函数,其中:Lc(X;Θ) =log p(X,Y |Θ) ;假设在算法第t次迭代后Θ获得的估计记为Θ(t ) ,则在(t+1)次迭代时,E-步:计算完整数据的对数似然函数的期望,记为: Q(Θ |Θ (t) ) = E{Lc(Θ;Z)|X;Θ(t) };M-步:通过最大化Q(Θ |Θ(t) ) 来获得新的Θ。

EM算法的主要目的是提供一个简单的迭代算法计算后验密度函数,它的最大优点是简单和稳定,但容易陷入局部最优。

1.12AdaGabor算法当然了,在这三个算法基础上,又有许多的算法被提出,但万变不离其宗,都是这三种方法的变形。

值得一提的是,Shan等人提出了一种Gabor直方图法来进行人脸特征提取,这种算法的思路和前面方法完全不同了,实质是对Gabor 特征进行量化,然后统计直方图,利用直方图做识别。

实际上,利用直方图特征进行模式识别并非这种算法首次提出的,早在1991年,就有人把它应用到三维物体识别中,而且在这种算法之前,人脸识别中也有了LBP直方图法,Gabor直方图方法只不过是把它和Gabor结合在一起,并应用到人脸识别中了。

Gabor直方图方法在人脸识别中获得了很高的识别率。

无论是三种经典的Gabor算法还是Gabor直方图在进行特征提取时,只用到了Gabor幅值信息,而没用相位信息,而Oppenheim等人的研究表明,对图像进行傅立叶变换后,其相位谱里包含了更多由助于分类的信息,Hayes等利用相位谱进行了图像重构,获得了较好的效果。

既然傅立叶变换的相位谱里边包含了重要的分类信息,Gabor变换最为一种特殊的傅立叶变换,它的相位信息也应该是有用的,正是基于这个背景,融合相位信息的Gabor直方图算法被提出,这种算法同时利用了相位和幅值进行人脸识别,获得优于传统Gabor直方图算法的识别率。

1.2 Gabor算法的技术分析基于二维Gabor小波的人脸识别算法先对人脸图像进行多分辨率的Gabor 小波变换,然后在图像上放置一组网格结点,每个结点用该结点处的多尺度Gabor幅度特征描述,采用主元分析法对每个结点进行去相关、降维,最后形成特征结。

把每个特征结作为观测向量,对隐马尔可夫模型进行训练,并把优化的模型参数用于人脸识别。

实验结果表明,该方法识别率高,复杂度较低Gaobr基函数波形类似人视觉皮层简单细胞的感受野波形的特性,视觉通道中心频率对数频程特性和视觉方向选择特性,从时空多通道模型角度出发,提出一种基于三维塔式Gabor变换的视频水印算法.该算法模型把视频序列看作三维信号,区别于那些把视频序列当作独立的二维图像序列,然后分别用图像水印算法把水印隐藏在每帧图像的视频水印算法,而且该模型尽可能充分地体现了人类视觉的各种生理特性.实验表明,该水印算法具有较强的鲁棒性和较好的不可感知性根据模拟人类视觉系统而产生。

通过模拟人类视觉系统,可以将视网膜成像分解成一组滤波图像,每个分解的图像能够反映频率和方向在局部范围内的强度变化。

通过一组多通道Gabor滤波器,可以获得纹理特征Gabor变换的根本就是Gabor滤波器的设计,而滤波器的设计又是其频率函数(U,V)和Gauss函数参数(一个)的设计。

实际上,Gabor 变换是为了提取信号Fourier 变换的局部信息,使用了一个Gauss 函数作为窗函数,因为一个Gauss 函数的Fourier 变换还是一个Gauss 函数,所以Fourier 逆变换也是局部的。

通过频率参数和高斯函数参数的选取,Gabor 变换可以选取很多纹理特征,但是Gabor 是非正交的,不同特征分量之间有冗余,所以在对纹理图像的分析中效率不太高。

2. 人脸图像的Gabor 特征二维Gabor 小波的定义为:()()⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡--⋅⎥⎥⎦⎤⎢⎢⎣⎡-=2e x p e x p 2e x p ,222222σσσκψi k z z k kz 式中: 是与小波频率带宽有关的常数; 为空间位置坐标; 确定了Gabor 内核的方向和尺度。

在采用8个方向和5个尺度的采样时,某人方向和尺度上的 可以写为 。

其中 为采样尺度, 为尺度标号; 为采样方向, 为方向标号。

为最大频率, 是频域中的内核间隔因子。

令参数 、 、 ,可以获得较好的小波表征和辨别效果。

Gabor 变换与Gabor 内核的卷积为: ()()()z k z z J k ,ψ*I = 定义Gabor 特征和在不考虑相位差时的相似性为:()()∑∑∑⎪⎭⎫ ⎝⎛''='K K K K KK K A A A A A J J S 22, 在提取人脸图像的Gabor 特征时,通常采用多个在不同尺度和方向上的Gabor 滤波器组成滤波器组,并根据图像的特点和神经生理学的结论来选择参数。

通常研究采用共包括8个方向和5个尺度的Gabor 滤波器组,并令 ,使滤波器的带宽约为1倍频程。

由于Gabor 特征具有良好的空间局部性和方向选择性,而且对光照、姿态具有一定的鲁棒性,因此在人脸识别中获得了成功的应用。

然而,大部分基于Gabor 特征的人脸识别算法中,只应用了Gabor 幅值信息,而没有应用相位信息,主要原因是Gabor 相位信息随着空间位置呈周期性变化,而幅值的变化相对平滑而稳定。

所以本论文将输入图像依次与滤波器组的各个滤波器进行卷积,并取其幅值作为输出,即,()()()dr r I r r G r R K K ,0,0,⎰±±=,2,2,-+=K K K R R R设图像的大小为 ,通过40个滤波器得到Gabor 特征的维数高达 ,计算量很大,且由于Gabor 特征在相邻像素间是高度相关和冗余的,所以通常只需要稀疏的提取部分节点上的Gabor 特征。

一个人脸图像经Gabor 变换后就得到幅值特征和相位特征的维数都是 ,计算量很大,而且Gabor 特征在相邻像素间是高度相关的,所以必须对Gabor 特征进行降维。

本论文所采用的降维方法就是对Gabor 变换系数进行简单的下采样,如对Gabor 特征进行固定行固定列均匀分布采样。

提取单幅人脸图像的Gabor 特征的基本步骤如下:(1)划分Gabor特征的采样点本论文划分的采样点的个数为40*30 =1200个,采样点数目较多,目的是为了得到更加清晰的Gabor图像。

划分采样点后的人脸图像如图2.2所示:图2.2(a)原人脸图像图 2.2(b)划分采样点后的人脸图像由于得到的Gaobr特征的维数较大,下面实验将采用均匀下采样对Gaobr 特征进行处理,从而达到降维的目的。

(2)提取人脸图像的Gabor特征本文采用40*30 =1200个规则分布的采样点,在采样点上提取各个滤波器输出的值,联合起来组成列向量,从而得到每幅图像的Gabor特征向量,并以此作为该人脸图像的局部特征向量。

得到的人脸图像的Gabor特征如下图所示:图2.3(a)单幅人脸图像的Gabor幅值特征图2.3(b)单幅人脸图像的Gabor 相位特征由以上图像可见,与原图灰度值随位置的变换相比,滤波器输出的幅值随位置的变化要更小更不敏感;Gabor相位信息随着空间位置呈周期性变化,而幅值的变化相对平滑而稳定。

因此,即使采样点稍有偏移也不会使提取出的特征值发生太大变化。

相关主题