当前位置:
文档之家› 基于局部二值模式和深度学习的人脸识别
基于局部二值模式和深度学习的人脸识别
doi: 10. 11772 / j. issn. 1001-9081. 2015. 05. 1474
人脸识别供应商 QQ:1020659176
基于局部二值模式和深度学习的人脸识别
张 雯,王文伟*
( 武汉大学 电子信息学院, 武汉 430072) ( * 通信作者电子邮箱 wangww@ whu. edu. cn)
方向梯度直方图方法( Histogram of Oriented Gradient,HOG) 等。LBP 具有旋转不变性和灰度不变性,分类性能好,但是在 人脸的表达上具有较高的维数,影响识别速度。利用 Gabor 小波函数分析人脸图像[4] 主要有频率和方向信息两方面的 优点,但是在对人脸图像进行特征描述时利用多尺度和多方 法的 Gabor 特性,会使其特征向量有很高的维数,导致分类效 率低。HOG 是一种描述图像形状信息的特征提取方法,主要 描述人脸图像的轮廓信息,当人脸图像较为模糊时,性能大大 下降。
Key words: face recognition; Local Binary Pattern ( LBP ) feature; deep learning; deep belief network; feature extraction
0 引言
近年来,基于人脸特征描述和像素的人脸特征提取方法 都取得了优异的效果。子空间方法是基于像素的人脸特征提 取的典型代表,其主要方法包括主成分分析方法 ( Principal Component Analysis,PCA) 、线性判别方法( Linear Discriminant Analysis,LDA) 、独立成分分析方 法 ( Independent Component Analysis,ICA) 等。Sirovich 等[1]将 PCA 运用于人脸识别系统 中,且提出了经典的基于主成分分析的“特征脸( Eigenface) ” 方法。特征脸方法的应用大大降低了特征维度和图像像素之 间的相关性,但是由于 PCA 的降维方法本身不是以分类为目 的,单纯应用于 模 式 分 类 的 人 脸 识 别 中,效 果 并 不 是 特 别 理 想。LDA 利用 Fisher 鉴别准则函数[2] 寻找类内和类间散布 比值最大的一组空间变换关系。Belhumeur 等[3]结合 PCA 和 LDA 提出的 Fisher 脸方法解决了人脸识别的小样本问题,但 是样本类内散布零空间的许多鉴别信息却因此损失。ICA 是 基于样本的所有阶的统计信息,其统计特征相互独立,因此其 时间和空间复杂度均高于 PCA。而人脸特征描述方法主要包 括局部二值模式( Local Binary Pattern,LBP) 、Gabor 变换以及
Abstract: In order to solve the problem that deep learning ignores the local structure features of faces when it extracts face feature in face recognition, a novel face recognition approach which combines block Local Binary Pattern ( LBP) and deep learning was presented. At first, LBP features were extracted from different blocks of a face image, which were connected together to serve as the texture description for the whole face. Then, the LBP feature was input to a Deep Belif Network ( DBN) , which was trained level by level to obtain classification capability. At last, the trained DBN was used to recognize unseen face samples. On ORL, YALE and FERET face databases, the experimental results show that the proposed method has a better recognition performance compared with Support Vector Machine ( SVM) in small sample face recognition.
三代神经网络。其基本思想是设计一个包含多层的系统,前
由若干统计直方图表示。分块 LBP 直方图的提取过程如图 2
所示。
1) 对人脸图像进行分块,如 N × N。
2) 对分块后的子图像提取其 LBP,统计生成 LBP 直方图。
3) 将得到的多个 LBP 直方图按顺序相连,组成新的特征
向量。
图 2 基于 LBP 的人脸表达
在很多情况下,数据的主要信息都集中在主成分上,因此
收稿日期: 2014-11-26; 修回日期: 2015-01-09。 基金项目: 国家自然科学基金资助项目( 41371342) 。 作者简介: 张雯( 1989 - ) ,女,湖北随州人,硕士研究生,主要研究方向: 图像处理、智能识别; 王文伟( 1966 - ) ,男,湖南长沙人,副教授, 博士,主要研究方向: 图像处理、模式识别。
由 LBP 算子的定义可以看出,一个 LBP 算子产生的二进
制模式的个数取决于邻域集的采样个数,例如 LBPP-R 会产生 2P 种模式。随着邻域采样点数目的增加,产生的二进制模式 种类呈几何增长。为此 Ojala 等[9]提出了等价模式来解决二
进制模式过多的问题,相应的
LBP
算子表示为
LBP
u2 P-R
关键词: 人脸识别; 局部二值模式特征; 深度学习; 深度信念网络; 特征提取 中图分类号: TP391 文献标志码: A
Face recognition based on local binary pattern and deep learning
ZHANG Wen, WANG Wenwei*
( School of Electronic Information, Wuhan University, Wuhan Hubei 430072, China)
根据实际需要,为适应不同尺度的纹理特征,将 3 × 3 的 矩形邻域扩展为任意邻域,得到可变区域 LBP。如果用 P 表示 邻域点的个数,R 表示圆形邻域的半径,新的 LBP 算子表示为 LBPP-R 。常 见 的 LBP 算 子 有 LBP4-1 、LBP8-1 、LBP8-2 和 LBP16-2 等[8]。图 1 是 4 种不同的 LBP 算子。
以上传统的特征提取技术在人脸特征的表示中均有不错 的效果,但是在特征提取中都介入了许多主观因素,特征提取 的好坏依赖于人工选择。2006 年 Hinton 首次提出深度学习 ( Deep Learning) 的概念,它通过组合低层的特征来形成更抽 象的 高 层 表 示[5],模 拟 大 脑 的 学 习 过 程。 文 献 [6]的 DeepFace 算法通过对 400 万张图片分析找出关键的定位点并 进行 3D 建模,利用 9 层深度神经网络对非限制条件下的人 脸库进行训练,将 2D 对齐的 RGB 图像训练的模型和灰度图 像训练的模型以及 3D 对齐的 RGB 图像训练的模型相结合, 通过支持向量机( Support Vector Machine,SVM) 学习融合参
图 1 尺度为( P-R) 的改进 LBP 算子
P -1
∑ LBP 算子由 公 式 LBPP-R = s( gi - gc ) 2i 得 出,其 中 i =0
{ s( x) =
1, 0,
x x
≥ <
0 0,gc
为中心像素灰度值,gi (
i
= 0,1,2,…,
P - 1) 表示半径为 R 的圆形邻域上的像素灰度值。
1. 1 基于 LBP 的人脸表达 LBP 是一种纹理描述算子。该算法的基本原理是选取图
像的中心像素作为阈值,通过比较邻域内的像素灰度值,得到 二进制码,图像的局部纹理特征便用此二进制码来描述。具 体计算方法为小于阈值的像素值记为 0; 反之,则记为 1。依 次读取该二进制码,按位加权转换为十进制数,该值即为中心 点的 LBP 值。LBP 算子自提出后不断被改进优化,例如可变 区域 LBP、旋转不变的 LBP、均匀 LBP 等[7]。
采用 PCA 算法不仅能降低特征向量维度,还能消除信息的冗
余度和噪声。文献[11]中实验表明,在对人脸进行 LBP 特征
提取后,采用 PCA 算法对提取的分块 LBP 直方图向量进行降
维,可有效降低计算复杂度,且仍能保证较高的识别率。
1. 2 深度学习模型
深度学习是一种非监督学习的特征提取过程,可称为第
摘 要: 针对人脸识别中深度学习直接提取人脸特征时忽略了其局部结构特征的问题,提出一种将分块局部二 值模式( LBP) 与深度学习相结合的人脸识别方法。首先,将人脸图像分块,利用均匀 LBP 算子分别提取图像各局部 的 LBP 直方图特征,再按照顺序连接在一起形成整个人脸的 LBP 纹理特征; 其次,将得到的 LBP 特征作为深度信念 网络( DBN) 的输入,逐层训练网络,并在顶层形成分类面; 最后,用训练好的深度信念网络对人脸样本进行识别。在 ORL、YALE 和 FERET 人脸库上的实验结果表明,所提算法与采用支持向量机( SVM) 的方法相比,在小样本的人脸识 别中有很好的识别效果。
Journal of Computer Applications 计算机应用,2015,35( 5) : 1474 - 1478
ISSN 1001-9081 CODEN JYIIDU