基于深度卷积神经网络的人脸识别研究
深度卷积神经网络主要应用包括语音识别、图像处理、自然语言处理等。
本文就当前大环境下研究了卷积神经网络模型在静态环境下人脸识别领域的应用。
卷积神经网络模型需要设计一个可行的网络模型,将大量的人脸训练数据集加载到网络模型中,然后进行自动训练,这样就可以得到很好的识别率。
把训练好的模型保存下来,那么这个模型就是一个端到端的人脸特征提取器。
该方法虽然操作简单,但是需要根据训练数据集设计合理的网络结构,而且最难的关键点是超参数的调整和优化算法的设计。
因此本文结合残差网络和融合网络构建了两个与计算资源和数据资源相匹配的网络模型,并通过反复调整超参数和调试优化器使其在训练集上能够收敛,最终还取得较好的识别率。
本文的主要研宄内容和创新点如下:
1.介绍了卷积神经网络的基础理论知识。
先从传统人工神经网络的模型结构、前向和反向传播算法进行了详细的分析;然后过渡到卷积神经网络的相关理论,对其重要组成部分如卷积层、激励层、池化层和全连接层进行了具体的阐述;最后对卷积神经网络训练时的一些注意事项进行了说明。
人工神经元是构成人工神经网络的基本计算单元,单个神经元的模型结构如下图所示。
其中,b
X
W
b
x
w
Z T+
=
+
=∑1
1
1
)
(
)
(
,
z
f
x
h
h
w
=
x
x
x
x
x
e
e
e
e
z
z
f
e
z
z
f
-
-
-
+
-
=
=
+
=
=
)
tanh(
)
(
1
1
)
(
)
(σ
卷积神经网路的基本结构
简单的池化过程:
2.对深度学习框架TensorFlow的系统架构和编程模型作了一些说明,并对人脸数据进行预处理,包括人脸检测、数据增强、图像标准化和人脸中心损失。
TensorFlow的系统架构如下图所示
TensorFlow的编程模式
系统本地模式和分布式模式示意图
3.提出了基于改进的MyVGGNet和MySqueezeNet网络的人脸识别。
首先分析了模型VGGNet-16和SqueezeNe的网络结构及相关参数,然后本文提出将原VGGNet-16和SqueezeNe的网络结构和参数进行优化,并在每个卷积层和激励层之间添加批归一化层,在VGGNet-16网络末尾用1个1 * 1的卷积层代替三个全连接层,还增加全局平均池化层,得到新的MyVGGNet和MySqueezeNet模型,最后在LFW
数据集上分别获得94.3%和95.1%的准确率。
VGGNet-16 网络结构框图
MyVGGNet 网络框图
MyVGGNet网络训练时LFW测试集的准确率走势图
MyVGGNet网络在LFW上的ROC曲线图
4.提出了基于二叉树型融合网络BTreeFuseNet_v1和BTreeFuseNet_v2的人脸识别。
首先对深度神经网络的优化问题和融合原理作了分析;然后结合残差学习,融入分支并行、融合和级联三种结构,采用ReLU函数、BN层、Dropout层、哈维尔方法和截断高斯函数初始化方法、Adam优化器等技巧,构建了两个层次深度为22和19的网络模型BTreeFuseNet_v1和BTreeFuseNet_v2,并详细说
明了这两个网络模型的基本构成、整体架构和模型参数;最后在Facescmb数据集上连续训练,同时调整网络参数,获取较好的模型,再在LFW测试集上进行人脸验证,并且分别取得94.9%和95.5%的准确率。
BTreeFuseNet_v1和BTreeFuseNet_v2在LFW数据集上
的ROC曲线
在深度融合网络的基础上提出二叉树融合网络,并详细说明了该网络模型的基本构成、整体架构和模型参数,然后在FaceScrub数据集上训练,之后在LFW数据集上进行人脸验证,取得94.90%和95.50%的准确率,实现小数据集上比较高的识别率。