基于改进AlexNet卷积神经网络的手掌静脉识别算法研究作者:林坤雷印杰来源:《现代电子技术》2020年第07期摘 ;要:在手掌静脉图像采集的过程中易受手掌摆放姿势、光源条件等外界因素的影响,造成识别准确度欠佳。
为了提高手掌静脉图像识别的精准度和鲁棒性,提出一种基于改进AlexNet深度卷积神经网络的手掌静脉识别方法。
该方法首先通过图像分割、指根关键点定位、感兴趣区域图像提取等三个阶段对采集的手掌静脉图像进行预处理;其次,针对人体手掌静脉识别的应用场景,通过适当调整经典的AlexNet卷积神经网络的结构并对卷积层的输出进行批标准化操作,同时,将深度学习理论中的注意力机制应用到该网络中,进而优化AlexNet 神经网络,使用优化后的AlexNet神经网络对预处理后的图像自动进行特征提取、分类和识别;最后,在公开的Polyu和CASIA多光谱掌纹数据集上进行大量的实验,达到的最佳识别率分别为99.93%和99.51%,实验验证了所提方法的有效性。
关键词:手掌静脉识别; AlexNet神经网络优化; 图像特征提取; 图像预处理; 注意力机制应用; 有效性验证中图分类号: TN911.73⁃34; TP391.4 ; ; ; ; ; ; ; ; ;文献标识码: A ; ; ; ; ; ; ; ; 文章编号:1004⁃373X(2020)07⁃0052⁃05Research on palm vein recognition algorithm based onimproved AlexNet convolution neural networkLIN Kun, LEI Yinjie(Institute of Intelligent Control, College of Electronics & Information Engineering, Sichuan University, Chengdu 610036, China)Abstract: In the process of palm vein image acquisition, palm vein images are susceptible to external factors like palm posture and light source conditions, which will result in poor recognition accuracy. Therefore, a palm vein recognition method based on improved AlexNet depth convolution neural network is proposed to improve the accuracy and robustness of the image recognition. Firstly,the collected palm vein image is preprocessed by image segmentation, finger root key point location and image extraction in the region of interest (ROI). Secondly, according to the application context of palm vein recognition, the classical AlexNet convolution neural network structure is adjusted appropriately, and the output of convolution layer is standardized in batches. The attention mechanism in deep learning theory is applied to the above⁃mentioned network to optimize the AlexNet neural network. The optimized AlexNet neural network is used to automatically extract,classify and identify the features of the preprocessed images. A large number of experiments were performed on public PolyU and CASIA multispectral palmprint datasets. The optimal recognition rates are 99.93% and 99.51% respectively. The experiments verify the effectiveness of this method.Keywords: palm vein recognition; AlexNet neural network optimization; image feature extraction; image preprocessing; attention mechanism application; effectiveness verification0 ;引 ;言隨着社会的进步和经济的不断发展,基于特征物品(如身份证、钥匙等)和特定知识(如用户名和密码、U盾、IC卡等)的传统身份鉴别方法面临着挑战。
特别是在网络社会的今天,人们对于身份鉴别技术的可靠性、安全性有了更高的要求。
而基于人的一个或多个身体特征(如人脸、指纹、虹膜、静脉、DNA等)和行为特征(如笔迹、步态、声纹等)的生物特征识别技术[1](Biometrics)为身份鉴别领域提供了一个有效、可靠的解决方法。
手掌静脉识别[2]是利用隐藏在人体手掌表皮下的静脉纹理进行身份鉴别。
基于手掌静脉的生物特征识别具有广泛的应用前景,也得到了相关研究人员的广泛关注。
基于人工提取图像特征和机器学习的思路取得了很多成果,其大多数方法可分为以下三类:基于结构特征的方法、基于子空间特征方法和基于纹理特征方法。
基于结构特征的方法对图像质量的依赖性较大,容易因图像质量的下降而丢失大量结构信息;基于纹理特征的方法易受手掌静脉纹理的丰富度和清晰度的影响;基于子空间特征的方法目前研究相对较少,其准确性和鲁棒性有待进一步探讨。
近年来,深度卷积神经网络被广泛应用到计算机视觉任务中,与基于人工提取手掌静脉图像特征和使用机器学习算法进行识别的思路不同,深度卷积神经网络(Deep Convolutional Neural Network,DCNN)不需要人工提取图像特征信息,可以从大量的训练样本学习到合适的网络参数。
使用训练后的深度卷积神经网络可以对输入图像提取深层次特征信息,并进行分类和识別。
基于此,本文提出一种基于改进AlexNet深度卷积神经网络的手掌静脉识别方法。
通过在基准数据集上的实验,该方法具有很好的有效性和鲁棒性。
1 ;手掌静脉图像预处理受手掌摆放姿势、光照条件等因素的影响,采集到的原始手掌静脉图像质量不一,需要对原始图像进行预处理以方便后续的特征提取和识别。
手掌的中心区域集中了手掌静脉图像的大部分有效特征,该区域即手掌静脉图像的感兴趣区域(Region of Interest,ROI)[3]。
图像预处理主要是对手掌静脉图像的感兴趣区域进行提取:一方面通过图像预处理消除了全局几何变换对识别的影响;另一方面,选取预处理后的ROI图像进行处理和识别,将大大减小图像处理部分的运算量和神经网络的深度。
本文提出一种详细的ROI提取方案,包括手掌图像分割、关键点定位和ROI提取三个阶段,具体包括图像剪裁、高斯平滑滤波、二值化、手掌分割、轮廓提取、质心定位、轮廓到质心距离计算、关键点定位、方向矫正、坐标系重建、ROI提取等11个步骤,如图1所示。
1.1 ;手掌图像分割首先剪裁掉原始手掌静脉图像中对识别并不需要的手腕区域,加快预处理速度;而后进行高斯平滑滤波去除噪声;最后对去噪后的图像进行二值化得到二值图像,并将二值化后图像与二值化前的图像进行与操作,从而分割出手掌图像。
1.2 ;关键点定位通过轮廓提取、质心定位、轮廓到质心的距离计算等步骤进行关键点定位。
1)轮廓提取:对二值化后的图像做轮廓检测。
检测出的轮廓中取最大轮廓,即手掌轮廓。
2)质心定位:根据手掌轮廓图像的矩计算出轮廓的质心,其计算公式如下:[M00=ijVi,jM10=iji⋅Vi,j, ; ; ;i∈I,j∈JM01=ijj⋅Vi,j] ; ;(1)[x=M10M00, ; ; y=M01M00 ] (2)式中:[I],[J]分别代表图像的横纵坐标集;[Vi,j]表示图像在点[i,j]上的灰度值;[M00],[M10],[M01]分别代表轮廓图像的零阶矩、一阶矩和一阶矩;([x],[y])为质心坐标。
3)关键点定位:逆时针方向计算轮廓上的每个点到质心的距离,并以此作幅值图。
由手掌图像的特点可知,幅值图像的三个波谷即食指与中指、中指与无名指、无名指与小指之间的指根点。
取食指与中指、无名指与小指之间的指根点作为两个关键点。
1.3 ;ROI提取通过方向矫正、坐标系重建等步骤进行ROI提取。
1)方向矫正:以直线连接两个关键点,旋转图像至该直线的角度为0°。
2)坐标系重建:两个关键点连线为[x]轴,连线中点为原点,垂直平分线为[y]轴重建坐标系。
在重建后的坐标系中在[x]轴上方,[y]轴两侧提取出固定大小的矩形ROI区域。
2 ;改进的AlexNet卷积神经网络2.1 ;AlexNet神经网络AlexNet是深度学习经典的基础网络之一,由Hinton和他的学生Alex Krizhevsky于2012年提出,其主要结构为8层深度神经网络,包括5层卷积层和3层全连接层,不计入激活层和池化层。
AlexNet卷积层中使用ReLU函数作为激活函数,而不是之前网络中广泛使用的Sigmoid 函数,ReLU函数的公式为:[fx=0,; ; x≤0x, ; ; x>0] (3)ReLU函数的引入解决了在神经网络较深时的梯度弥散问题。
此外,AlexNet神经网络在卷积层中使用最大池化的方法对卷积层输出的特征图进行下采样,而不是此前普遍使用的平均池化。
因此,AlexNet神经网络比之前的神经网络具有更优异的性能。
2.2 ;注意力机制计算机视觉中的注意力机制(Attention Mechanism)[4⁃5]借鉴了人类的大脑在处理视觉信息时的注意力集中机制,即能够忽略无关信息而更多地关注重点信息。