当前位置:文档之家› 基于深度学习算法的图像集识别

基于深度学习算法的图像集识别

文章编号:1007—1423(2017)21—0026—05 DOI:10.3969/j.issn.1007—1423.2017.21.005 

基于深度学习算法的图像集识别 

张玉冰,于威威 

(上海海事大学信息工程学院,上海201306) 

摘要: 

深度学习技术是机器学习技术的新发展。它结合机器学习中神经网络的特点,通过构建多隐层的网络结构,实现对 

人脑网络的模仿。结合生物仿生学的研究,模拟人脑进行模式识别,包括文字,图像及声音等的特征提取及分类。深 

度学习网络由于包含多层中间隐层,所以对输入数据能逐级提取从底层到高层的特征,从而能很好地建立从底层信 

号到高层语义的映射关系。在图像识别领域,卷积神经网络表现优异。但传统的卷积神经网络的训练速度过慢。自 

动编码机可以实现图像的压缩和解释。为提高速度,结合卷积神经网络和自动编码机提出~种针对图像新的识别方 

式。将图像先经过自动编码机进行初步特征提取,再结合卷积神经网络对图像集进行识别。与已有的识别算法相比 

较,提高识别速度,保证识别率。 

关键词: 

深度学习;卷积神经网络;图像识别;自动编码机;特征提取;图像预处理 

0 引言 

深度学习技术是机器学习技术的新发展。它结合 

机器学习中神经网络的特点,通过构建多隐层的网络 

结构,实现对人脑网络的模仿。结合生物仿生学的研 究,模拟人脑进行模式识别。包括文字,图像及声音等 

的特征提取及分类。深度学习是无监督学习的一种 。 

深度学习起源于神经网络,它是神经网络的深度 

延伸。神经网络中也包含深度学习的结构,如含多隐 

层的多层感知器。深度学习的原理是通过对原识别目 

标的低层特征进行提取和组合,最终生成目标内含的 

深层次的特征或属性。通过这种方式,可以探究数据 

或图像中深层次的特征 。 

深度学习的根本目的就是通过大量的数据样本来 

进行学习,借助多隐层的深度网络结构,来提取到更有 

用的特征,从而最终实现对目标的分类,并且提高分类 

成功率。深度学习与传统的浅层神经网络的不同,主 

要包含以下几个方面:(1)深度学习强调深度这个概 

念,其网络的中间隐层一般有3层以上,多的甚至达到 

10层以上的中间隐层;(2)深度学习强调了对特征的学 

囝 现代计算机2017.07下 习,它将目标中的低层特征进行提取,然后经过低层特 

征的不同组合,形成目标内在不易发现的深层次特征, 

模拟人脑的学习方式,最终提高分类的准确性。相比 

于传统的神经网络,通过大量数据进行学习,并对其深 

层的特征进行构造和分类,深度学习网络更能揭示数 

据的内在信息 。 

当前深度学习已经有很多模型和算法,包括最基 

础的深度网络结构自动编码器(AutoEncoder),以及对 

自动编码机进行改动和提升的稀疏自动编码器 

(Sparse AutoEncoder),降噪自动编码器(Denoising Au. 

toEncoders)等,还包括深信度网络(Deep Belief Net— 

work),以及卷积神经网络(Convolutional Neural Net. 

works)等。在这其中,卷积神经网络由于其特殊的构造 

方式,为模式识别领域(包括文字识别,图像识别,语音 

识别等)带来了福音。它的优点包括在网络结构当中 

使用权值共享机制,对于同一个神经元的权值,在不同 

的区域进行权值共享。通过这种方式可以有效地减少 网络当中权值的数量,简化网络结构。另外对于卷积 

神经网络来说可以将图像进行简单的处理之后直接输 , 图形图像 / 

入 络进行 、 : ,这洋姚不需 像传统的算法那佯仃 

复杂的预处 (包括特f 提取戒数 重组) 卷积网络 垃一个多 感 器 ,专门为}jl 5J,J二维形状而特殊没 

汁这种网络结卡勾对平移、倾斜、比例缩放或者其他形 

的l欠I像变形 仃高度不变性flf传统的卷积神经 

络对丁尺寸们大的输人 像,将会化 _卡闩 久的圳练 

时问 

冈此,本义 占合[j动编百J5机刈‘ 像特征的良好 

,提¨1了堆1 AE改进的卷f!{}I{j经 络方法..通过 

AE的一步简 特 提取,大大减少r『冬{像的维度.!lIj. 著缩短J CNN的训练过程,简化J 网络结卡勾,提 j 

以圳效率 i、 

1 基于自动编码机的改进卷积神经网络 

1.1自动编码器(AutoEncoder,AE) 

AE属丁无监督学习,不需 埘训练样本进,于标 

记、AE F扫 』 叫络组成,其一11输入 冲经元数量 j输 

…层冲经元数f ff1等.一…1司层冲 J 数 少于输入 

和输…层 帑训练期间, 个圳练样本在经过 

络后,会存输 层J 个新的 0 AE学习的Ll的 

就足使输出 Jj输入信号尽 卡}1似 

AE训练结束之后,共包括llij部分,输入层和r…1_I=J 

层.我们Ljf以川这 来对信 进行爪缩;其次是 l1I' ̄-i】 

层和输出 ,找f『J可以川这两J 将 缩的信号进仃 

还原 

自动编 机 理『上ll下:假没我f『J输入一个I1维的 

信号 ( ∈【01 lI),绎…输入层到达一I IY,J层,信号变为y, 

呵以 L}j如下公』 (1) ,J : 

1= { 、+『J) (I) 

以上式 ・ft的s是非线性 数, sigmoid.W址输 

人 到巾『nJ J 的卡义值,b为巾 J J 的编置(bias), 缩 

后的信号v,ifj ̄过解码层进行 ,之 输…到‘j输 

入相 数量的t 个}I11绎厄所构成的输…层 假设 十勾 

之J1彳的信号为Z,『J!IJ 式(2)女【j : 

:= ( 、+6 ) (2) 

同上,s为1卜线性 数,例 sigmoi,1 数 I1_- 代 

表-卜 层到输 的链接卡义伉 ^ 代表『fJ问层的偏 

(h 公J=I==结 z被认为是通过网 解析后对x的 

・个预测.. ・股从为,权重矩 破没定为 的转 

: = .门动编码机结构 l所示 1.2卷积神经网络(cNN) 

卷fj5f4I绎网络(CNN)址 度学习r”的一种,炎似 

丁人工冲 网络 已成为 1前讲 分析和 像 l圳 

领域的研究热点 它在网络结构当lfl使川权fIIc ‘ 机 

制,对于 一个神经元的权ffc, 不 的 域进行权价 

共亭j减少了杖值的数 .f1.它¨r以将 像进行简 . 

的处理之 Il{=接输入网络进行学习,这样就不 ^ 像 

传统的钟:法JJI;佯_仃复杂的颅处 (包括特征提取 戈数 

据重组y,I CNN主要用来IJ j位移、缩放及J 他彤 

扭}¨1不变一Ft-的二维 形{Jf f}l丁 一特征映射 I 

的}申经几权值州同,所以网络I,'『以外行学习,这也址毪 

积 络十¨对'J 神经兀做JJ:l:af.连网络[19--大优势 

卷 flII 网络的组成为第一层的输入层.・t l:接 

像作为输入,也可以魁提取 的特征一之 的J 为卷积J 1池化层I 交替}}l观,术对输入进行特 的提 

取,最后址一刽I 全连接J ,将特 连接为K : 输 

入到分类器IIl进行分类, SoftIIILIX ;签积神 网络 

结构如【冬l 2彤 刁i 

1.3基于自动编码机的改进卷积神经网络 

] rt动编码机可以j14好地f 缩 像的特 .所 

以我们II『作『』1I卜改进 以_r.0 数宁数据集mnist 例, 

初始罔像大小为28x28 步骤为: 

(1)沟建-・个28一l8—28的『l动编 机 

(2)将『殳l像输入『1动编码饥进行iJIl练, : 十 

现代计算机2017.

07下 囝 值W。 (3)将训练好的自动编码机的中间层连接到卷积 

神经网络的输入层。 (4)对卷积神经网络进行训练,由于维度变低,所 

以训练时问大大缩短。 

(5)训练完成,即可进行图像分类识别。 

图2卷积神经网络结构 

改进算法结构如图3所示。 

图3基于自动编码机的改进CNN算法 

@ 现代计算机2017。07下 2 实验结果与分析 

2.1数据预处理 

本节主要介绍算法数据预处理过程,为产生更有 

效的实验结果,采用两个数据集进行对比实验分析。 

Mnist数据集,mnist手写数字集是LeNet一5算法 

的经典数据集I 。 

部分ImageNet数据集,ImageNet数据集是ILS— 

VRC比赛用数据集,属于自然数据集。由于原hna. 

geNet数据集过大,所以为更快显示实验对比结果,从 

中截取了部分图像,共5类,每类200张图像,尺寸统 

一为64x64。 

2.2算法实现与比较 

实验环境:Intel酷睿i7 CPU,内存4G,Winl0 64 

位,编程环境为MATLAB R2015a 

实验数据:mnist手写数字集、imagenet数据集 

比较算法:卷积神经网络算法、基于自动编码机的 

改进卷积神经网络算法 

(1)mnist数据集 

对于mnist数据集,构建的卷积神经网络结构为, 

输入层大小为28x28的,卷积层1提取6组特征罔IIIl, 

卷积核大小为5x5,池化层J比例为1:2,卷积层2提取 

12组特征图,卷积核大小为5x5,池化层2比例为1:2, 

顶层使用sigmoid做分类器 。 

构建改进算法结构为,自动编码机结构为28—18— 

28,CNN输入层为18x18,卷积层1为提取6组特征 

图,卷积核大小为3x3,池化层l比例为1:2,卷积层2 

为提取12组特征图,卷积核大小为3x3,池化层2比例 

为l:2,顶层使用sigmoid做分类器。 

进行一次迭代,算法实验结果如下: 

表1 n1nist数据集实验结果 

由上表“J ,仳mmst姒惦朱垄彻上,改进算法所 

花时间要稍长于原算法,准确率方面相差不大。原因 

是对于小尺寸的图像集,进行自动编码机训练所花的 

时间要长于因为特征提取而缩短的训练13寸间。 

(2)ImageNet图像集 

对于ImageNet图像集,构建的卷积神经网络结构

相关主题