当前位置：文档之家› 基于深度学习算法的图像集识别

基于深度学习算法的图像集识别

文章编号：１００７—１４２３（２０１７）２１—００２６—０５　ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１００７—１４２３．２０１７．２１．００５　

基于深度学习算法的图像集识别　

张玉冰，于威威　

（上海海事大学信息工程学院，上海２０１３０６）　

摘要：　

深度学习技术是机器学习技术的新发展。它结合机器学习中神经网络的特点，通过构建多隐层的网络结构，实现对　

人脑网络的模仿。结合生物仿生学的研究，模拟人脑进行模式识别，包括文字，图像及声音等的特征提取及分类。深　

度学习网络由于包含多层中间隐层，所以对输入数据能逐级提取从底层到高层的特征，从而能很好地建立从底层信　

号到高层语义的映射关系。在图像识别领域，卷积神经网络表现优异。但传统的卷积神经网络的训练速度过慢。自　

动编码机可以实现图像的压缩和解释。为提高速度，结合卷积神经网络和自动编码机提出～种针对图像新的识别方　

式。将图像先经过自动编码机进行初步特征提取，再结合卷积神经网络对图像集进行识别。与已有的识别算法相比　

较，提高识别速度，保证识别率。　

关键词：　

深度学习；卷积神经网络；图像识别；自动编码机；特征提取；图像预处理　

０　引言　

深度学习技术是机器学习技术的新发展。它结合　

机器学习中神经网络的特点，通过构建多隐层的网络　

结构，实现对人脑网络的模仿。结合生物仿生学的研　究，模拟人脑进行模式识别。包括文字，图像及声音等　

的特征提取及分类。深度学习是无监督学习的一种　。　

深度学习起源于神经网络，它是神经网络的深度　

延伸。神经网络中也包含深度学习的结构，如含多隐　

层的多层感知器。深度学习的原理是通过对原识别目　

标的低层特征进行提取和组合，最终生成目标内含的　

深层次的特征或属性。通过这种方式，可以探究数据　

或图像中深层次的特征　。　

深度学习的根本目的就是通过大量的数据样本来　

进行学习，借助多隐层的深度网络结构，来提取到更有　

用的特征，从而最终实现对目标的分类，并且提高分类　

成功率。深度学习与传统的浅层神经网络的不同，主　

要包含以下几个方面：（１）深度学习强调深度这个概　

念，其网络的中间隐层一般有３层以上，多的甚至达到　

１０层以上的中间隐层；（２）深度学习强调了对特征的学　

囝　现代计算机２０１７．０７下　习，它将目标中的低层特征进行提取，然后经过低层特　

征的不同组合，形成目标内在不易发现的深层次特征，　

模拟人脑的学习方式，最终提高分类的准确性。相比　

于传统的神经网络，通过大量数据进行学习，并对其深　

层的特征进行构造和分类，深度学习网络更能揭示数　

据的内在信息　。　

当前深度学习已经有很多模型和算法，包括最基　

础的深度网络结构自动编码器（ＡｕｔｏＥｎｃｏｄｅｒ），以及对　

自动编码机进行改动和提升的稀疏自动编码器　

（Ｓｐａｒｓｅ　ＡｕｔｏＥｎｃｏｄｅｒ），降噪自动编码器（Ｄｅｎｏｉｓｉｎｇ　Ａｕ．　

ｔｏＥｎｃｏｄｅｒｓ）等，还包括深信度网络（Ｄｅｅｐ　Ｂｅｌｉｅｆ　Ｎｅｔ—　

ｗｏｒｋ），以及卷积神经网络（Ｃｏｎｖｏｌｕｔｉｏｎａｌ　Ｎｅｕｒａｌ　Ｎｅｔ．　

ｗｏｒｋｓ）等。在这其中，卷积神经网络由于其特殊的构造　

方式，为模式识别领域（包括文字识别，图像识别，语音　

识别等）带来了福音。它的优点包括在网络结构当中　

使用权值共享机制，对于同一个神经元的权值，在不同　

的区域进行权值共享。通过这种方式可以有效地减少　网络当中权值的数量，简化网络结构。另外对于卷积　

神经网络来说可以将图像进行简单的处理之后直接输　，　图形图像　／　

入　络进行　、　：　，这洋姚不需　像传统的算法那佯仃　

复杂的预处　（包括特ｆ　提取戒数　重组）　卷积网络　垃一个多　感　器　，专门为｝ｊｌ　５Ｊ，Ｊ二维形状而特殊没　

汁这种网络结卡勾对平移、倾斜、比例缩放或者其他形　

的ｌ欠Ｉ像变形　仃高度不变性ｆｌｆ传统的卷积神经　

络对丁尺寸们大的输人　像，将会化　＿卡闩　久的圳练　

时问　

冈此，本义　占合［ｊ动编百Ｊ５机刈‘　像特征的良好　

，提¨１了堆１　ＡＥ改进的卷ｆ！｛｝Ｉ｛ｊ经　络方法．．通过　

ＡＥ的一步简　特　提取，大大减少ｒ『冬｛像的维度．！ｌＩｊ．　著缩短Ｊ　ＣＮＮ的训练过程，简化Ｊ　网络结卡勾，提　ｊ　

以圳效率　ｉ、　

１　基于自动编码机的改进卷积神经网络　

１．１自动编码器（ＡｕｔｏＥｎｃｏｄｅｒ，ＡＥ）　

ＡＥ属丁无监督学习，不需　埘训练样本进，于标　

记、ＡＥ　Ｆ扫　』　叫络组成，其一１１输入　冲经元数量　ｊ输　

…层冲经元数ｆ　ｆｆ１等．一…１司层冲　Ｊ　数　少于输入　

和输…层　帑训练期间，　个圳练样本在经过　

络后，会存输　层Ｊ　个新的　０　ＡＥ学习的Ｌｌ的　

就足使输出　Ｊｊ输入信号尽　卡｝１似　

ＡＥ训练结束之后，共包括ｌｌｉｊ部分，输入层和ｒ…１＿Ｉ＝Ｊ　

层．我们Ｌｊｆ以川这　来对信　进行爪缩；其次是　ｌ１Ｉ＇￣－ｉ】　

层和输出　，找ｆ『Ｊ可以川这两Ｊ　将　缩的信号进仃　

还原　

自动编　机　理『上ｌｌ下：假没我ｆ『Ｊ输入一个Ｉ１维的　

信号　（　∈【０１　ｌＩ），绎…输入层到达一Ｉ　ＩＹ，Ｊ层，信号变为ｙ，　

呵以　Ｌ｝ｊ如下公』　（１）　，Ｊ　：　

１＝　｛　、＋『Ｊ）　（Ｉ）　

以上式　・ｆｔ的ｓ是非线性　数，　ｓｉｇｍｏｉｄ．Ｗ址输　

人　到巾『ｎＪ　Ｊ　的卡义值，ｂ为巾　Ｊ　Ｊ　的编置（ｂｉａｓ），　缩　

后的信号ｖ，ｉｆｊ￣过解码层进行　，之　输…到‘ｊ输　

入相　数量的ｔ　个｝Ｉ１１绎厄所构成的输…层　假设　十勾　

之Ｊ１彳的信号为Ｚ，『Ｊ！ＩＪ　式（２）女【ｊ　：　

：＝　（　、＋６　）　（２）　

同上，ｓ为１卜线性　数，例　ｓｉｇｍｏｉ，１　数　Ｉ１＿－　代　

表－卜　层到输　的链接卡义伉　＾　代表『ｆＪ问层的偏　

（ｈ　公Ｊ＝Ｉ＝＝结　ｚ被认为是通过网　解析后对ｘ的　

・个预测．．　・股从为，权重矩　破没定为　的转　

：　＝　．门动编码机结构　ｌ所示　１．２卷积神经网络（ｃＮＮ）　

卷ｆｊ５ｆ４Ｉ绎网络（ＣＮＮ）址　度学习ｒ”的一种，炎似　

丁人工冲　网络　已成为　１前讲　分析和　像　ｌ圳　

领域的研究热点　它在网络结构当ｌｆｌ使川权ｆＩＩｃ　‘　机　

制，对于　一个神经元的权ｆｆｃ，　不　的　域进行权价　

共亭ｊ减少了杖值的数　．ｆ１．它¨ｒ以将　像进行简　．　

的处理之　Ｉｌ｛＝接输入网络进行学习，这样就不　＾　像　

传统的钟：法ＪＪＩ；佯＿仃复杂的颅处　（包括特征提取　戈数　

据重组ｙ，Ｉ　ＣＮＮ主要用来ＩＪ　ｊ位移、缩放及Ｊ　他彤　

扭｝¨１不变一Ｆｔ－的二维　形｛Ｊｆ　ｆ｝ｌ丁　一特征映射　Ｉ　

的｝申经几权值州同，所以网络Ｉ，＇『以外行学习，这也址毪　

积　络十¨对＇Ｊ　神经兀做ＪＪ：ｌ：ａｆ．连网络［１９－－大优势　

卷　ｆｌＩＩ　网络的组成为第一层的输入层．・ｔ　ｌ：接　

像作为输入，也可以魁提取　的特征一之　的Ｊ　为卷积Ｊ　１池化层Ｉ　交替｝｝ｌ观，术对输入进行特　的提　

取，最后址一刽Ｉ　全连接Ｊ　，将特　连接为Ｋ　：　输　

入到分类器ＩＩｌ进行分类，　ＳｏｆｔＩＩＩＬＩＸ　；签积神　网络　

结构如【冬ｌ　２彤　刁ｉ　

１．３基于自动编码机的改进卷积神经网络　

］　ｒｔ动编码机可以ｊ１４好地ｆ　缩　像的特　．所　

以我们ＩＩ『作『』１Ｉ卜改进　以＿ｒ．０　数宁数据集ｍｎｉｓｔ　例，　

初始罔像大小为２８ｘ２８　步骤为：　

（１）沟建－・个２８一ｌ８—２８的『ｌ动编　机　

（２）将『殳ｌ像输入『１动编码饥进行ｉＪＩｌ练，　：　十　

现代计算机２０１７．

０７下　囝　值Ｗ。　（３）将训练好的自动编码机的中间层连接到卷积　

神经网络的输入层。　（４）对卷积神经网络进行训练，由于维度变低，所　

以训练时问大大缩短。　

（５）训练完成，即可进行图像分类识别。　

图２卷积神经网络结构　

改进算法结构如图３所示。　

图３基于自动编码机的改进ＣＮＮ算法　

＠　现代计算机２０１７。０７下　２　实验结果与分析　

２．１数据预处理　

本节主要介绍算法数据预处理过程，为产生更有　

效的实验结果，采用两个数据集进行对比实验分析。　

Ｍｎｉｓｔ数据集，ｍｎｉｓｔ手写数字集是ＬｅＮｅｔ一５算法　

的经典数据集Ｉ　。　

部分ＩｍａｇｅＮｅｔ数据集，ＩｍａｇｅＮｅｔ数据集是ＩＬＳ—　

ＶＲＣ比赛用数据集，属于自然数据集。由于原ｈｎａ．　

ｇｅＮｅｔ数据集过大，所以为更快显示实验对比结果，从　

中截取了部分图像，共５类，每类２００张图像，尺寸统　

一为６４ｘ６４。　

２．２算法实现与比较　

实验环境：Ｉｎｔｅｌ酷睿ｉ７　ＣＰＵ，内存４Ｇ，Ｗｉｎｌ０　６４　

位，编程环境为ＭＡＴＬＡＢ　Ｒ２０１５ａ　

实验数据：ｍｎｉｓｔ手写数字集、ｉｍａｇｅｎｅｔ数据集　

比较算法：卷积神经网络算法、基于自动编码机的　

改进卷积神经网络算法　

（１）ｍｎｉｓｔ数据集　

对于ｍｎｉｓｔ数据集，构建的卷积神经网络结构为，　

输入层大小为２８ｘ２８的，卷积层１提取６组特征罔ＩＩＩｌ，　

卷积核大小为５ｘ５，池化层Ｊ比例为１：２，卷积层２提取　

１２组特征图，卷积核大小为５ｘ５，池化层２比例为１：２，　

顶层使用ｓｉｇｍｏｉｄ做分类器　。　

构建改进算法结构为，自动编码机结构为２８—１８—　

２８，ＣＮＮ输入层为１８ｘ１８，卷积层１为提取６组特征　

图，卷积核大小为３ｘ３，池化层ｌ比例为１：２，卷积层２　

为提取１２组特征图，卷积核大小为３ｘ３，池化层２比例　

为ｌ：２，顶层使用ｓｉｇｍｏｉｄ做分类器。　

进行一次迭代，算法实验结果如下：　

表１　ｎ１ｎｉｓｔ数据集实验结果　

由上表“Ｊ　，仳ｍｍｓｔ姒惦朱垄彻上，改进算法所　

花时间要稍长于原算法，准确率方面相差不大。原因　

是对于小尺寸的图像集，进行自动编码机训练所花的　

时间要长于因为特征提取而缩短的训练１３寸间。　

（２）ＩｍａｇｅＮｅｔ图像集　

对于ＩｍａｇｅＮｅｔ图像集，构建的卷积神经网络结构

e商务文档

基于深度学习算法的图像集识别

相关文档推荐：