当前位置:文档之家› 基于深度迁移学习的图像分类研究

基于深度迁移学习的图像分类研究

2019年6月Jun.20191引言深度学习模式下的混合模型迁移图像分类算法,相较于以往单一的手工图像识别方法,其具备自动学习特征,但该算法所需时间比较长,模型中涉及到的数据量相对较大。

最新研究成果对卷积神经网络表现出的实际特征进行反卷积处理,将与之一一对应的输入刺激进行重新组织构建,在模型的支撑下,完成分析重构,对图片中刺激网络产生情况及特征进行探究,给出了具体的模型优化方法。

将受限玻尔兹曼机模型与卷积神经网络结合,对图像进行分类,准确率高,适应性强。

2图像分类和卷积神经网络概念2.1图像分类图像分类即借助计算机网络对图像进行自动分类,使其从属于各语义类别,在医疗、监控和信息检索等方面均得到了应用。

目前图像分类研究热点主要包含两个方面:(1)分类算法[1]研究成果有神经网络、决策树等,可以借助支持向量机使分类结果更加准确;(2)特征提取算法,采用SIFT方法、SURF方法、SPM 模型等加强图像特征识别。

但上述方法在图像特征提取时仅能获得底层特征,无法获得高级语义。

因此亟需探究全新的深度学习算法。

2.2卷积神经网络卷积神经网络应用原理为借助图像逐层抽取,获取结构化特征,用于对单幅图像高级语义进行表示。

层级越高,模型特征越抽象,更能够对图像主题进行展示,很大程度上提高了分类过程中的识别能力[2]。

受限玻尔兹曼机具有很强的无监督特征学习能力,能够从最大化对数似然的角度,学习输入数据规律,构建图像高级识别能力统计特征。

卷积神经网络对图像各层抽象时,每层都包含很多数字滤波器,以此为载体,把输入数据的典型特点作为提取对象,得出结构特征的同时,还要使其与图像高级语义相符合。

应用卷积神经网络进行图像识别,需要完成相基于深度迁移学习的图像分类研究栾庆磊(安徽建筑大学机械与电气工程学院,安徽合肥230601)摘要:提出一种基于受限玻尔兹曼机和卷积神经网络混合模型的迁移学习图像分类方法,该方法由其它两种模型特征的学习能力融合而来,把图像结构性高阶统计特征提取出来,进行主题分类。

算法实现过程为首先使用受限玻尔兹曼机替代卷积神经网络模型中的全连接层,并针对卷积神经网络型的小目标集形成新的功能结构,以目标集为载体,对受限波尔兹曼机层和Soft max层进行重新训练;其次该过程中采用BP 算法对相关参数予以调整,受限玻尔兹曼机层关联maps的同时,还从最大对数似然的角度完成目标集统计特征的学习,有效地防止了数据集差异条件对迁移学习特征的负面影响,保证了数据学习的合理性。

研究表明,该方法分类准确率高,适用性强。

关键词:图像分类;深度学习;混合模型;受限玻尔兹曼机;卷积神经网络中图分类号:TP391.41文献标识码:A文章编号:1672-447X(2019)03-0011-05收稿日期:2019-02-28基金项目:安徽省高校优秀青年人才支持计划项目(gxyqZD2018058)作者简介:栾庆磊(1979-),安徽界首人,硕士,安徽建筑大学机械与电气工程学院,讲师,研究方向为机器视觉与图像处理。

化,以保证模型拥有较高水平的特征学习能力。

卷积神经网络模型训练过程中,涉及到的参数有上百万个,标记样本需求量大,而在小样本集上往往对预训练模型特征提取进行直接应用[3]。

3理论基础基于卷积神经网络模型迁移学习,数据集之间存在内容差异,致使提取特征识别力受到影响。

可以采取如下方法:CNN网络模型达到目标集时,使用受限波尔兹曼机来替代传统的卷积神经网络模型,对全连接的各种特征maps进行全方位组合,使之以整体结构性特征形式存在。

实际在特征提取过程中,需要对maps进行输入,加强目标集统计特征学习,达到提取图像结构性高阶特性的目的,使图像分类更加准确[4]。

如图1所示是基于受限玻尔兹曼机和卷积神经网络混合模型迁移学习的结构图。

图1RBM和CNN模型迁移学习结构示意图在大数据集上,对卷积神经网络模型进行预训练,借助该种方式,使各卷积层和全连接层参数更加直观,继而把这一模型迁移至小目标集,通过各层参数将图像卷积层特点maps提取出来,通过串联,生成单个特征map。

完成上述工作之后,把RBM 模型和输入特征map连接起来,对R6和R7层参数进行无监督学习,同时借助BP算法,对Soft max 回归、R6和R7层参数作出监督微调。

由此才能在此项技术基础上,形成已训练混合模型分类器结构。

最终,发挥这一混合模型优势,采用正确的方式,科学计算目标集中的待分类图像类别[5]。

4混合模型迁移学习实现将预训练卷积神经网络模型迁移至其它数据集,并对目标集特点进行重新学习。

本次研究中提做出迁移处理,使其在目标集系统中有所体现,并与受限玻尔兹曼机模型进行融合,在添加高阶统计特征的基础上,对数据集之间的差异进行控制,避免其影响目标集特征识别能力。

4.1预训练中的卷积神经网络模型迁移学习需要依靠大量的数据集作为载体,完成卷积神经网络模型的预训练。

该模型构成结构中,卷积层与全连接层是其功能展示的基础。

其中,Soft max分类器包含在全连接层内。

卷积神经网络模型训练中,正向传播和反向调参这两个环节,是构成整体流程的基础。

假定网络处理中,K类训练样本的设定个数为m。

由此,单个输入样本则可表示为(x(i),y(i))指代n维输入向量,而x(i)和y(i)表示该样本中已经被标记的所属类别[6]。

以数字1表示当前层,该层的输入特征向量可用x l-1来表示,同样输出特征向量可用x l表示,此外结构中的某一滑动卷积滤波器权值与偏置可分别表示为w l和b l。

各层输入特征如下:x l=f(u l),u l=w l x l-1+b l(1)通常情况下,f(·)为sigmoid函数。

样本集{(x(1),y(1)),…,(x(m),y(m))}中样本数量为m个,卷积神经网络模型整体代价函数为:J(w,b)=1m m i=1∑(12||h w,b(x(i))-y(i)||2)+λ2n l-1l=1∑s l i=1∑n l+1j=1∑(w(l)ji)2(2)上式λ指权重衰减参数;n l为网络总层数;S l为网络l层节点数量。

实现批量梯度下降,来对具体的应用参数进行调整,控制整体代价函数的阈值。

各层参数w(l)ij和b(l)i更新如下:w(l)ij=w(l)ij-αəəw(l)ji jJ(w,b)b(l)i=b(l)i-αəəb(l)jiJ(w,b)(3)(3)式中,α指代学习速率。

通过对各层残差进行计算,对代价函数的偏导展开运算分析。

代价误差达到最小时,便能够得出卷积神经网络模型,并保证该模型的预训练质量[7]。

FC8是卷积神经网络模型中位于最末的全连接层,其实质是Soft max回归分类器中的一种,相应的标签可以借助多值向量来展现。

将x输入到已知测试中,借助已经完成训练的soft max分类器程序,估计当x对应不同分类结果时的FC6FC8FC7C1C2C3C4C5SoftmaxR6R7Softmax 卷积层RBM将卷积神经网络模型应用到本次研究中,这一模型卷积层和全连接层数量分别为5个和3个,即C1-C5和FC6-FC8,它的主要用途是对RGB图像进行处理,规格通常为224×224。

在卷积层C1使用96个11×11×3的卷积核来滑动处理224×224×3型号的输入图像,将滑动步长设定为4像素。

同时在C2层中,一共使用256个5×5×96的卷积核,来匹配从C1系统中输出的96个特征maps,完成整个分析过程。

另外,在C3-C5的卷积核中,相应的使用数量以及规格情况为:384个3×3×256;384个3×3×384;256个3×3×384,每个连接层FC6-FC8的神经元数量分别为4096、4096、1000。

将非饱和线性函数f(x)=max(0,x)作为全部层激活函数,对于获得的特征maps数据,在C1与C2层都会进行最大池化处理以及标准化处理,而C5层中仅需进行最大池化处理,其它层级无需进行相应处理[8]。

4.2模型迁移学习在小目标集上迁移预训练卷积神经网络模型,再次对受限玻尔兹曼机和卷积神经网络混合模型进行训练,同时借助BP算法,对受限玻尔兹曼机和Soft max分类器层参数进行微调。

再次训练混合模型过程中,将预训练卷积神经网络模型上的全连接层去掉,使其以受限玻尔兹曼机R6-R7和新Soft max层形式存在,并在Soft max分类器上输出层提取特征。

充分借助受限玻尔兹曼机层全连接特征优势,科学组合卷积层激活的各类型特征。

该实验通过串联每一幅训练图像在C5卷积层输出的256个6×6特征maps,使其以map形式输出。

受限玻尔兹曼机模型R6可视层和隐层节点数量分别为1536×6和5000个。

R7层隐节点数量则为10000个。

将训练集假定为K类,那么Soft max层特征向量的输入情况为10000维,输出情况为K维[9]。

4.2.1重训练受限玻尔兹曼机模型的分析在模型迁移当中的受限玻尔兹曼机层,具备鲜明的全连接特点。

能够从输入maps中对目标集统计学习。

在双层网络模型结构中,若重构可视层v1与原可视层v并无太大差别,其得出的隐藏层h便具备高识别力统计特点。

将全部可见单元和隐单元都假定为二值单元。

假使某受限玻尔兹曼机可见单元和隐单元数量分别为n和m,能够得出定义该系统所需能量。

如果受限玻尔兹曼机模型参数确定,P(h j=1|v,θ)=σ(b j+i∑v i W ij)(4)P(v j=1|h,θ)=σ(αi+j∑W ij h j)(5)其中,σ(·)为sigmoid函数。

受限玻尔兹曼机模型训练本质为最大对数似然下的参数估计,即模型能量最小化。

该模型并非深度学习模型,而是以各类深度学习模型基础功能模块形式存在。

本次研究中,采用两层受限玻尔兹曼机逐层进行无监督特征学习,对输入数据高阶统计特征加以明确[10]。

4.2.2BP算法调整参数混合模型中,数据集图像分类处理过程为受限玻尔兹曼机层输出的高阶统计特征,借助Soft max 分类器实现。

训练该分类器过程中,还要反向前传训练残差得到准确模型分类结果。

借助BP算法对各层参数进行有效监督和调整。

调整参数过程中,分别通过受限玻尔兹曼机似然函数和BP训练进行反向传播,确保受限玻尔兹曼机统计特征提取性质不发生改变。

BP算法反向参数调整需要对各层各输出节点中的参差δi l作出计算,数据残差主要来表示相应节点最终输出值偏差量的受影响程度。

Soft max分类器的全部输出单元中,i残差被定义为已知条件,后面层残差反向往前传播。

具体实施过程中,BP反向传播到达R6层时便可停止,并转入正向传播。

相关主题