第
53卷第
4期华中师范大学学报(
自然科学版)
Vol.53No.4
2019年
8月
JOURNAL
OF
CENTRAL
CHINA
NORMAL
UNIVERSITY(
Nat.Sci.)
Aug.2019
收稿日期:
2019
-03
-04.
基金项目:
十三五科技部国家重点研发计划项目(
2016YFC0803107,
2016YFB052601,
2017YFB0504103)
.
*通讯联系人
.E
-mail:
duanxuelin
@whu.edu.cn.DOI:
10.19603/
j.cnki.1000
-1190.2019.04.017文章编号:
1000
-1190(
2019)
04
-0568
-07
基于
DCNN的高分辨率遥感影像场景分类
孟庆祥,
段学琳
(
武汉大学遥感信息工程学院,
武汉
430000)
摘
要:
针对传统场景分类方法不能准确地表达高分辨率遥感影像丰富的语义信息问题,
提出了
一种基于卷积神经网络的高分辨率影像场景分类方法
.此方法大致分为
3步:
第
1步,
依据不同卷
积窗口做卷积运算提取颜色,
纹理和形状等低阶特征;
第
2步,
利用池化层将这些低阶特征进行过
滤,
得到重要特征;
第
3步,
重组提取出来的特征以形成高阶语义特征进行场景分类
.在具体实验
中利用三个不同尺寸的卷积核对数据集进行分类探究,
并且使用了数据增广、
正则化和
Dro
pout
等手段,
提升模型对新样本的适应能力,
很好地解决了过拟合问题
.该方法在所进行的实验中表现
良好,
在
WHU
-RS19数据集上取得了
88.47%的准确率,
和传统的场景分类方法相比,
显著提升了
分类精度
.
关键词:
高分辨率遥感影像;
场景分类;
深度学习;
深度卷积神经网络
中图分类号:
P237文献标识码:
A
遥感技术的不断发展,
带来了影像分辨率的提
升
.这种高空间分辨率的遥感影像具有丰富的空间
信息和纹理特征,
包含了大量的语义信息
.然而面
向像素和面向对象的解译方法存在着很多不足,
无
法满足遥感影像高层次内容解译的需求
.因此,
对
高分辨率遥感图像进行场景分类成为了当前遥感
图像解译中活跃的研究课题[
1]
.
场景分类是遥感研究领域的热点
.通俗的来
说,
就是用给定的图像,
通过其包含的内容对它的
场景类别进行判断
.传统的场景分类方法可以概括
为两类:
基于低层次特征的方法和基于中层语义
特征建模的方法[
2]
.基于低层特征的场景分类,
即
依赖于颜色、
纹理和形状等低层特征的分类方法,
此类分类算法比较简单,
但泛化能力较弱、
精度不
够高[
3-4]
.基于中间语义的图像分类,
即先生成底层
特征,
然后结合分类器实现图像场景分类,
其代表
有视觉词袋(
BoVW)[
5]
以及由此衍生的空间金字
塔匹配核(
SPMK)[
6]
等,
此类方法会导致信息的丢
失,
存在一定的局限性
.
由于传统的场景分类方法无法满足大数据环
境下人们的分类要求,
学者们开始将深度学习[
7-8]
算法应用到影像分类中
.典型的深度网络模型[
9]
主
要有深度置信网(
DBN)[
10]、
栈式自动编码器网络
(
SAE)[
11]
和卷积神经网络(
CNN)[
12-13]
.其中,
卷积神经网络是目前较为流行的基于监督的深度学习
方法,
该方法在图像识别、
物体识别、
图像语义分割
中都得到了广泛的应用
.近年来,
越来越多的学者
将卷积神经网络运用于图像分类
.文献[
14]
将卷积
神经网络用于图像分类,
在
CIFAR
-10数据集上取
得了较好的分类效果
.文献[
15]
用卷积神经网络对
Landsat
TM5中等分辨率遥感影像进行了分类实
验,
并与支持向量机分类结果进行比较,
在一定程
度上体现了卷积神经网络在图像分类的优越性
.与
此同时,
有学者将卷积神经网络运用于遥感影像的
场景分类,
并取得了一定的进展,
这种场景分类方
法很快受到了广泛的关注
.
在此基础上,
本文提出一种基于深度卷积神经
网络的场景分类模型
DCNN,
将该模型用于高分
辨率遥感影像的场景分类,
加入数据增广并且利用
正则化方法和丢弃函数调整模型参数,
最终实现基
于卷积神经网络的高分辨率遥感影像分类
.
1卷积神经网络
卷积神经网络是一种受生物学启示的,
包含卷
积计算且具有深度结构的前馈神经网络
.它可以进
行监督分类,
提取出遥感影像中的语义特征
.一个
基本的卷积神经网络结构有
3层[
16-17]:
输入层
-隐
含层
-输出层,
隐含层又分为
4部分———
卷积层、 第
4期孟庆祥等:
基于
DCNN的高分辨率遥感影像场景分类
569
池化层、
激活函数和全连接层
.
1)
卷积层:
对输入的遥感影像数据进行特征
提取,
通过卷积核对图像进行卷积运算,
得到特征
图
.其中,
卷积核大小、
步长以及填充方式决定了特
征图的大小
.
2)
池化层:
主要起过滤作用,
减少参数、
压缩
数据,
以保留重要特征,
减小过拟合
.
3)
激活函数:
把卷积层输出结果做非线性映
射,
协助表达复杂特性
.常用的激活函数有
tanh、
si
gmoid和
ReLU[
18]
.其中,
si
gmoid和
tanh容易造成梯度消失的问题,
而线性整流函数
ReLU具有
分段线性性质,
在一定程度上避免了梯度爆炸和梯
度消失问题
.同时,
它还比较符合生物学的原理,
具
有一定的稀疏性
.
4)
全连接层:
对卷积层和池化层得到的特征
进行综合
.特征图在全连接层中会失去
3维结构,
被展开为向量并通过激活函数传递至下一层
.最后
的分类器接收就是对全连接层产生的结果进行分
类,
输出分类结果.
图
1
卷积神经网络
Fi
g.1
Convolution
Neural
Network
为了更好地训练卷积神经网络,
通常会加入一
些技巧,
例如:
Dro
pout[
19]、
正则化[
20]
以及数据增
广等,
使得训练的模型具有更强的泛化能力,
以提
高分类准确率
.
2基于
DCNN的场景分类
2.1技术路线
本文提出了一种基于卷积神经网络的高分辨
率遥感影像场景分类模型
DCNN,
并参照经典卷
积网络结构
LeNet
-5、
AlexNet、
Goo
gleNet中常用
的卷积核尺寸,
使用
3×3,
5×5,
7×7三个不同尺
寸的卷积核对数据集进行分类探究
.卷积核越大,
感受野越大,
获取的图片信息越多,
获得的特征越
好
.但是大的卷积核会导致计算量的暴增,
不利于
模型深度的增加,
计算性能也会降低
.因此,
对于更
大尺寸的卷积核,
本文不予以讨论
.全文的技术路
线如图
2所示
.
2.2DCNN的网络结构
和
AlexNet类似,
本文所用
DCNN包含
5个
卷积层和
3个全连接层(
如图
3所示)
.第一层卷
积层只能提取一些低级的特征,
随着层数的增
多,
能学会的特征也就越复杂
.全连接层则把前
边提取到的特征综合起来,
随着其层数加深,
模图
2
技术路线
Fi
g.2
Technolo
gy
Roadma
p
型非线性表达能力提高
.但如果层数过多,
又会
带来运算时间增加,
运算效率降低等困扰
.和一
般的卷积神经网络相比,
本文所用的
DCNN模型
既可以在一定程度上提高模型的学习能力,
又能
保证运算效率
.在卷积运算中,
卷积的步长为
1,
并采用全
0填充的方式
.池化过程所使用的过滤
器尺寸为
2
*2,
过滤步长为
2.激活函数采用
ReLU,
并在实验中加入
LRN以提高分类准确
度
.最后,
由隐含层末尾的全连接层将得到的特
征图展开为向量传递给
Softmax分类器,
得到最
终分类结果
.