遥感图像分类方法综述
王一达,沈熙玲,谢炯
(杭州市电力局调度所,浙江杭州310028)
摘要:从遥感图像分类方法的基本原理入手,介绍了传统遥感图像的分类一些方法,以及它们近年来的发展,此外还对遥
感图像分类研究的新方向作了一些介绍,并对发展趋势作了展望。
关键词:遥感图像;图像分类;模式识别。
中图分类号:P237.9 文献标识码:A 文章编号:1000-3177(2006)87-0067-05
收稿日期:2006-03-01
基金项目:国家自然科学基金40271087时态GIS的基态修正时空数据模型扩展及其应用;浙江省自然科学基金401006GIS时空数据库中
的基态修正模型扩展及其应用.
作者简介:沈熙玲(1980~)、女、浙江大学硕士研究生、主要从事遥感应用研究、GIS理论及应用研究.1 引 言
遥感图像是按一定的比例尺,客观真实地记录和反映地
表物体的电磁辐射的强弱信息,是遥感探测所获得的遥感信
息资料的一种表现形式。所以遥感技术的核心问题是根据
地物辐射电磁辐射强弱在遥感图像上表现的特征,判读识别
地面物体的类属及其分布特征[2]。在遥感图像技术的研究
中,无论是专业信息提取,运动变化预测,还是专题地图制作
和遥感数据库的建立等都离不开分类,对照地面地物类型,
便可以从图像上地物的识别。随着近年来计算机技术的飞
速发展,计算机识别分类成了遥感技术应用的一个重要组成
部分。遥感图像数据类别多,合混度大,如何解决多类别分
类识别并满足一定的分类精度,是当前遥感图像研究中的一
个关键问题,也是人们关注的焦点[1]。
2 遥感图像分类原理
通常我们所指的遥感图像是指卫星探测到的地物亮度
特征,它们构成了光谱空间。每种地物有其固有的光谱特
征,它们位于光谱空间中的某一点。但由于干扰的存在,环
境条件的不同,例如:阴影,地形上的变化,扫描仪视角,干湿
条件,不同时间拍摄及测量误差等,使得测得的每类物质的
光谱特征不尽相同,同一类物质的各个样本在光谱空间是围
绕某一点呈概率分布,而不是集中到一点,但这仍使我们可
以划分边界来区分各类。因此,我们就要对图像进行分类。
图像分类的任务就是通过对各类地物波谱特征的分析选择
特征参数,将特征空间划分为不相重叠的子空间,进而把影
像内诸像元划分到各子空间去,从而实现分类。分类方法可
以分为统计决策法(判别理论识别法)模式识别和句法模式
识别。
统计决策法模式识别指的是:对研究对象进行大量的统
计分析,抽出反映模式的本质特点、特征而进行识别。主要的有监督分类中的最小距离法、逐次参数估计法、梯度法、最
小均方误差法、费歇准则法和非监督分类中的按批修改的逐
步聚类法、等混合距离法。此外还可以将两者结合起来,互
相补充以获得较好的效果。句法模式识别则需要了解图像
结构信息,从而对其进行分类。
图1 统计决策法模式识别原理框图
图2句法模式识别原理框图
3 遥感图像分类研究现状
在目前的遥感图像分类应用中,用的较多的是传统的模
式识别分类方法:诸如最小距离法,最大似然法等监督分类
法。其分类结果由于遥感图像本身的空间分辨率以及/同物
异谱0,/同谱异物0现象的存在,而往往出现较多的错分、漏
分情况,导致分类精度不高。但目前也提出了一些改进算
法,使其分类精度有了大幅的提高。随着遥感技术的发展,
近年来出现了一些新的倾向于句法模式的分类方法,如人工
神经网络方法,模糊数学方法,决策树方法,专家系统方法
等。
3.1 传统的遥感图像分类方法
在遥感图像数据的分类中,人们最常用的是最大似然分
类法和最小距离分类法。最大似然分类法一般是基于贝叶
斯(Bayes)准则构建起来的,而基于各种判决距离函数的多
种分类方法都称为最小距离分类法。
3.1.1 最大似然分类法
672006.5 综 述 遥感信息按贝叶斯准则建立起来的贝叶斯判决准则称为贝叶斯
分类器,其构建原理如下:地物影像可以以其光谱特征向量
作为量度,在光谱特征空间中找到一个相应的特征点,而来
自于同类地物的特征点在特征空间中将形成一个从属于某
种概率分布的集群,判别某一特征点类属的合理途径是对其
落进不同类别集群中的条件概率进行比较,相应于条件概率
大的那个类别将是该特征点的归宿。为此可以把某特征点
X落入某类集群(Wi)的条件概率P(Wi/X)当成分类判决
函数,称为概率(或似然)判决函数。由于概率是建立在统计
意义上的,因而当使用概率判决函数进行分类判别时,不可
避免的出现错分现象。我们希望以错分概率或风险最小为
准则来建立所需要的判决规则,这就用到贝叶斯判决规则,
其判决函数di(X)如下:
di(X)=lnP(Wi)-12ln|Ei|-12[(x-Mi)T(Ei)-1(x-Mi)]
相应的判决规则有:若对于所有可能的j=1,2,...,
m,jXi有di(X)>dj(X),则X属于Wj类。
近年来,出现了一种新的数据处理技术数据融合。数据
融合是多源信息综合处理的一项技术,它将来自各数据源的
信息通过某种方式处理,产生比单一数据更精确,更可靠,更
安全,更有效的信息。数据融合的基本要点是:(1)采用何种
方式融合,这是数据融合的基本方法问题。(2)融合后信息
的有效性,这是数据融合的最优性问题。
有人将此与Bayes方法结合起来,提出了顾及各数据源
成像模型,上下文关系模型和可靠性的基于Bayes融合分类
方法[3]。并采用该方法对LandsatTM和航空SAR图像进
行分类试验,结果表明:同单独图像分类结果相比,融合分类
方法将分类精度提高了20%。
3.1.2 最小距离分类法
最小距离分类法的判决函数是建立在地物光谱特征在
特征空间中是按集群方式分布为前提的。它的基本思路是
设法计算某随机特征点X到有关类别(Wi,i=1,2...,m)
集群之间的距离,哪类距离它最近,它就归属于那类。距离
判别函数不像贝叶斯判决函数那样偏重于集群分布的统计
特性,而是偏重于几何位置,其通用判决形式如下:
若对于所有可能的j=1,2,...,m,jXi有di(X)>dj(X),则X属于Wj类。
在实践中三种距离判别函数:
(1)马氏(Mahalanobis)距离:
dMi(X)=(X-Mi)T(Ei)-1(X-Mi)
(2)欧氏(Euchidena)距离:
dEi(X)=(X-Mi)T(X-Mi)=+(X-Mi)+2
(3)计程(Taxi)距离:dTi(X)=Em
j=1|X-Mi|
为了提高遥感图像的分类精度,综合利用多波段卫星图
像,图像融合无疑是切实可行的方案。但由于所考察的地物
在遥感图像上图斑零散,灰度值范围宽,因此目标之间,目标
和背景之间往往属于线性不可分或非线性分类问题,这也是
影响分类精度的一个重要原因[4]。为此出现了一种称为自适应最小距离的算法以及在它基础上的用核空间理论改进
的自适应最小距离算法[4]。
自适应最小距离算法的基本原理:首先,通过样本集合
的分解,得到样本分布估计;然后,根据分解结果求出实际分
类中待分类点到每一类的距离,并作为分类依据。
用核空间理论改进的自适应最小距离算法则是通过引
入核空间理论,将在输入空间中不能线性分类问题映射到一
个可以进行线性分类的高维空间,并利用核函数避免了在高
维空间中运算的复杂度,较好的解决了非线性分类问题。其
原理:首先,要将自适应最小距离分类算法公式中的输入空
间变量改写为输入空间变量内积形式;然后,使用核函数替
代该内积,即计算特征空间中变量的内积,完成特征空间中
的分类。
3.2 遥感图像分类算法研究新方向
传统的遥感图像分类方法是根据遥感图像数据的统计
特征与训练样本数据之间的统计关系来进行分类的,其分类
精度往往不甚理想。同时因为地物类型分布方式的本身的
复杂性,也造成了传统分类方法不理想的原因。为此人们不
断的研究和尝试新的方法,以图改善。近年来在采用神经网
络,模糊数学,决策树和人工智能的方法进行研究的过程中,
取得了很大的进展。
3.2.1 人工神经元网络方法
人工神经元网络,简称神经网络,是以模拟人脑神经网
络系统的结构和功能为基础而建立的一种数据分析处理系
统。一个神经元有多路输入,接收来自其它神经元的信息,
并将反馈信息经由一条路线传递给另一神经元。一个神经
元与多个神经元以突触相连,进入突触的信号作为输入(激
励),通过突触而被/加权0,所有输入的加权之和即为所有权
重输入的总效果。若该值等于或大于阈值,则该神经元被激
活(给出输入),否则即不被激活。人工神经网络可以视为简
化了的人脑神经系统的数学模型[6]。
90年代以来,人工神经网络大量的应用于遥感图像的
分类。现在应用较为广泛的是多层反前馈网络的反向传播
网络和自组织网络,反向传播网络需大量的学习时间,容易
陷入局部极小、振荡而导致难以收敛以及网络结构难以确定
等缺陷。自组织网络结构简单,学习速度快,隐层结点的权
向量所表示的意义明确,可以用来获取输入数据的统计特
征,但存在隐层结点的数目较难确定和泛化能力差等问题。
图3 重复传播网络结构
随着各种技术的发展,人们对神经网络的结构进行改
68遥感信息 综 述 2006.5进,提出了一个三层前向网络组成的重复传播网络来提高图
像的分类精度[13],网络结构如图3所示。
各层之间的神经元全部互连。隐含层称为Kohonen层,
即竞争层,采用竞争学习算法,最高层称为Grossberg层或输
出层,采用Widrow-Hoff或Grossberg规则学习。
也有人将小波和神经网络结合起来,构造一种用于分类
的自适应小波基函数神经网络[7]。其结构如图4所示。
图4 小波基神经网络系统结构图
小波分析的基本思想是用一族函数去表示或接近一信
号或函数,这一族函数称为小波函数系,它是通过基本小波
函数的不同尺寸的平移或伸缩构成的。小波变换具有线性
叠加性、平移共变性、尺度共变性、能量守恒性、局域正则性
等优点。这种小波函数网络结构简单,容易训练,收敛速度
快,一旦网络训练好后,其分类适应性强。
3.2.2 模糊数学方法
由于遥感图像有时所具有信息的不确定性,针对不确定
的数学方法自然成遥感影像分析人员所注意的目标。模糊
数学方法就是一种针对不确定性事物的分析方法。它以模
糊集合论作为基础,有别与普通集合论中事物归属的绝对
化。在分析事物的隶属关系时,即分类时,一般需以某数学
模型计算它对于所有集合的隶属度,然后根据隶属度的大
小,确定归属。
人们常常将模糊技术和神经网络相融合,来克服神经网
络和模糊逻辑在知识处理方面的缺点。采用神经网络来进
行模糊信息的处理,就可以利用神经网络的学习能力达到调
整模糊隶属函数和模糊规则的目的,从而使模糊系统具有了
自适应的特性,提出了一种基于模糊高斯基函数的神经网
络[8]。
网络共分为四层:第Ñ层为输入层,将特征向量{x1,
x2,...,xn}引入网络;第Ò层为模糊层,完成特征向量的模
糊化,将输入向量的特征向量分为三个等级(小、中、大),采
用的隶属度为高斯函数exp(-(x-ab)2);第Ó层为模糊推
理层,目的是对模糊化后的特征向量进行综合处理,P表示
AND操作;第Ô层为输出层,对应于去模糊化操作。其结构
如图5所示。
这种分类方法,通过神经网络来实现模糊推理,并利用
神经网络的自学习功能来达到调整模糊隶属度函数和模糊规则的目的,从而提高了分类精度。
图5 基于模糊高斯基函数的神经网络结构
此外将模糊理论引入小脑模型神经网络,提出了一种能
反映大脑认知的模糊性和连续性的模糊小脑模型神经网
络[9],它在模糊神经网络的基础上增加了一个联想单元,来
模仿人类小脑的学习结构。其结构如图6所示。
图6 小脑神经网络结构
在该结构中,每个输入状态变量被量化并且问题空间被
划分成离散状态,量化的输入构成的向量指定了一个离散状
态并且被用于产生地址来激活联想单元中存储的联想强度,
从而恢复这个状态信息。
此外还有采用B样条函数作为模糊隶属函数[10]等等各
种类型的模糊神经网络,作为分类器对遥感图像进行分类,
提高分类精度。
3.2.3 决策树分类法
决策树分类法原理是:决策树由一个根结点,一系列内
部结点(分支)及终结点(叶)组成,每一结点只有一个父结点
和二个或多个子结点。如果。由原级(根结点)出发,不断往
下细分,直到所要求的终级(叶结点)类别分出为止。于是在
/原级0与/终级0之间就形成了一个分类树结构,在树结构每
一分叉结点处,可以选择不同的物质用于进一步的有效细分
692006.5 综 述 遥感信息