ETM图像水体信息提取仇大海1,田淑芳1,吴亚玲21中国地质大学(北京)遥感教研室北京市(100083)2北京鼎峰同惠工业技术有限公司北京市(100098)E-mail:qdh12011@摘要:本文应用云南省南部地区的ETM遥感影像图,对该区域内的水体信息进行提取。
以G48C004002为典型示范区,结合交互式矢量化和野外验证成果对各种方法进行分析选优,最后提出了一种水体提取的新方法:缨帽变换湿度分量法,经验证该方法满足提取要求。
本文还对去除影响因素进行了深入的探讨,例如对于阴影的去除和混合像元影响的去除。
关键词:信息提取,缨帽变换,遥感,阈值中图分类号:K9091. 引言本论文基于中国地质调查局2005年项目《中国陆域边界云南瑞丽江—大盈江中下游地区基础地质遥感调查》。
工作区北部与青藏高原相连,南到中缅、中老、中越边界,东西横跨1200km,南北纵跨800km,地理坐标位于东径97°30′—106°10′,北纬21°00′—28°00′,总面积约400000km2,涉及1∶25万比例尺地形图34幅。
该工作区属于我国西南多云多雨地区,气候湿润,雨量充沛,植被茂盛,水量丰富。
工作所采用的ETM数据共25幅。
本文以1:25万标准分幅G48C004002为例(如图1),讨论遥感方法在提取水体中的实用性。
图1 G48C004002 ETM(742)彩色合成示意图随着人类活动规模的增强,人类影响环境能力越来越显著,生态地质环境也快速地发生着变化,主要表现在干旱、洪涝、泥沙淤积河道、水土流失和滑坡、泥石流地质灾害时有发生等。
这些变化直接威胁着该地区的经济发展,同时也影响着邻国的环境变化,容易引起国际纠纷,不利于和平稳定的周边环境。
因此该区域内的水体信息调查尤为重要,水体信息调查为环境评估和地质灾害的预防和治理提供依据。
该区域面积较大、环境复杂,用传统的工作方法很难满足要求,而遥感技术以其大面积、同步观测的优势发挥了在该区域内水体调查的优势,因此如何采用最优的遥感方法结合GIS 等多种技术提取水体信息就成了本文论述的重点。
研究过程中使用了1999年和2001年的ETM遥感数据、当地的地形图、地质资料、气象资料等等。
主要的工作思路如下图:图2 ETM水体信息提取工作流程图2. 提取水体的遥感原理卫星遥感影像记载了地物对电磁波的反射信息及地物本身的热辐射信息。
各种地物由于其结构、组成及理化性质的差异,导致其对电磁波的反射及本身的热辐射存在着差异。
正是由于不同谱段上不同地物的反射率不同,才使得水体等其他地物的提取可以实现。
2.1 水体的电磁波特性水体对于电磁波具有吸收、反射、透射等特点。
传感器所记录的电磁波既有来自水面的反射,也有来自于水体底部的反射,还有水中悬浮物的信息。
2.1.1 水体对电磁波的吸收水分子的特征吸收谱带,均出现在红外波段。
振动吸收带的基频位于2.66µm、2.73µm 和6.27µm(强吸收);倍频位于1.4µm和1.9µm(锐带、强吸收);合频位于0.96µm和1.1µm(弱吸收)。
如果物体中含水或结晶格架中存在分子水,它们的光谱中都会显示出水的特征吸收带。
水对红外波段辐射的吸收非常强。
即使一层极薄的水层,也会出现高强度的吸收。
在1.4µm和1.9µm波长附近及2.5µm波长以远的水的吸收率几乎等于100%。
显然,对于自然水体,即使水深很浅,也能够全部吸收入射电磁辐射中的红外段辐射,这也正是研究水体的极佳波段。
2.1.2 水体对电磁波的反射水体对可见光的反射来自三方面:(1)水体表面的反射;(2)水体底部物体的反射;(3)水中悬浮物的反射。
平静的水面以镜面反射为主,在雷达图像上镜面反射的特点尤为显著,雷达图像上的水体多为深色调,但如果水面与雷达信号垂直时,水面则呈现出明显的亮色调。
水面上如果有植被或石油等污染物时水体的反射出现异常,反射率明显增高。
如果水体无污染,透明度高,且水体较浅时,水体底部的反射信息不可忽略。
尤其在蓝光波段,水体底部的反射信息明显,可用来研究水体的深度和水底的地形特点。
水中的悬浮物包括植物、泥沙、污染物等,悬浮物的存在降低了水体的透射能力,并使得反射率增高。
2.1.3 水体的透射特点水的透射率也是随波长变化的。
如可见光中的蓝、绿光穿透水的能力相对较高。
并且水中杂质对水的光谱透射率有很大影响。
清洁的海洋水的最高透射率分别是30%左右,峰值波长的范围在0.42—0.58µm之间;沿海岸的海水中的杂质较多,透射率的峰值下降至10%左右,峰值波长的范围缩小为0.48—0.53µm之间;混浊的海湾水,透射率更低,峰值仅为4%左右,峰值波长的范围也缩小到0.54—0.58µm之间。
并且,无论哪一种水体,它们的透射率在波长为0.58µm之后,都雪崩似地降至0.25%左右。
随着水的混浊度增加,透射率峰值对应的波长范围相对缩小。
2.2 水体与其他地物的区别水体的波谱曲线与其他地物明显不同(见图3),这正是将水体提取出来的依据[1]。
图3几种典型地物的波谱曲线天然水体对0.4—2.5µm电磁波的吸收明显高于绝大多数其它地物,因而水体的总辐射水平低于其它地物,在彩色遥感影像上表现为暗色调。
在红外波段,水体吸收的能量高于可见光波段,即使水很浅,水体也几乎全部吸收了近红外及中红外波段内的全部入射能量,所以水体在近红外及中红外波段的反射能量很少,而植被、土壤在这两个波段内的吸收能量较小,且有较高的反射特性,这使得水体在这两个波段上与植被和土壤有明显的区别。
反映在影像上,水体呈现出暗色调,而土壤植被则相对较亮。
因此,选用一个合适的近红外波段,定出水体的阈值,将低于该值的像元定为水体,高于该值的像元则为非水体,这样就可很容易地把水体与其它地物区分开来。
但在山区,由于山体阴影的影响,阴坡在红外波段的反射能量特别低,在图像上同样呈现暗色调,使得阴影成为水体提取过程中遇到的难题之一[2]。
2.3 提取水体的常用光谱波段不同的光谱波段记录了不同的地物反射信息,单一的波段记录的信息量小,不利于精确的水体提取,而各种波段的组合应用是提取水体的关键。
常用的波段有蓝绿光波段、红光波段、近红外波段,另外热红外波段和微波也可以利用。
2.3.1 蓝、绿光波段对于清水,蓝绿光的反射率为4—5%。
蓝光波段水体的透射率高,水体的反射会叠加一些水底的反射信息。
总的来说蓝绿光波段的反射率明显高于其他波段。
水体会与旱地有一定程度的混淆。
2.3.2 红光波段红光波段水体的反射率在2%左右。
水体与旱地均有明显的区别,因而利用阈值法可以将水体与他们区别开来,但是,水体与阴影的混淆存在。
2.3.3 近红外和短波红外在近红外和短波红外上,水体的反射率几乎为零。
水体同样与林地、居民地、水田和旱地有明显的区别,而与阴影有混淆,在短波红外上的混淆尤为明显。
2.3.4 热红外波段在热红外波段上,水体由于其比热大,其光谱特征明显区别于其他地物。
白天水体将太阳辐射能大量地吸收存储,增温比陆地慢,在遥感图像上表现为热红外波段辐射低,呈暗色调。
在夜间,水温比周围地物温度高,发射辐射强,在红外影像上呈高辐射区,为浅色调。
因此,利用热红外图像是提取水体的途径之一[1]。
3. 水体提取的常用方法3.1 阈值法阈值法分为全局阈值法和局部阈值法两种。
全局阈值法指利用全局信息(例如整幅图像的灰度直方图)对整幅图像求出最优分割阈值,可以是单阈值,也可以是多阈值;局部阈值法是把原始的整幅图像分为几个小的子图像,再对每个子图像应用全局阈值法分别求出最优分割阈值[10]。
其中全局阈值法又可分为基于点的阈值法和基于区域的阈值法。
阈值分割法的结果很大程度上依赖于对阈值的选择,因此该方法的关键是如何选择合适的阈值。
局部阈值法中仍要用到全局阈值法。
阈值分割法实际就是按某个准则函数求最优阈值的过程[9]。
3.2 非监督分类根据图像数据的本身统计特征及自然点群的分布情况划分类别,各类别的统计特征是未知的,一般是提供少数阈值对分类过程给以部分控制。
非监督分类由图像数据的统计特征来决定。
遥感图像上的同类地物在相同的表面结构特征、植被覆盖、光照等条件下,应当具有相同或相近的光谱特征,从而表现出来某种内在的相似性,归属于同一个光谱空间区域;不同的地物,光谱信息特征不同,归属于不同的光谱空间区域。
这就是非监督分类的理论依据。
非监督分类用于在没有已知类别的训练数据的情况下,而且,在一幅复杂的图像中分类选择训练区,有时并不能完全包括所有的波谱样式,造成一部分像元找不到归属。
在实践中为进行监督分类而确定类别和选取训练区也是不易的。
因而,在开始分析图像时,用非监督分类方法来研究数据的本来结构及自然点群的分布情况是很有价值的。
3.3 监督分类先在图像中选择有代表性的训练区(应是波谱特征比较均一的地区),由训练组数据得出各个类别的统计数据,然后根据这些统计数据对整个图像进行分类,即把图像中各个像元点归化到给定类中[2]。
以最大似然法为例,监督分类法的大体过程是:(1)选择有代表性的试验区(训练区)。
(2)将已知地物类别的图像进行灰度统计和运算,求其均值、方差和协方差矩阵。
(3)选择判别函数确定其判别规则。
例如,用概率判别函数,计算一个给定像元属于每一类的概率。
(4)用已知的其余像元进行检核。
(5)输入末知地区的数字图像,算出该地区各像元落于已知类别的概率。
(6)从未知像元落于已知类别的概率中,找出最大值所属的类别,就是未知像元的类别归属。
3.4 人工神经网络法人工神经网络是由大量称为神经元的简单信息单元广泛连接组成的复杂网络。
它是在现代生物学研究人脑组织所取得的成果基础上提出来的,用于模拟人类大脑神经网络结构和行为。
在遥感数字图像分类处理中,人工神经网络的输入层神经元表征遥感数据的输入模式。
每一个输入层神经元对应于一个光谱波段。
每一个输出层神经元则对应于一种土地覆盖类型。
神经网络的拓扑结构决定着各神经元与网络层之间的信息传递途径。
训练规则利用转移函数实施处理数据的加权和求和,进而训练网络实施模式识别。
处理所得的加权和,通过转移函数转换为输出值[7]。
神经网络有不足之处,即训练网络所需的时间较长,因为一般说来,训练时间总消耗量与神经网络的规模和训练期间所用的数据总量直接相关。
可见,如何针对一给定数据集优选人工神经网络的结构,即确定所需的最佳的层数和各层神经元个数以及缩短神经网络的训练时间就成为神经网络应用实践中一大难题[8]。
3.5 决策树法决策树是遥感图像分类中的一种分层处理结构,其基本思想是通过一些判断条件对原始数据集逐步进行二分和细化。