当前位置:文档之家› 高光谱遥感影像端元提取方法对比

高光谱遥感影像端元提取方法对比

龙源期刊网 http://www.qikan.com.cn 高光谱遥感影像端元提取方法对比 作者:靳文凭 肖可可 来源:《科技视界》2012年第17期

【摘 要】本文在SMACC法和PPI法端元提取基础上,得到高光谱遥感影像端元丰度图,之后用SVM法进行分类。通过分类结果精度来评价端元提取的优劣。实验结果表明,基于PPI的线性混合像元分解得到的丰度图用SVM分类效果最佳,整体精度达87.59%,而基于SMACC法结合SVM分类的效果和直接应用SVM分类次之,整体精度分别是83.84%和85.16%。

【关键词】高光谱;端元;支撑向量机(SVM) Comparison of Endmember Extraction Methods from Hyperspectral Image JIN Wen-ping XIAO Ke-ke (School of Geoscience and Info-Physics, Central South University, Changsha Hunan, 410083, China)

【Abstract】In this paper, SMACC method and PPI method were used to extract endmembers. Then the abundance maps which were derived from endmembers were classified by SVM method. At last ,we evaluated the quality of endmember extraction methods by classification precision. The results show that the PPI-SVM is the best method and the overall precision is 87.59% while that of the SMACC-SVM method and the SVM method are 83.84% and 85.16%.

【Key words】Hyperspectra;Endmember;Support vector machine(SVM) 0 引言 高光谱遥感技术丰富的空间维、光谱维信息受到国际研究者的广泛关注,具有广阔的发展应用前景[1]。目前已在地质勘探、植被生长状况监测以及城市监测等方面取得了显著的成果[2]。高光谱遥感影像的分类方法、训练样本选择以及混合像元分解问题目前已成为人们研究的热点[3]。对通过高光谱遥感技术进行地物识别而言,混合像元一直是影响分类精度的主要原因之一,混合像元的分解问题一直是遥感应用研究的难点和热点。本文主要对比了常用的端元提取法:SMACC法和PPI法,对混合像元分解后得到的端元丰度图用支持向量机(SVM)法进行分类,最后将上述两种分类结果与直接对原始影像分类的结果进行对比,得出了一些有意义的结论,对以后实验研究具有一定的指导意义。

实验选取的数据为北京昌平地区的PHI高光谱影像,其波段范围为412~833nm,波段数为80,所截取的大小为328行×392列。 龙源期刊网 http://www.qikan.com.cn 1 端元丰度图提取 1.1 特征提取 由于高光谱数据光谱维过高,直接用于分类会因计算量过大而导致分类过程耗时较长,增加构建分类器的难度,同时会引入噪声而导致分类精度降低。因此,在进行分类前,要对光谱信息进行特征提取,实现光谱数据的降维[4]。

特征提取的典型方法是主成分分析(PCA)法,它是在统计特征基础上的多变量正交线性变换。通过去掉那些相对较小的变换系数而又不会损失太大的信息量达到有效地降低维数的目的,是对均方误差最小而言的最佳变换。特征提取也可以用MNF(MirninumNoiseFraction)变换进行。MNF变换是一种类似于主成分变换的方法。但该方法首先把数据中的噪音部分隔离出来,确定实际数据量的大小,从而为后续处理减少工作量。MNF变换通过两步主成分变换来实现:第一步变换对数据中的噪音去相关和归一化,使各序列之间互不相关;第二步再实施标准的主成分变换。

在对实验数据进行MNF(MinimumNoiseFraetion)变换后,检查各波段的信息量,发现从20维以后所包含的绝大部分是噪声信息,因此,本文选用MNF转化后的前20维作为有效信息进行分类。

1.2 端元选择 端元(EndMember)是代表某种具有相对固定光谱的特征地物。在应用混合光谱模型理论对植被高光谱遥感图像进行混合像元分解过程中,端元选择的好坏直接影响到混合像元分解的精度。

在植被高光谱分类过程中,端元一般来源于两种:第一,参考端元,来源于地物标准光谱库或实际地物类型光谱;第二,图像端元,从图像上选择训练区来提取训练样本作为参考光谱。图像端元是从图像本身获取组分,与图像数据具有相同的度量尺度,图像端元的选择可以应用纯净像元指数(Pixe1Purity Index,PPI)法和逐次最大角凸锥体(SMACC)法等获得。

PPI法是对原始影像做纯净像元筛选,剔除掉不纯净的像元,能够提高端元选择的精度。本文首先对高光谱图像进行MNF变换,用MNF变换后的前20个波段设定迭代次数为2000,阈值系数为3,产生像元纯度指数PPI。将PPI导入到MNF变换后前20个波段中得到散点图。图中有4个犄角,因此选择了4个端元。

SMACC法是一种基于凸锥模型的自动获取图像中端元并提供端元丰度图像的方法。它能够实现了端元的自动快速提取[5]。

本文应用PPI法和SMACC法分别提取端元,图1为所选端元波谱图,横轴为波长,纵轴为光谱反射率,其中(a)为用SMACC法自动得到4个端元,(b)为用PPI提纯后根据散点龙源期刊网 http://www.qikan.com.cn 图选择出的4个端元。由于SMACC方法得到的各个端元仅是单独的一个点,而PPI法是通过PPI散点图选择犄角附近的点求均值后作为端元,因此可靠性更高。同时,从图1中还可以看到SMACC法得到的4个端元其中两个在波长为700附近时不平滑,存在数值突变现象,也说明了可靠性不如PPI法。

(a)SMACC提取的端元 (b)PPI图像提取的端元 图1 端元波谱图 1.3 线性混合像元分解 线性混合光谱模型是近年来研究人员提出的较为有效的混合像元分解方法之一,其基本思想是假设图像地物光谱是纯净端元光谱的线性组合,且各端元间应是独立可分的,其目的就是通过某种分析和计算,得到混合像元中所包含端元占的比例。线性光谱混合分析模型为[6]

R■=■f■R■+ε■ 其中,λ为所用光谱波段数,k=1,...,n为所选端元数目; R■像元在第i波段的光谱反射率;f■为端元k在一个像元中所在的比例;R■为端元k在波段λ上像素的光谱反射率;ε■为波段λ的残差项。

用SMACC法直接得到的4个丰度图,其中一个为阴影(shade)组分,另外三个丰度图代表性不强。图2为用PPI法提取的端元,用线性混合分解的得到的丰度图。

2 分类方法 支持向量机(SVM)的原理由Vapnik 和Chervonenkis于1971年首次提出,然后在1999年Vapnik 对其进行了详细的论述。传统算法采用经验风险最小化准则,而SVM是广义的线性分类器,可以用训练数据描述分离超平面,因此直接解决分类问题,不需把概率密度估计作为中间步骤。

假设在d维特征空间存在N个训练样本集(x1,y1)、(x2,y2)…(xN,yN),输入模式为xi∈Rd,yi∈{-1,1}为目标输出,分类超平面方程为:

ωTxi+b=0, 式中:ω为权值向量,b为偏置。SVM的目标是寻找一个使训练样本错分误差最小的最优超平面,因此可得下式优化问题:

β(ω,ε)=■ωTω+C■ε■ 龙源期刊网 http://www.qikan.com.cn 式中:C表示对错分样本的惩罚系数;ε■为松弛变量。利用拉格朗日乘子法,将最优分类超平面的求解转化以

■αiγi=0,0≤αi≤C,i=1,2…,N 为约束条件的下对αi求最大值的约束优化问题: P(α)=■αi-■■■αiαjγiγjK(xi,xj) 式中:αi为Lagrange乘子,大部分αi为0,αi≠0时对应的训练样本称为支持向量;K(xi,xj)为核函数;γ为核函数的gamma值。

Vapnik等研究表明,核函数类型对SVM分类结果影响不大,而核函数的参数是影响SVM分类结果的主要因素。已有研究[7]表明RBF-SVM的分类精度达94.5127%, Kappa系数达0.9351,取得了最佳的分类结果,是SVM算法进行高光谱分类的首选。因此本文选择RBF核函数,惩罚系数C及核函数参数γ分别为100和0.013。

3 结果与分析 对实验数据进行分类,结果如图3所示,其中图3(a)表示直接对影像进行SVM的分类结果,图3(b)表示对SMACC法提取的丰度图进行SVM的分类结果,图3(c)表示PPI法提取的端元经过线性混合像元分解得到的丰度图进行SVM的分类结合。对比图3分类结果中左上角白色矩形框体内的方格水体可以看到,图3(a)中直接应用SVM分类法将部分水体错分为闲置地,而图3(b)中SMACC-SVM方法将此方格内水体完全错分为闲置地和稀疏植被,只有图3(c)中的PPI-SVM方法得到正确的分类结果。再对比图3中细条状的公路,同样可以明显看出图3(a)直接应用SVM分类的结果和图3(b)应用SMACC-SVM的分类结果不仅出现错分,而且道路会出现中断,只有图3(c)应用PPI-SVM方法的分类结果更加合理,不仅道路连续,而且准确率最高。因此,可以直观判断出PPI-SVM分类方法最好,直接应用SVM分类方法次之,而SMACC-SVM分类方法效果最差。

用测试样本对分类结果进行评价,生成混淆矩阵(表1)。结果表明,SMACC-SVM分类精度仅达83.84%,Kappa系数为0.7329,分类结果较差;直接用SVM对高光谱原始波段分类,精度为85.16%, Kappa系数为0.7531,也未取得精确的分类结果;而采用PPI散点图选择的端元进行线性分解后用SVM分类,精度高达87.59%, Kappa系数0.7861。可见由PPI选择端元进行线性分解结合SVM进行高光谱遥感影像分类是一种优选方法。

4 结论 表1 精度评价表

相关主题