当前位置:文档之家› 图像分类

图像分类

第六章图像分类遥感图像分类就是利用计算机对遥感图像中各类地物的光谱信息和空间信息进行分析,选择特征,将图像中每个像元按照某种规则或算法划分为不同的类别,然后获得客观的地物信息的过程。

一般的分类方法可分为两种:监督分类与非监督分类。

将多源数据应用于图像分类中,发展了基于专家知识的决策树分类。

4.1 非监督分类非监督分类是指人们事先对分类过程不施加任何的先验知识,而仅凭数据(遥感影像地物的光谱特征的分布规律),即自然聚类的特性,进行“盲目”的分类;其分类的结果只是对不同类别达到了区分,但并不能确定类别的属性。

其类别的属性是通过分类结束后目视判读或实地调查确定的。

主要有两方法:ISODATA分类与K-Means 分类。

4.1.1 ISODATA分类ISODATA是一种遥感图像非监督分类法。

全称“迭代自组织数据分析技术”(Iterative Self-Organizing Data Analysis Technique)。

ISODATA使用最小光谱距离方程产生聚类,此方法以随机的类中心作为初始类别的“种子”,依据某个判别规则进行自动迭代聚类的过程。

在两次迭代的之间对上一次迭代的聚类结果进行统计分析,根据统计参数对已有类别进行取消、分裂、合并处理,并继续进行下一次迭代,直至超过最大迭代次数或者满足分类参数(阈值),完成分类过程。

操作步骤如下:(1)在主菜单中,选择File→Open Image File,打开待分类图像;(2)在主菜单中,选择Classification→Unsupervised→ISOData;(3)在Classification Input File选择分类的图像文件;(4)在ISODATA Parameters窗口中设置分类参数以及输出路径和文件名(图4-1);图4-1 ISODATA分类参数设置Mumber of Classes:Min,max:类别数量范围,一般输入最小数量不能小于最终分类数量,最大数量为最终分类数量的23倍;Maximum Iterations:最大迭代次数,迭代次数越大,得到的结果越精确,运算时间也越长;Change Threshold:变换阈值,当每一类的变化像元小于阈值时,结束迭代过程;Minimun # Pixel in Class:一类所需的最小像元数,如果某一类中的像元数小于最少像元数,则将其中的像元归并到距离最近的类型中;Maximum Class Stdv:最大分类标准差,以像素值为单位,如果某一类的标准差比该阈值大,则将该类分成两类;Minimum Class Distance:类别均值之间的最小距离,以像素值为单位,如果类均值之间的距离小于该值,则类别将被合并;Maximum # Merge Pairs:最大的合并类别;Maximum Stdev From Mean:距离类别均值的最大标准差,为可选项。

筛选小于这个标准差的像元参与分类;Maximum Distance Error:最大距离误差,为可选项。

筛选小于这个最大距离误差的像元参与分类;(5) 点击OK执行非监督分类,结果如图4-2所示。

图4-2 ISODATA分类结果前后对比4.1.2 K-Means分类K-均值算法也称c-均值算法,其基本思想是:通过迭代,逐次移动各类的中心,直至得到最好的聚类结果为止。

1、计算特征空间上均匀分布的最初类均值;2、用最短距离技术重复地把像元聚集到最近的类里;3、每次迭代重新计算了均值,且用这一新的均值对像元进行再分类。

除非限定了标准差和距离的阈值(这时,如果一些像元不满足选择的标准,他们就无法参与分类),所有像元都被归到与其最临近的一类里;4、这一过程持续到每一类的像元数变化少于选择的像元变化阈值或已经到了迭代的最多次数。

操作步骤如下:(1)在主菜单中,选择File→Open Image File,打开待分类图像;(2)在主菜单中,选择Classification→Unsupervised→K-Means;(3)在Classification Input File选择分类的图像文件;(4)在K-Means Parameters窗口中设置分类参数以及输出的路径和文件名(图4-3);图4-3 K-Means分类参数设置Number of Classes:分类数量,一般为最终分类数的23倍;Change Threshold % (0-100):变换阈值,当每一类的变化像元数小于阈值时,结束迭代过程;Maximum Iterations:最大迭代次数,迭代次数越大,得到的结果越精确,运算时间也越长;Maximum Stdev From Mean:距离类别均值的最大标准差,为可选项。

筛选小于这个标准差的像元参与分类;Maximum Distance Error:最大距离误差,为可选项。

筛选小于这个最大距离误差的像元参与分类。

(5)点击OK执行K-Means非监督分类,结果如图4-4所示。

图4-4 K-Means分类结果前后对比4.2 监督分类监督分类(supervised classification)又称训练场地法,是以建立统计识别函数为理论基础,依据典型样本训练方法进行分类的技术。

即根据已知训练区提供的样本,通过选择特征参数,求出特征参数作为决策规则,建立判别函数以对待分类影像进行的图像分类,是模式识别的一种方法。

要求训练区域具有典型性和代表性。

判别准则若满足分类精度要求,则此准则成立;反之,需重新建立分类的决策规则,直至满足分类精度要求为止。

常用算法有:判别分析、最大似然分析、特征分析、序贯分析和图形识别等。

其一般过程如图4-5所示:图4-5监督分类一般流程4.2.1 训练样本的选择(1)在主菜单中,选择File→Open Image File,打开分类图像;(2)选择图像视图窗口菜单Overlay→Region of Interest命令;(3)在Image视图窗口中选择Overlay→Region of Interest。

在ROI Tool窗口中,选择ROI_Type→Polygon;(4)在Window一栏中选择感兴趣区域绘制窗口,这里选择Image,然后在Image窗体中绘制一个多边形区域,然后右键单击两次结束,并在ROI Name中定义其类型。

依次定义其他的类型,这里定义了城镇建设用地、耕地、坑塘、河流以及农村居民地等5个类型(图4-6);图4-6 选择训练样本(5)选择Options→Compute ROI Separability进行训练样本可分离性计算;(6)在Select Input File for Separability窗口中选择计算训练可分离性的图像文件;(7)在ROI Separability Calculation窗口中选择计算可分离性的类型(图4-7);图4-7 ROI分离性计算(8)在ROI Separability Report窗口查看训练样本分离性报告,结果如图4-8所示。

图4-8 ROI分离性报告ENVI为每一个感兴趣区组合计算Jeffries-Matusita距离和Transformed Divergence。

在窗口底部,根据可分离性值的大小,从小到大列出感兴趣区组合。

这两个参数值为0 2.0,大于1.9说明样本之间可分离性好,属于合格样本;小于1.8,需要重选择样本;小于1,考虑将两类样本合成一类样本。

4.2.2 图像分类(1)选择主菜单Classification→Supervised→Maximum Likelihood命令;Supervised菜单下分类器说明:Parallelpiped:平行六面体分类器,根据训练样本的亮度值形成一个N维德平行六面体数据空间,其他像元的光谱值如果落在平行六面体任何一个训练样本所对应的区域,就被划分到其对应的类别中。

平行六面体的尺度是由标准差阈值所确定的,而该标准差阈值则是根据所选类的均值求出;Minimum Distance:最小距离分类器,利用训练样本数据计算出每一类的均值向量和标准差向量,然后以均值向量作为该类在特征空间中中心位置,计算输入图像中每个像元到各类中心的距离,到哪一类中心的距离最小,该像元就归入到哪一类;Mahalanobis Distance:马氏距离分类器,计算出入图像到各训练样本的马氏距离(一种有效的计算两个未知样本集的相似度的方法),最终统计马氏距离最小的,即为该类别;Maximum Likelihood:假设每一个波段的每一类都呈正态分布,计算给定像元属于某一训练样本的似然度,像元最终被归并到似然度最大的一类当中;Spectral Angle Mapper:波谱角分类(SAM)是一个基于自身的波谱分类,它是在N维空间将像元与参照波谱进行匹配。

这一算法是通过计算波谱间的角度(将它们作为具有维数等于波段数特征的空间矢量进行处理),判定两个波谱间的相似度。

SAM把端元波谱矢量和像元矢量放在N维空间中进行角度比较。

较小的角度代表像元与参考波谱匹配紧密。

大于指定的最大弧度阈值的像元不被分入该类。

Binary Encoding:二进制编码分类技术根据波段是低于波谱,还是高于波谱平均值,将数据和端元波谱编码为0和1。

使用“异或”逻辑函数对每一种编码的参考波谱和编码的数据波谱进行比较,生成一幅分类图像。

除非指定了一个最小匹配阈值(这时,如果一些像元不符合标准,它们将不参与分类)所有像元被分类到其匹配波段最多的端元一类中;Neural Net:指用计算机模拟人脑的结构,用许多小的处理单位模拟生物的神经元,用算法实现人脑的识别、记忆、思考过程应用于图像分类;Support Vector Machine:支持向量机分类(SVM)是一种建立在统计学习理论基础上的机器学习方法,SVM可以自动寻找那些对分类有较大区分能力的支持向量,由此构造出分类器,可以将类与类之间的间隔最大化,因而有较好的推广性和较高的分类准确率。

(2)在Classification Input File窗口中选择分类的图像文件;(3)在Maximum Likelihood Parameters中设置最大似然法分类的参数(图4-9);图4-9 最大似然法分类参数设置Select Classes from Regions:选择训练样本,点击Select All Items按钮,选择全部的训练样本;Set Probability Threshold:设置似然度的阈值。

Single Value,则在Probability Threshold文本框输入一个01的值,似然度小于该阈值不被分入该类。

这里选择“None”;Data Scale Factor:数据比例系数,用于将整型反射率或辐射率数据转化为浮点型数据;Preview按钮可以在右边窗口中预览分类结果,单击Change View可以改变预览区域。

相关主题