基于K-means算法分割遥感图像的阈值确定方法研究赵红丹;田喜平【摘要】In current remote sensing image segmentation threshold determination method ignores the foreground and background of inner link, lead to segmentation and contour fuzzy, poor performance as a whole was caused.For this, a new kind of remote sensing image segmentation based on K-means algorithm were put, and a method for determining the threshold value of by K-means algorithm for remote sensing image segmentation forward.The between-cluster variance method are used to get the initial threshold segmentation of remote sensing image based on the threshold will remote sensing image was divided into two categories, the average of two types, as K-means clustering algorithm of two initial clustering center, through the K-means clustering method of successive iteration, constantly updated clustering center, until get the clustering criterion function, thus the optimal threshold segmentation of remote sensing images.The experimental results show that the proposed method is adopted to define in the remote sensing image segmentation threshold, not only high efficiency, and overall superior performance.The threshold value of application in remote sensing image segmentation will be got, can separate the target and background is effective, and the target after separation section outline clearer.%当前遥感图像分割中阈值确定方法忽略了前景和背景内在的联系,导致过分割和轮廓模糊,造成整体性能低下.为此,提出一种新型基于K-means算法分割遥感图像的阈值确定方法,通过K-means算法对遥感图像进行分割,利用最大类间方差方法得到分割遥感图像的初始阈值,依据该阈值将遥感图像划分成两类,求出两类的均值,将其作为K-means聚类算法的两个初始聚类中心,通过K-means聚类方法逐次迭代,不断更新聚类中心,直至得到聚类准则函数,从而求出遥感图像的最佳分割阈值.实验结果表明,采用所提方法确定遥感图像分割中的阈值,不仅效率高,而且整体性能优越;将得到的阈值应用于遥感图像分割中,能够使目标和背景被有效分离,且分离后目标部分轮廓比较清晰.【期刊名称】《科学技术与工程》【年(卷),期】2017(017)009【总页数】5页(P250-254)【关键词】K-means算法;分割;遥感图像;阈值确定【作者】赵红丹;田喜平【作者单位】安阳师范学院计算机与信息工程学院,安阳 455000;安阳师范学院软件学院,安阳 455000【正文语种】中文【中图分类】TP391.41随着遥感数据的逐渐增加,人们对遥感数据的处理需求越来越高,遥感图像的分割恰好可以解决这一问题[1,2]。
因为遥感图像的复杂性,使得遥感图像的分割较为困难,而遥感图像分割中阈值的选择是分割过程中最基本的难题之一[3,4]。
阈值是否选择恰当对遥感图像的分割效果起着决定性的作用[5]。
因此,研究遥感图像分割中阈值确定方法具有重要意义,已经成为相关学者研究的重点课题[6,7]。
文献[8]提出一种基于双峰法的遥感图像分割中阈值确定方法,该方法假设遥感图像由前景与背景构成,在灰度直方图上,前景与背景均形成高峰,双峰之间的最低谷处即为遥感图像分割的阈值。
该方法在遥感图像前景和背景对比较为强烈时效果较好,否则效果较差;文献[9]提出一种基于灰度拉伸的增强型大津法,将其应用于遥感图像分割的阈值确定中,该方法在大律法的基础上,通过提高灰度级别增强前后景的灰度差,将灰度差最大处作为最佳阈值。
该方法实现过程简单,但在实际应用中,灰度级别不同时,遥感图像分割效果相差较大;文献[10]提出一种基于Kirsh算子的遥感图像分割中阈值确定方法,针对遥感图像的各像素,对其八个邻点的灰度值进行计算,将其中三个相邻点的加权和与其他五个相邻点的加权和作差,令三个邻点绕该像素点不断移位,将八个差值的最大值作为Kirsh算子,也就是最佳阈值。
该方法能够使遥感图像分割质量提高,但实现过程复杂,不适于实际应用。
本文提出一种新的基于K-means算法分割遥感图像的阈值确定方法,通过K-means算法对遥感图像进行分割,通过最大类间方差方法得到分割遥感图像的初始阈值,将两种方法结合在一起求出遥感图像的最佳分割阈值。
实验结果表明,所提方法整体性能优越。
1.1 基于K-means算法的遥感图像分割K-means算法就是K-均值聚类算法,其基本思想如下:首先确定每个聚类子集的中心点,该中心点为各个子集内所有数据的均值,再依据最小距离准则经迭代将遥感数据集归类,在准则函数收敛的情况下分类达到最优,从而实现遥感图像的分割。
从总遥感数据量是n的样本集中随机抽取k个数据对象作为K-means算法的初始聚类中心,根据最小距离原则把总所有遥感数据样本划分至与其距离最短的聚类中心所处的类中,公式描述如下:Di=min{‖x-Ck‖};x∈DataSet式(1)中,Ck用于描述某一类。
依据式(2)描述的最佳判别准则函数不断对新得到的每个聚类中全部数据样本均值进行更新:式(2)中,μk用于描述每一个Ck类的类中心;。
将得到的结果看作新的聚类中心,直到新的聚类中心不再变化,将当前类的均值看作聚类中心,得到的类即为最终的遥感图像分割结果。
1.2 基于最大类间方差的阈值初确定最大类间方差方法是在最小二乘法原理的基础上推导出来的,其基本思想如下:将某一灰度作为阈值,把遥感图像直方图划分成两组,求出两组的方差,当两组间方差最大时,以相应灰度值为阈值,对遥感图像进行分割。
假设一幅遥感图像的灰度值共m个,灰度值为i的像素数为ni,则总像素数可描述成:各灰度值的概率可描述成:Pi=ni/N依据k值将其划分为C0=(1,…,k)和C1=(k+1,…,m)两组,则每组产生的概率如下:C0组产生的概率为C1组产生的概率为C0组的平均灰度值可通过式(7)求出:C1组的平均灰度值可通过式(8)求出:整体平均灰度值可通过式(9)求出:阈值为k时灰度的平均值可通过式(10)求出:则采样灰度平均值可描述成:μ=w0u0+w1u1两组间的方差可通过式(12)求出:d(k)=w0(u0-u)2+w1(u-u1)2在1-m之间改变k值,使得:d(k*)=max[d(k)]则k*即为所求阈值。
1.3 最佳阈值确定基于K-means算法分割遥感图像的阈值确定方法,方法实现过程如下。
(1) 通过最大类间方差法对分割遥感图像的初始阈值k*进行确定,通过得到的阈值将遥感图像划分成两类,将超过阈值k*的遥感图像像素灰度值定义成前景类,将低于阈值k*的遥感图像像素灰度值定义成背景类。
(2) 求出分类后两类的均值u0和u1,将u0和u1作为K-means聚类算法的两个初始聚类中心Z1(I)、Z2(I)。
(3) 通过K-means聚类方法逐次迭代,不断对聚类中心进行更新。
(4) 若两次相邻迭代的聚类中心未出现任何改变,则认为聚类准则函数已经收敛,结束迭代;反之,重新进行步骤(3),继续进行迭代。
(5) 遥感图像的最佳分割阈值可通过式(14)求出:T*=1/2(Z1+Z2)式(14)中,Z1、Z2分别用于描述前景类和背景类的最终聚类中心。
为了验证本文方法的有效性,需要进行相关的实验分析。
实验将最大熵方法和简单统计方法作为对比,选择300张遥感图像作为备用研究对象,对本文方法的性能进行验证。
2.1 阈值确定方法定量评价从运行时间、测定阈值与人工选择阈值之间的差异两方面对本文方法的性能进行评价。
表1描述的是针对5张不同的遥感图像,采用本文方法、最大熵方法和简单统计方法得到的运行时间及测定阈值与人工选择阈值之间的差异比较结果。
分析表1可以看出,针对不同遥感图像,本文方法运行时间一直低于最大熵方法和简单统计方法,不仅如此,通过本文方法求出的阈值和人工选择得到的阈值最为接近,说明本文方法不仅效率高,而且精度也较高。
下面将相对形状测度、相对均匀测度和错分概率作为评估准则,对本文方法的性能进行进一步的评价,因为上述评价指标都取决于遥感图像分割后得到的特征量值和目标固有特征值,能够有效反映阈值确定的合理性和准确性,相对形状测度和相对均匀测度均反比与遥感图像分割质量。
相对形状测度和相对均匀测度可通过式(15)和式(16)求出:RUM=[abs(um-ums)/ums]×100%RSM=[abs(sm-sms)/sms]×100%式中,ums、sms用于描述目标所固有的特征量。
均匀测度um为式(17)中,2,C用于描述归一化因子;Ri用于描述分割区域;f(x,y)用于描述像素(x,y)的灰度值;;Ai用于描述区域Ri的像素数。
形状测度可通过式(18)求出:sm=式(18)中,用于描述邻域N(x,y)的灰度均值;t用于描述遥感图像的灰度阈值。
错分概率是一种可靠的评价标准,可通过式(19)求出:p(err)=p(O)p(B/O)+p(B)p(O/B)式(19)中,p(O)、p(B)分别用于描述遥感图像中目标、背景的概率;p(B/O)、p(O/B)用于描述目标被错分为背景的概率。