光学遥感图像多目标检测及识别算法设计与实现作者:姬晓飞秦宁丽来源:《计算机应用》2015年第11期摘要:针对目前光学遥感图像处理与分析多集中在单目标检测及识别领域的局限性,多目标检测及识别成为了一个非常值得关注的研究课题,提出了一种光学遥感图像多目标检测及识别算法。
首先,采用自适应阈值算法对目标快速检测分割;然后,结合图像金字塔思想和基于尺度不变特征变换的特征包(BoFSIFT)特征提出了一种分层的BoFSIFT特征表示目标的全局特征和局部特征,详细地描述了目标的分布特性;最后,采用基于径向基核函数的支持向量机为弱分类器的AdaBoost算法,经过不断更新权重之后得到一个强分类器对待测试目标图像完成分类识别,识别率达到了93.52%。
实验结果表明,所提算法对多类遥感图像目标的分割效果显著,特征选取恰当,识别方法快速有效。
关键词:光学遥感图像;多类目标;自适应阈值;基于尺度不变特征变换的特征包特征;AdaBoost算法中图分类号: TP751.1文献标志码:A0引言光学遥感图像通常是指可见光和部分红外波段传感器获取的影像数据,其直观易理解,空间分辨率通常比较高,在有光照和晴朗的天气条件下,图像内容丰富,目标结构特征明显,便于目标分类识别。
随着遥感技术和模式识别技术的发展,对光学遥感图像多目标分类和识别的研究已引起了广泛关注,它的发展对对地观测、军事侦察等领域有广泛的意义[1]。
基于光学遥感图像的多目标检测与识别研究主要涉及目标分割检测、特征提取和目标识别3个阶段。
目标的检测分割阶段是提取遥感图像信息的重要准备环节,在目标点检测的基础上,依据特征把图像划分成多个区域[2]。
文献[3]对纯海洋背景和海陆背景两种情况下的舰船目标分别用区域生长法和先验法完成目标分割;文献[4]对传统的圆形检测Hough变换方法作了改进,首先是计算目标梯度场检测油库圆心坐标,然后通过计算梯度值加权估计半径值以便对目标准确定位;文献[5]首先用小波分析建筑物目标,然后结合马尔可夫随机场(Markov Random Field,MRF)完成检测分割。
目标的特征提取阶段对识别结果有至关重要的作用,通过提取图像的某些直观自然特征或变换得到的构造特征在实现数据压缩的同时,提高目标之间的特征差异性。
文献[6]提出了一种通过对遥感图像提取局部纹理特征的纹理分类算法;文献[7]提出了一种新的圆形目标提取方法,该方法耗时低、检出率高、抗噪能力强;文献[8]提出了一种新的由粗到细的飞机识别方法,采用Sobel算子提取边缘特征和加权像素位置后识别效果明显改善了。
以上方法由于选取特征单一,对遥感图像目标的准确识别具有一定的局限性。
文献[9]综合轮廓、小波系数和原来的位图等特征对飞机型号进行识别;文献[10]提出了一种基于光学遥感图像形状和纹理特征融合的舰船识别方法,取得了良好的效果;文献[11]融合点特征和表观特征,提高目标的正确识别率。
目标识别阶段是对光学遥感图像中的目标通过某种分类器准确定位识别。
文献[12]提出主从神经元结构的模糊神经网络用于大型舰船的分类识别;文献[13]采用主成分分析(Principal Components Analysis, PCA)降维方法和有向无环支持向量机(Support Vector Machine,SVM)分类器对飞机识别取得了较高的识别率;文献[14]提出稀疏矩阵形式为特征的目标识别方法,既对不完整的遥感图像具有更好的鲁棒性,在小样本低采样率情况下也能具备良好的识别性能。
目前,基于光学遥感图像的多目标检测及识别方法存在以下问题: 1)选用的特征对于目标旋转的适应性较差;2)检测和识别方法大多只能处理一种特定类别目标的检测和识别,无法实现多种目标的同时检测和识别。
针对以上问题,本文提出一种光学遥感图像的多目标检测及识别算法,首先采用自适应阈值分割算法实现多目标检测与分割,然后在特征提取阶段将图像金字塔的分层思想与基于尺度不变特征变换的特征包(Bag of FeatureScale Invariant Feature Transform, BoFSIFT)特征有效结合,提出了一种分层的BoFSIFT特征,最后选用基于SVM的AdaBoost算法对多目标遥感图像进行分类识别。
该算法实现简单,可以同时实现光学遥感图像的多目标准确分类。
第11期姬晓飞等:光学遥感图像多目标检测及识别算法设计与实现计算机应用第35卷1算法的总体框架如图1所示为本文算法的总体框架:在训练过程中,采用手动分割得到目标的图像,并进行归一化处理,之后对其提取分层的BoFSIFT特征并训练支持向量机得到分类器;在测试过程中,将包含多个待识别目标的光学遥感图像通过自适应阈值分割得到待识别的目标图像,进行归一化处理后同样提取分层的BoFSIFT特征,送入训练过程得到的SVM分类器,然后采用基于支持向量机的Adaboost算法实现目标识别的准确识别。
图片图1本文算法的总体框架2分割算法阈值分割法是一种基于全局的图像分割方法[15-17],典型的有:分水岭分割、区域跟踪分割、聚类分割等。
传统的阈值分割法效果多依赖于图像灰度分布良好的双峰性质。
由于本文的遥感图像均属于光学遥感图像,因此分割算法应该对光照天气有一定的适应性。
由于图像背景往往比较复杂,多个目标间的灰度级存在较大差异,因此采用固定阈值进行多目标的同时分割是很难实现的。
基于以上分析本文采用局部自适应阈值分割算法[18-20]对光学遥感图像多目标进行分割,通常这类算法具有较强的适应性,它是根据像素所在邻域块的像素值分布来确定该像素位置上的二值化阈值。
对于一幅大小为H×H的光学遥感图像f, f(x,y)表示第x行、第y列的像素点灰度值,本文对图像中的每一个邻域块高斯加权求取一个阈值,从而构造出整幅图像的一个阈值平面,记为T(x,y),然后利用这个阈值平面对图像完成二值化操作,阈值化后的像素点灰度值g(x,y)用式(1)表示:g(x,y)=black,f(x,y)≤T(x,y)white,f(x,y)>T(x,y)(1经典的局部自适应阈值分割算法主要有Bernsen法、Niblack法以及Sauvola法等。
本文选取其中的Sauvola法[21],是通过计算图像当前点在窗口w×w内的加权均值m(x,y)和标准差s(x,y)得出相应的阈值,以一种自适应的方式调节方差的贡献,对w×w窗口中心像素点,给定参数k,标准差s(x,y)的最大值R,则该阈值计算公式为:T(x,y)=m(x,y)1+ks(x,y)R-1(2式(2)涉及到的第1个参数w的选择对阈值分割效果影响较大:若w取值过大,自适应程度低,则有可能失去局部处理的意义,导致算法运行速度较慢;若w选择过小,自适应程度高,则可能导致前景或背景内部产生噪声干扰。
第2个参数k对图像的分割效果也有着一定的影响:随着k取值的增大,目标的宽度变粗;随着k取值的减小,目标的宽度变细。
第3个参数R取标准差的最大值,局部加权均值m(x,y)和标准差s(x,y)根据像素局部邻域的对比度调节阈值的选取。
当图像的一些区域具有较高的对比度时s(x,y)≈R使得T(x,y)=m(x,y),当局部邻域的对比度较低时阈值T(x,y)往往低于平均值,因而可以成功地消除背景中的阴影部分。
在复杂的光学遥感图像上采用自适应阈值算法得到的图像分割效果如图2所示。
图片图2分割效果示意图由图2可以看出,图2(a)的分割效果较图2(b)的分割效果要好,观察图2(b)可以发现分割框与目标有匹配不够准确的现象,如船舰分割中其中一艘船的背景信息比较多,汽车分割中未能将紧挨着的多辆汽车逐一分开,油罐分割中目标由于阴影的干扰未能完全分割出来,之后可以采用滑窗法对目前初步分割出来的区域进行特征提取和识别,给出更加精确的目标区域。
飞机分割中跑道也作为目标被分割出来,后期的识别方法可以很容易地对目标和非目标作一个分类处理,剔除分割出来的背景图像。
阈值分割本身没有将图像的空间信息考虑在内,并且当图像前景与背景或目标与目标之间灰度信息可区分性不高时,可能会有冗余信息或是部分目标被遗漏。
鉴于本文分割操作的出发点是将目标尽可能全部检测出来,对于不够准确的区域可以在后期的识别中进行进一步的精确处理。
3特征提取由于BoFSIFT [22-24]特征不仅仅满足其他特征所具有的尺度缩放、亮度变化不变性,最重要的是它具备一定的旋转鲁棒性,被广泛地用于目标图像的特征表示。
它的不足之处是对目标的分布特性不能很好地表征,而基于图像金字塔思想的分层特征能弥补BoFSIFT特征的不足,因此本文将分层思想与BoFSIFT特征有效结合,提出了一种新的分层BoFSIFT特征用于目标图像的特征表示。
生成BoFSIFT描述子的步骤是:1)将所有训练集图像的SIFT描述子进行KMeans++聚类[25],形成K个基础词汇的单词表;2)将图像SIFT特征点向单词表作投影,统计单词表中每个词汇获得的票数,构成一个表征这幅图像的K维向量。
在BoFSIFT特征基础上再加入空间金字塔[26]思想,形成的分层的BoFSIFT特征,能有效地表示图像的局部特征和全局特征,并能表示图像关键点的分布特性。
分层的BoFSIFT特征整个提取过程为:1)生成图像BoFSIFT特征描述子:样本数为m幅图像,聚类中心数为K,最终提取的BoFSIFT特征是K维;2)构造图像金字塔:将原图像分成不同的块,构造一个三层的图像金字塔,第一层为整个图像,第二层将整个图像划分为2×2个子块,第3层将整个图像划分为4×4个子块;3)基于金字塔结构的特征表示:在图像金字塔中的每一层子块中生成K个视觉码字的BoFSIFT描述子,将每层的直方图描述子等比例组合构造21个K维特征列向量。
分层的BoFSIFT特征提取算法过程如图3所示。
图4中的直方图第1行为四类目标(74×4)的特征值叠加后的表示,第2行和第3行分别为四类目标第一幅原图像和旋转10°后图像的特征表示,横向分析表明不同目标的特征可区分性较强;纵向分析表明同一目标的特征具有较高的相似度,该特征对于一定范围的目标旋转具有适应性。
图片图3分层的BoFSIFT特征提取算法示意图不同目标分层的BoFSIFT特征表示如图4所示。
图片图4不同目标分层的BoFSIFT特征表示4识别算法支持向量机[27]是一种在处理小样本、非线性及高维模式识别中有很大优势的分类算法,能有效地克服样本数对传统的统计模式识别方法的依赖。
SVM实际中解决的大多数分类问题属于非线性,它通过选择合适的核函数变换样本到高维空间,使得变换后的样本线性可分。