图像分割方法综述摘要:图像分割就是根据图像的某些特征或特征集合的相似性准则对图像进行分类,把图像空间分成若干个某些具有一致性属性的不重叠区域。
它是图像分析和理解的基础,是计算机视觉领域中最困难的问题之一。
图像分割的质量将直接影响着对图像的后续处理,所以图像分割被视为图像处理的瓶颈,具有十分重要的意义。
人们很早就开始了对图像分割方法的研究,并且几十年来,这方面的研究从来没有间断过。
到目前为止,已经有大量的关于图像分割的理论、技术、方法被人们相继提出并广泛应用。
关键字:图像分割;阈值;区域和边缘;交互式算法;纹理分割彩色图像分割1.引言图像分割是一项基于计算机技术的重要的图像分析和处理技术,从其产生至今,已经广泛的应用于各个领域,为人们的生产和生活中图像处理的水平提高做出了重大贡献。
2.国内外发展的状况人工生命是一个快速发展的多学科交叉的研究领域,是计算机科学新的发展方向之一。
目前,已经有科研人员尝试将人工生命应用到图像分割领域中。
虽然目前使用人工生命进行图像分割的研究还比较少,但是这些相关研究成果表明将人工生命引入到图像分割中能获得有意义的成功,显示出了巨大的潜力。
在医学数据可视化方面,也有了许多硕果。
如:医学图像如CT图像和MRI图像的三维重建、显示与分析处理;大脑生理形态分析,神经细胞中钙活性的可视化;计算机辅助外科手术模拟与计划等。
其中值得一提的:如美国国家超级计算机应用中心利用远程的并列计算机资源,用体绘制技术实现了CT扫描三维数据的动态显示。
其内容为显示一个狗心脏跳动周期的动态图像。
3.图像分割概述人类感知外部世界的两大途径是听觉和视觉,尤其是视觉,因此图像信息是非常重要的一类信息。
在一幅图像中,人们往往只对其中的某些目标感兴趣,这些目标通常占据一定的区域,并且在某些特性(如灰度、轮廓、颜色、纹理等)上和周围的图像有差别。
这些特性差别可能非常明显,也可能很细微,以致人眼觉察不出来。
计算机图像处理技术的发展,使得人们可以通过计算机来获取与处理图像信息。
现在,图像处理技术已经成功应用于许多领域,其中,纸币识别、车牌识别、文字识别、指纹识别等已为大家所熟悉。
图像分割是指将一幅图像分解为若干互不交叠的、有意义的、具有相同性质的区域。
好的图像分割应具有以下特征:(1)分割出来的各区域对某种性质(例如灰度、纹理)而言具有相似性,区域内部是连通的且没有过多小孔。
(2)相邻区域对分割所依据的性质有明显的差异。
(3)区域边界是明确的。
大多数图像分割方法只是部分满足上述特征。
如果强调分割区域的同性质约束,则分割区域很容易产生大量小孔和不规则边缘;若强调不同区域间性质差异的显著性,则易造成不同性质区域的合并。
具体处理时,不同的图像分割方法总是在各种约束条件之间寻找一种合理的平衡。
4.图像分割算法的具体分类目前从国际上的图像分割方法来看,具体的操作过程中的分割方法的种类是非常繁多和复杂的,并没有一个公认的统一的标准。
虽然图像分割算法的分类并不影响它的使用,但是优化其分类可以帮助我们更好的筛选和取得需要的图像信息。
尤其是面对不同的图像处理对象,明确的分类可以使得我们更好的从事图像分割的研究工作。
基于这种分类理念,我们将图像分割算法分为常见的这样几类,即基于阈值的方法、基于聚类的方法、基于区域和边缘的方法、基于全局优化的方法以及其他方法,并逐一进行简要介绍。
4.1基于阈值的方法相较于以上的其他图像分割方法,该方法是目前实践中应用最广的一项技术,它的操作优势是比较明显的,即操作简便易行,且效果良好,能够满足大部分普通的图像分割的需要。
该方法的主要工作原理是通过图像中的待分割出的目标图像和其余的图像背景的灰度的不同,定义一个阈值,以达到在图像中将二者的属性区别开的目的。
这种基于图像的属性的分离和切割方法可以更好的确定目标图像,达到分割的效果。
聚类法作为基于阈值的最主要的分割方法之一,是实践中最为常用的,其工作原理主要将各种图像的组成部分划分为不同的区域,并选择一定的图像样本进行区域间的分类,以达到一个图像切割的目的,这种方法的优点是便于不同特性的图片的统一提取,大大的提高了图像的切割效率。
4.2基于区域和边缘的方法所谓图像的区域和边缘,就是整体图像的可对称部位,操作中我们根据图像的不同的对称和比例问题,将图像划分为整齐的各个区域。
这种方法的划分图像的特点和传统的区域分割算法有着异曲同工之处,即通过对于某种图像的对称的特性的利用,达到将图像分块的目的。
但是经过实践检验,我们发现这种算法的应用范围受限,即主要应用于面积较小的图像处理的过程中,并且其分割的效果极易受到种子点的位置的影响,不便于操作中的灵活掌握。
所以,针对于这种传统的区域分割法的缺点,新型的基于区域和边缘的对称分割法应运而生。
这种新型的算法的最主要的表现形式是区域分裂-合并方法,这种方法研发至今已经收到了良好的效果反馈,其作用原理主要是将相邻的图像模块进行有序的分裂,并在分裂的过程中根据不同的特性进行重组。
区域分裂-合并算法的合并标准是根据操作员的具体设定而随时调整的,这样就便于图像的分割和合并的过程的灵活操作。
但是随着该技术的不断的应用和创新,业内同仁在应用中摸索出了一些合并的有效方式和执行原则,为该方法提供了更好的操作技术指导。
增加了满足合并条件的相邻区域的匹配率,减少了算法的迭代次数,提出了一种新的分裂-合并算法并行方案,有效提高了算法的效率。
边缘检测是底层视觉处理中最重要的环节之一。
在图像中边界表明一个特征区域的终结和另一个特征区域的开始,边界所分开区域的内部特性是一致的,而不同区域内部特性是不同的,边缘检测正是利用了目标和背景在某种图像特性上的差异来实现的,这些差异包括灰度、颜色或者纹理特征。
简单地说边缘检测方法通过检测包含不同区域的边缘来解决图像分割问题,由于在不同区域之间的边缘上像素灰度值得变化明显,所以常常利用图像一阶导数的局部极大值和二阶导数的过零点特征来作为判断边缘点的依据。
4.3基于全局优化的方法基于全局优化方法的基本思想是建立一个全局的评价函数,或者称能量函数,每一种可能的分割结果都会对应能量函数的一个值,而使得能量函数值最小的方法是最优的分割方法。
这类方法能够利用图像的全局信息,因此往往能得到很不错的效果,但是由于需要在一个及其庞大的解空间中寻找最优解,因此它们的速度一般比较慢。
利用马尔代夫穗机场进行图像分割是典型的基于全局优化的方法。
最近越来越多引起人们关注的基于Graph Cuts的图像分割方法也具有明显的能量函数的形式,它的能量函数具有与使用马尔科夫随机场的方法相似的形式。
5.当前常见的图像分割方法介绍5.1基于图论的图像分割方法基于图论(Graph Theory Based)的图像分割方法使用加权图(Weighted Graph)来映射图像,图像的像素对应图的节点集,像素之间的相邻关系对应边集,节点的属性对应像素的特征信息(比如灰度、颜色甚至运动信息),边的属性(即边上的权重)对应像素之间的差别(Difference)或相似性(Similarity)。
使用基于图论的方法进行图像分割有很多优点。
首先,有很好的数学基础。
图论经过了很长时间的发展,无论在理论上还是在实践上都比较成熟;针对局部某一个方面,有很多算法进行处理,尤其有可用的优化算法。
其次,将图像映射为图之后,图像的特征就在图论领域进行处理了,这种映射有很好的类比性。
然后,在基于图论的图像分割方法中,图像区域的提取与边的提取是一个问题,因为分割之后连通区域(Connected Region)的边界就是区域的边。
这样,提取的区域边界永远是合并的,这不需要额外的条件和准则来处理和判断。
将图像映射到图之后,我们可以使用图论中很多成熟的理论和数学工具来进行图像分割,比如基于最小生成树(MST-based)、最小割/最大流(MinimumCut/Maximum Flow)、归一化切割(Normalized Cut)、图谱(Spectral Graph)以及能量最小化的理论。
首先从使用理论方法的角度看,我们可以将基于图论的分割方法分为基于最小生成树方法、最小割/最大流方法、谱方法等。
其次,从分层实现的角度看,基于图论的方法可以分为一般图方法和分层图(HierarchicalGraph)方法。
前者仅仅使用一个层次的图来映射图像;后者使用一个金字塔结构来描述图像的分割过程,在金字塔的每一层,都对应一个图来描述分割的过程和结果,是一个层次式的结构。
5.2纹理分割方法纹理分割就是把具有相同或一致纹理特性的区域聚类为一个大的区域。
因此,纹理是一种区域特性,要在一定范围的区域上才能反映或测量出来。
在图像处理中,图像分割是一个基本但又困难的工作,而纹理分割又是图像分割中的难题。
研究纹理分割主要涉及三个问题:(1)如何从图像中提取纹理特征。
(2)如何有效地从测量出的众多纹理特征中提取用于分割的特征。
(3)如何有效地分割图像。
纹理分割方法大致可以分为两类:一类是传统的统计模型方法,即通过分析局部空是关系,如共生矩阵、二阶矩统计、马尔可夫随机场和局部线性变换;另一类滤波理论方法,如Gabor滤波和小波变换。
纹理分割过程一般分为如下两步:特征抽取和特征建模。
特征抽取在纹理分割过程中起相当重要的作用。
可以说,如果抽取的纹理特征能够有效地区分不同纹理,那么纹理分割就变得很容易。
目前还没有一种有效的方法,可以描述所有的纹理图像,一方面是由于纹理图像的情况太复杂;另一方面是由于对纹理的理解还不够。
人们一直在尝试采用各种方法来描述纹理,力求对纹理的描述更准确和符合人们对图像处理的要求。
特征建模就是怎么有效地利用得到的特征图像分割纹理,以取得满意的分割效果。
主要的特征建模方法有:区域生长、聚类和阈值、估计理论方法、变方差方法等。
5.3彩色图像分割人眼由于对亮度具有适应性,在一幅复杂图像的任一点上人眼只能识别几十种(人眼的灰度级敏感区不超过20个灰度级,但却可识别成千上万种颜色)。
许多情况下,单纯利用灰度信息无法从背景中提取出目标,还必须借助于色彩信息。
由于彩色图像提供了比灰度图像更多的信息,因此随着计算机处理能力的快速提高,彩色图像处理正受到人们越来越多的关注。
彩色图像分割大多数是在灰度图像分割算法的基础上发展起来的,即利用灰度图像分割算法和不同的彩色空间对彩色图像进行分割。
人眼所感知的色彩是由通常称为三原色的红(R)、绿(G)、蓝(B)3种颜色混合而成。
RGB适合于显示系统,却不适合于图像分割分析,因为R、G、B3个分量是高度相关的,即只要亮度改变,3个分量都会相应改变。
而且,RGB是一种很不均匀的颜色空间,所以两种颜色之间的色差不能表示为该颜色空间中两点间的距离。