当前位置:文档之家› 图像分割方法的比较研究

图像分割方法的比较研究

图像分割方法的比较研究
在计算机视觉的相关研究中,图像分割是连接低级视觉和高级视觉的桥梁和纽带,而图像分割是计算机视觉系统中最关键和重要的一个环节。

在概要介绍几种常用图像分割方法的基础上,比较了每种图像分割算法的优缺点及其适应范围,结果表明:不同工程应用中,应根据其需求与图像特点合理采用不同的图像分割方法以达到更好的处理效果。

标签:图象分割;图象处理
1 引言
近年来,随着工业、农业、医学、军事等领域自动化和智能化需求的迅速发展,对图像处理技术的要求也日益提高。

其中,对图像的自动识别与理解就是一项重要任务,而对图像进行分割来提取目标是其关键步骤之一,如果得不到合理的图像分割图,也就无法对图像进行正确的识别与理解。

在过去的四十多年里,图像分割的研究一直受到人们高度的重视。

迄今为止,研究者提出了上千种不同类型的分割算法,而且近年来每年都有上百篇相关研究成果发表。

但是,现有的方法多是为特定应用设计的,有很大的针对性和局限性,对图像分割的研究还缺乏一个统一的理论体系。

Fu和Mui从细胞学图像处理的角度将图像分割技术分为三大类:特征阈值或聚类、边缘检测和区域提取。

依据算法所使用的技术或针对的图像,Pal and Pal把图像分割算法分成了6类:阈值分割、像素分割、深度图像分割、彩色图像分割、边缘检测和基于模糊集的方法。

本文将依据上述两种分类方法进行深入研究。

2 图象分割方法
简而言之,图像分割(Image Segmentation)就是把图像中的物体与背景或物体与物体分割开,实现不同区域的特殊处理。

2.1 基于阈值的分割方法
这类方法简单实用,在过去的几十年间备受重视,其分类也不一而足。

根据使用的是图像的整体信息还是局部信息,可以分为上下文相关方法和上下文无关方法;根据对全图使用统一阈值还是对不同区域使用不同阈值,可以分为全局阈值方法和局部阈值方法;另外,还可以分为单阈值方(bileverthresholding)和多阈值方法。

阈值分割的核心问题是如何选择合适的阈值。

其中,最简单和常用的方法是从图像的灰度直方图出发,先得到各个灰度级的概率分布密度,再依据某一准则选取一个或多个合适的阈值,以确定每个像素点的归属。

选择的准则不同,得到的阈值化算法就不同。

下面就常见的几种阈值分割算法进行比较:
表1 几种阈值分割算法
准则阈值化方法优点缺点
分割得到的目标和背景的概率应该等于其先验概率p-分位数(p-title)法无需任何迭代和搜索严重依赖对先验概率的估值
最优阈值位于目标和背景两个概率分布的交叠处最频值法(也称mode法)计算简单要求直方图具有明显的双峰性
使目标和背景类的类内方差最小、类间方差最大Otsu方法计算简单、效果稳定要求目标与背景的面积值相近
图像的某种后验熵最大熵方法计算简单对直方图模型有要求
Bayes判别误差最小最小误差法计算简单,适用于目标与背景很不均衡的图像對直方图模型有要求
分割前后图像的矩量保持不变矩量保持法无需任何迭代和搜索稳定性不佳
2.2 基于边缘的分割方法
这类方法主要基于图像灰度级的不连续性,它通过检测不同均匀区域之间的边界来实现对图像的分割,这与人的视觉过程有些相似。

依据执行方式的不同,这类方法通常又分为串行边缘检测技术和并行边缘检测技术。

串行边缘检测技术首先要检测出一个边缘起始点,然后根据某种相似性准则寻找与前一点同类的边缘点,这种确定后继相似点的方法称为跟踪。

根据跟踪方法的不同,这类方法又可分为轮廓跟踪、光栅跟踪和全向跟踪三种方法。

全向跟踪可以克服由于跟踪的方向性可能造成的边界丢失,但其搜索过程会付出更大的时间代价。

串行边缘检测技术的优点在于可以得到连续的单像素边缘,但是它的效果严重依赖于初始边缘点,由不恰当的初始边缘点可能得到虚假边缘;较少的初始边缘点可能导致边缘漏检。

并行边缘检测技术通常借助空域微分算子,通过其模板与图像卷积完成,因而可以在各个像素上同时进行,从而大大降低了时间复杂度。

常见并行边缘检测方法有如下几种:Roberts算子,Laplacian算子,Sobel算子,Prewitt算子,Kirsh算子,LOG算子,Canny算子。

上述算法和其他边缘检测算法虽然在检测的准确性和边缘定位精度上有所差异,但是他们都有一个共同的缺点:不能得到连续的单像素边缘,而这对于分割来说是至关重要的。

因此,通常在进行上述边缘检测之后,需要进行一些边缘修正的工作,如边缘连通、去除毛刺和虚假边缘。

常用的方法包括启发式连接、相位
编组法和层次记号编组法等。

与串行边缘检测算法一样,边缘修正算法的代价也非常高。

2.3 基于区域的分割方法
基于区域的分割技术有两种基本形式:区域生长和分裂合并。

前者是从单个像素出发,逐渐合并以形成所需的分割结果。

后者是从整个图像出发,逐渐分裂或合并以形成所需要的分割结果。

与阈值方法不同,这类方法不但考虑了像素的相似性,还考虑了空间上的邻接性,因此可以有效消除孤立噪声的干扰,具有很强的鲁棒性。

而且,无论是合并还是分裂,都能够将分割深入到像素级,因此可以保证较高的分割精度。

区域生长算法先对每个要分割的区域找一个种子像素作为生长的起点,然后将种子像素邻域内与种子像素有相似性的像素合并到种子像素集合。

如此往复,直到再没有像素可以被合并,一个区域就形成了。

显然,种子像素、生长准则和终止条件是算法的关键。

然而,种子点的选择并不容易,有人试图通过边缘检测来确定种子点,但是,由于边缘检测算法本身的不足,并不能避免遗漏重要的种子点。

分裂合并算法则是先从整个图像开始不断的分裂得到各个区域,再将相邻的具有相似性的区域合并以得到分割结果。

这种方法虽然没有选择种子点的麻烦,但也有自身的不足:一方面,分裂如果不能深达像素级就会降低分割精度;另一方面,深达像素级的分裂会增加合并的工作量,从而大大提高其时间复杂度。

2.4 基于统计模式分类的分割技术
模式可以定义为对图像中的目标或其它感兴趣部分的定量或结构化的描述,图像分割可以被视为以像素为基元的模式分类过程,这一过程主要包括两个步骤:特征提取和模式分类。

阈值分割就相当于在一维(灰度)或二维(共生矩阵)特征空间进行的模式分类,它所使用的特征并没有充分反映像素的空间信息和其邻域像素的相关信息。

为了改善分割的效果,我们自然的想到使用能够充分利用图像信息的高维特征来描述每一个像素。

这类方法,对于无法由灰度区分的复杂的纹理图像显得尤为有效。

由于模式分类可以借鉴模式识别技术中的成熟算法,所以这类分割技术的主要差别在于特征提取的方法。

3 图像分割领域存在的问题
实践证明,图像分割问题的困难在于它既不属于完全的图像特征提取的问题,又不属于完全的物体识别的问题,其主要原因可归结如下:
(1)在简单的情况下,可以用图像中同一物体像素点的连通性和物体与背景的灰度差进行分割,但在有噪声的影响下或物体互相遮挡的情况下,连通性会被破坏;在复杂背景的情况下,仅用灰度差也不能区别物体与背景,而需要更复杂的灰度统计值。

(2)不同物体所对应的图像区域特征在一般情况下应是该区域中局部特征的统计量(例如灰度的均值、方差、相关性等),而统计量必须在己知区域边界的情况下才能计算。

这样,就陷入一个矛盾,即要分割必须计算统计量,要计算统计量又必须己知分割结果。

4 结论
在图像分割问题上,至今还没有建立起完善的理论体系,对众多的图像分割方法没有进行很好的归纳整理,还有大量的工作亟需完成。

与之同时,将多种图像分割方法综合运用,发挥各自的优势进行图像处理将成为这一领域的发展趋势。

参考文献
[1]R. M. Haralick, L. G. Shaprio, “Image segmentation techniques”, Computer Vision, Graphics,and Image Processing, 1985,(29):100-132.
[2]吴一全,朱兆达.图像处理中阈值选取方法30年(1962-1992)的进展
(一)[J].数据采集与处理,1993,(3):193-201.
[3]赵荣椿,迟耀斌,朱重光.图像分割技术进展[J].中国体视学与图像分析,1998,(2):121-128.
[4]王爱民,沈兰荪.图像分割研究综述[J].测控技术,2000,19,(5):1-6.
[5]罗希平等.图像分割方法综述[J].模式识别与人工智能,1999,12(3),300-312.。

相关主题