当前位置：文档之家› 计算机视觉综述

计算机视觉综述

式中, N为图象的象素点数, N= ,并且 =1因Pij为象素的灰度值i和其邻域均值j的共生概率密度,在绝大多数情况下, Pij的分布主要集中在( 1, 1) ~( L , L )对角线周围,且在灰度直方图无明显的峰和谷的条件下,也显现出明显的两个峰.从而可以合理地假设远离( 1, 1) ~ ( L, L )对角线的分量Pij是非常接近于0的,这符合绝大多数情况.假设在二维直方图中存在两类C 0和C1,它们分别代表物体与背景,且具有两个不同的概率密度函数分布.设阀值为( S , T ) ,那么两类的概率分别为
之间的谷值作为阈值,就很快地将一幅图像的背景与目标分割开了如图1～3所示
图1原始灰度图像图2图像灰度直方图
图3分割的优点在于实现简单,但是这只是针对少数不同类别物体彼此灰度相差很大时,才能进行有效的分割。当原始图像的灰度直方图的双峰不明显时,分割后得不到理想的图像。图4是原始Lena图像,图5是利用传统灰度直方图阈值分割结果。从图6可以看出在部分区域(如脸部、右边背景)分割效果较好,但是部分区域的细节部分(如帽子、头发等)未能将图像边界完整分割开来。
利用图像灰度直方图的特性确定分割阈值方法的原理是如果图像所包括的背景区域与所分的目标区域大小可比,而且两者在灰度上有着明显的区别,那么这样的图像的灰度直方图就会呈现很明显的双峰状。这样,其中一个峰值对应的是背景区域的灰度;而另一个峰值就对应的目标灰度了。理想的中的图像的灰度直方图,其背景灰度和目标灰度应对应两个不同的灰度峰值,所以选取位于两峰
2
2.1
经典的图像分割算法[2]诸如:直方图分割与阈值分割的方法具有实现简单、计算量小、
性能较稳定等特点。通常,它们是利用图像的灰度直方图的分布特征,找出灰度直方图分布的两波峰之间的波谷,选定恰当的阈值将图像分割开,然而这种分割方法依赖于图像灰度的分布,对灰度分布不呈双峰特征或复杂背景的图像,往往会造成错误分割。
由此，文献[3]对其进行改进，并结合直方图的极值点的信息，提出了一种新的多阈值分割算法。
该算法的大致思想如下：
首先利用类间方差最大的思想在整个阈值范围内找到最优的阈值点;然后该阈值把区间分成两类，即两个区间。分别计算两个区间的类间最大方差，在方差最大的那个区间内部进行下一次的分割，同时把剩下较小的方差保存起来，以等待下一次的阈值计算时，参加方差的比较，利用这种方法计算下去，直至达到用户设定的阈值个数。最后，在得到的这些阈值之后，利用直方图的特性，进行最终阈值的选择:根据平滑后的直方图，找到所有的波谷点。把得到的所有阈值与波谷点进行比较，找到最靠近阈值的波谷点作为最终的阈值。该多阈值分割法相对于传统的多阈值分割方法，不仅消除了部分的分割噪声，而且分割的效果和适应性都好于已有算法。
б= agr max(б(t1,t2,…,tM)) (3)
其中:
б(t1,t2,…tM)= *(uk-ut)2(4)
其中，wk，uk，ut分别表示在每一个类中出现的概率、均值和图像的总的均值。由于计算的复杂度过高，文献[4]对式( 4)进行了改进，由于图像的总的均值ut不变，所以利用公式:
б(t1,t2,…,tM)= *uk2(5)
w1= 对于每一个分割的阈值点t,求出方差：
б2=w0*(u0-ut)2+(u1-ut)2(2)
找出整个区间内最大的方差对应的阈值点t，即为所求阈值。
2.2.2 Otsu
传统的多阈值进行分割是，设有M个阈值把图像分成M + 1类，阈值区间被分成［0，1
，…，t 1］，［t1 + 1，…，t2］，…，［tM + 1，…，L -1］。在整个阈值空间内，找到最优的阈值组合［t1，t2，…，tM］使类间的方差最大，即:
表格中，可以很清楚的看出，文献[3]的算法的分割时间和其他算法相比，存在明显的优势，比经典的otsu和一些改进的算法相比也存在明显的优势，而且分割的效果也明显好于已有的算法。
可以把文献[3]的方法应用在边缘检测，模板匹配等方面。把分割后的图像，与边缘检测算子进行运算，能够得到较好的边缘信息，从而利用相应的模板匹配算法，进行对目标的识别。或是对分割后的目标进行特征提取，利用机器学习的相应算法进行样本的训练和学习，能够进一步提高识别的准确率，可以应用在人脸识别、交通标志的识别等方面。
来进行类间方差的计算。而文献[4]的方法在进行求阈值时，运算的复杂度仍然是按指数级上升的。当阈值个数大于3个时，算法的运行时间较长，不利于实时性的处理。文献[5]提出了一种分割速度较快的多阈值方法，它直接利用Otsu法找到首个阈值之后，再进行解阈值时，在两个子区间内寻找各自的阈值，每次找到两个阈值。该方法相对于传统的Otsu，是一种局部最优的分割方法。而传统的Otsu是一种全局最优的分割。但是文献[5]并没有考虑到，当一个阈值把区间分成两类时，可能一类里面是背景，而另一类里含有多个目标，却把背景又进行了分割，这是一种不合理的做法。
设一幅图像X具有L个灰度级( 0,1,2,…,L-1)，统计每个灰度值的像素点的频数ni，构造频数直方图。计算总的像素点的个数N= 。计算每个灰度值出现的概率:
Pi=ni/N =1 (1)
对于每个分割的阈值点t，假设把图像分成两类:目标和背景。计算［0，1，…，t］和
［t + 1，…，L－1］两者之间的方差б。首先计算整幅图像的均值ut= ，目标和背景的均值分别为u0= 和u1= ,目标和背景出现的概率为w0= 和
空间方法( spatial methods)
局部方法( local methods)
而基于直方图的阈值分割技术是应用最为广泛的一种方法，按照维数分，可以分为基于一维直方图和基于高维直方图(如二维和三维直方图),早期的阈值分割技术通常基于灰度直方图(也称一维直方图)选取目标函数,对许多图像难以进行较好的分割。随着研究的深入,国内外学者不断基于高维直方图(例如二维直方图和三维直方图)提出一些新的分割方法。而在这些技术中，熵阈值法和Otsu阈值法(也称最小类内方差法或最大类间方差法)是应用最广的两种方法。它们阐释了阈值分割的本质:先给出各种各样合理的目标函数,再最大化或最小化该目标函数来得到最佳分割阈值。
3
这里主要介绍二维情况下各种阈值分割方法。
3.1
一维Otsu阈值法采用类间方差作为目标函数,通过最大化该函数得到最佳阈值。
但是Otsu方法对噪声和目标大小十分敏感，它仅对类间方差为单峰的图像产生较好的分割效果，当目标与背景的大小比例悬殊时,类间方差准则函数可能呈现双峰或多峰,致使用该法选取的全局最大值并不一定是正确阈值,此方法失效。Reddi的快速算法也并未解决Otsu法准则函数极大值不唯一的缺陷。
降低时,分割效果并不理想。
作为信息度量的熵函数无疑是用于图像分割的一个恰当的目标函数。研究人员已提出许多熵阈值分割法,例如基于Shannon熵的阈值分割方法,基于Renyi熵的阈值分割方法、基于Tsallis熵的阈值分割方法等等[1]。这些原始的熵阈值分割法由于只处理灰度直方图,所以通常也被称为一维熵阈值分割法,尽管一维熵阈值分割法非常简单有效,但它对于单峰或者接近于单峰情况下的图像难以进行较好的分割。特别是存在噪声等干扰因素时,一维熵阈值分割法的效果往往很不理想。
计算机视觉
课程名称：计算机视觉
学号：
姓名：
******
二○一四年五月
基于直方图的图像阈值分割技术综述
1
图像分割就是把图像分成一些具有不同特征而有意义的区域,以便进一步的图像分析和理解。图像分割是众多图像处理和计算机视觉系统的重要组成部分,图像分割问题是图像处理与分析中的一个基本问题。图像分割需要将输入图像划分成两个或者多个子区域,这正是设计和实现医学图像分析、文本字符识别、目标自动获取等系统所面临的首要任务。由于图像分割问题的重要性和基础性,国内外学者历来对其高度重视,并提出了众多解决方法。阈值分割技术是一种非常流行的图像分割方法,它以图像直方图信息为主导,具备原理清晰、表述简单、运算快捷、效果良好等优点,因此一直受到研究人员的青睐,在实际应用场合中尤为明显。
此时很容易证明下列关系式成立:
W0+W1=1
(12)
定义一个类间的离散度矩阵:
刘健庄等使用SB的迹作为类间离散测度,有
(13)
利用公式(12)化简得：
(14)
类似于一维otsu,最佳阀值( s’, t’)满足下式
从本质上看,阈值分割方法基本上可以分为六大类[1]：
基于熵的方法(entropy-based methods)
基于聚类的方法( clustering-based metho ds)
基于直方图形态的方法( histogram-shape based methods)
基于目标属性的方法( object attribute-based methods)
算法流程图如下：
图7算法流程图
该算法每次寻找出1一个阈值，而文献[5]每次寻找出2个阈值，该算法考虑到，将每次计算得到的方差与之前分割得到的类的方差进行比较，选择最大的方差的类别里的阈值，这样做的原因是，方差大的类别里更加有可能存在目标，而方差小的类别里很有可能是背景，如果不对方差进行比较，那么，就很有可能将背景也进行分割了，即对同一个目标或者背景进行了多次分割，这样就很容易造成错分割和过分割的问题,这是不合理的。
W0 =Pr(C0) = W0( s , t )(7)
W1=Pr(C1) = W1( s , t )(8)
两类对应的均值矢量为:
= (9)
(10)
二维直方图上总的均值矢量为:
(11)
在绝大多数情况下,远离直方图( 1, 1) ~ ( L , L )对角线的Pij可以忽略不计,所以可以合
理地假设在两个区域: i= s+ 1,…, 1; j = 1,…, t和i= 1,…, s ; j = t+ 1,…, L有Pij = 0,
文献[3]的实验中,作者分别用文献[4],文献[5]以及本论文提出的方法做了实验,其中一组实验的效果如图:

e商务文档

计算机视觉综述

相关文档推荐：