收稿日期:2005-05-31 作者简介:李庆峰(1980-),男,山东烟台人,硕士研究生,主要研究方向:图像处理、模式识别、机器视觉; 付忠良(1967-),男,重庆合川人,研究员,博士生导师,主要研究方向:高速图像处理、模式识别、工业机器视觉; 粟伟(1980-),男,四川成都人,硕士研究生,主要研究方向:信息安全、RF I D 安全与隐私保护.文章编号:1001-9081(2005)11-2598-02基于分形维数的阈值选取方法李庆峰,付忠良,粟 伟(中国科学院成都计算机应用研究所,四川成都610041)(lqf mailbox@ )摘 要:普通的阈值选取方法只注重图像的灰度信息,而很少考虑图像的空间信息。
分形维数能很好地反映一幅图像的空间信息,在图像的处理与分析中得到了很好的应用。
提出了一种基于分形维数的图像阈值选取方法,实验证明对于灰度图像的阈值选取具有很好的实用效果。
关键词:分形;阈值;分维数;盒维数中图分类号:TP391.41 文献标识码:AI mage threshold selecti on ba sed on fract a l d i m en si onL IQ ing 2feng,F U Zhong 2liang,S U W ei(Institute of Co m puter A pplications ,Chinese A cade m y of Sciences ,Chengdu S ichuan 610041,China )Abstract:The common methods of threshold selecti on only use the gray inf or mati on of i m ages,notmaking good use of the s pace inf or mati on .Fractal di m ensi on is a good index of s pace inf or mati on of i m ages,widely used in digital i m age p r ocessing and analysis .A method of threshold selecti on based on fractal di m ensi on was p r oposed .Experi m ents show that it is effective t o the threshold selecti on .Key words:fractal;threshold;fractal di m ensi on;box 2counting di m ensi on 分形理论在数字图像处理中的应用,如基于分形理论的图像压缩方法与应用取得了不少成果[1~2]。
阈值选取方法[3~5]可以分为基于点的全局阈值方法,基于区域的全局阈值方法、局部阈值方法和多阈值方法,如p 2分位数法、类间方差阈值分割法、二维最大熵分割法、模糊阈值分割法、共生矩阵分割法、区域生长法等。
这些方法大部分是以图像的灰度统计信息为研究对象来进行阈值的选取。
本文提出了一种利用分形维数求阈值的新方法,它利用目标对象的分维特征作为阈值选取的依据,而不只是从灰度统计信息出发考虑,因而具有很好的实用效果。
1 分形理论及图像盒维数的计算大自然中的很多形状很不规则,甚至是支离破碎的,如天空中的云彩、地面上的海岸线、树皮等。
为了研究这些大自然的几何学,就诞生了一门新的数学分支———分形几何学。
分形目前还没有明确的定义,一般称具有以下典型性质的集合F 为分形:1)F 具有精细的结构,即具有任意小的比例细节;2)F 是如此的不规则以致于它的整体和局部都不能用传统的几何语言来描述;3)F 通常有某种自相似的形式,可能是近似的或是统计的;4)一般地,F 的“分形维数”(以某种方式定义)大于它的拓扑维数;5)在大多数令人感兴趣的情况下,F 以非常简单的方法定义,可能由迭代产生。
曼德勃罗指出分形具有三个要素:形状、随机和维数。
其中的维数是分维数,它不同于规则图形的整数维数。
分维是通过变换尺度得到的非规则图形的维数,它可以是分数。
分维是几何图形的一个重要特征量,反映了图形的形状特征。
分形维数的定义很多,其中以豪斯道夫维数最为古老也最为重要。
豪斯道夫维数具有对任何集合都可以定义的优点,由于它建立在相对容易处理的测度概念的基础上,因此,要理解分形的数学原理,豪斯道夫维数便是必要的,它也具有很强的应用普适性和方便性。
但是,它在很多情况下用计算的方法很难计算或估计它的值。
为了便于实际应用又提出了一种适合于数学计算及经验估计的计盒维数(也称盒维数)。
盒维数的定义:设集F <R n ,记N ε(F )是可以覆盖F 的,边长为ε的n 维立方体(记作εn2立方体)的最少个数,则F 的盒维数D B 定义为(当极限存在时):D B =li m ε→0log N ε(F )/(-logε)具体到图像来说,就是将图像划分为边长为ε的网格,然后计算出覆盖图像中目标区域的网格个数N ε(F ),根据分形的特征,当ε→0时,log N ε(F )/(-logε)→D B ,据此可求出分形维数D B 。
因此对于某递减序列ε,可以在坐标系统中拟合数据点(-log ε,log N ε(F )),其斜率就是F 的分形维数的近似值。
对于数字图像分维数的计算,以黑白位图为例,黑点表示目标的一个点,白点则表示背景区域。
因为数字图像是离散化的数据,其最小单位是一个像素,这使得ε无法无穷趋近0。
以图像的宽(或高)为原始ε,计算N ε(F ),然后逐步缩小ε,依次得到一个N ε(F )的序列。
ε的缩小可以以C 为比例(C 可以取2,3或5等),直至ε=1,然后求出-log ε和log N ε(F )。
在坐标系下以最小二乘法拟合直线得y =k 3x +b,则直线的斜率k 就是图像的盒维数D B 。
第25卷第11期2005年11月计算机应用Computer App licati onsVol .25No .11Nov .20052 阈值选取思想对于一幅灰度图像,按照阈值从小到大可以得到一系列的二值化图像,每幅二值化图像可以得到一个分维数。
由盒维数的计算公式为DB =li mε→0log Nε(F)/(-logε),可知不同尺度时网格个数直接影响着分维数。
在低灰度值时,二值化得到的只是一些无关联的噪声点;在尺度为1时,可以得到无关联噪声点的个数;当尺度变大时,因为这些噪声点是无关联地、随机地分布在图像中,网格个数会骤减甚至为零,此时计算得到的分维数是比较大的。
随着灰度值的升高,当目标物体在二值化后的图像中显示出来时,黑点集中在目标物体区域,随着尺度的放大,网格个数的变化是有规律的,这个规律反映了目标物体的分维数。
这样,从随机噪声点到出现目标物体,分维数会出现一个突变。
如果灰度值继续升高,目标会不再清晰,图像的背景会显示出来,黑点区域会明显扩大,随着尺度的变换,网格个数的变化基本是按照尺度的比例来变化的,这不同于目标物体的分维数,也会有一个突变。
只要找到这两个突变时对应的灰度值,就可以确定目标灰度值的大体范围,因而可以利用这两个灰度值来确定阈值,比如取二值的算术平均值。
3 具体实现对于一幅灰度图像,要计算分维数,如果按256个灰度值依次对图像进行二值化,再对二值化后的图像统计不同尺度时的网格个数,计算量太大。
在实际计算时,采取了一个简单算法。
在遍历图像统计不同灰度值的网格个数时,因为尺度依次增大,统计不同尺度的网格个数时,有重复计算(如统计尺度为2的网格个数时,得到了2×2模板的灰度值统计信息,当尺度变为4时,还要重新统计4×4即4个2×2模板的灰度值统计信息),通过算法可以简化计算,即计算2×2模板时,用一个点记录下这个模板的主灰度值信息,则遍历完后图像就变为原来的1/4。
在增大尺度时,只要统计缩小后的图像中相应2×2模板的信息即可。
分维数具体算法如下(假如以2为比例因子放大尺度):1)以1×1为尺度,遍历灰度图像,得到各个灰度值的点个数。
2)对于长度和宽度都以2为步长遍历图像(即遍历每一个2×2的模板)。
遍历过程统计模板内部具有的灰度值及其个数。
如果某个灰度值的个数大于等于模板的像素个数的3/4,则将该尺度下该灰度值的网格个数加1,并用这个灰度值代表这个2×2模板(这样就把图像压缩为原来的1/4)。
如果某个灰度值的像素个数大于等于模板像素个数的1/2并且小于3/4,则要计算其平均值,如果其平均值与该灰度值的距离不大于10,则将该尺度下该灰度值的网格个数加1,并用这个灰度值代表这个模板。
如果不符合上述条件,计算模板的平均值,用该值代表这个模板。
3)如果图像大于等于2×2,则转2)。
4)利用分维数计算公式得到分维数。
取适当的值D,以D为间隔计算分维数,这既减少了计算量又使得分维数的变化更加明显。
5)算法结束。
在步骤2)中之所以选取3/4,是考虑到目标区域的边缘部分并不是规则的模板形状,如果区域内像素数占模板像素总数的大部分,则认为是目标内的点。
对于2×2模板,选取3/4是最大比例。
对于其他模板可以选择适当的比例。
选取大于等于1/2并小于3/4,是考虑到噪声的影响,当存在大量噪声时,可以有效地去除噪声影响。
图1 实验图像用图1(a)做试验,以2为放大尺度,取5为间距计算分维数,得到变化率如表1(因灰度值小于65和大于95,分维的变化率很小,故表1没有列出)。
表1 灰度值和变化率对照表灰度值变化率(%)灰度值变化率(%)65 2.098520.3070 3.87907.13759.1295 2.1880 3.05选取变化率最大时对应的两个灰度值75和85。
可以看到以75为阈值进行二值化得到的图1(b),恰是目标物体刚出现,而以85为阈值得到的图1(c),再增加灰度值目标会逐渐被背景所淹没。
以二值的算术平均值80为阈值得到图1 (d),可以看到其二值化效果很好,不像图1(b)有很多毛刺,也不像图1(c)有膨胀感。
作为对比我们用大津方法得到阈值84,其二值化效果为图1(e)。
通过对阈值选取思想的分析可知,本文方法具有较强的抗噪声干扰特点。
噪声的一个重要特点就是随机性,它在图像上的分布是不连续的,在统计网格个数时,噪声点只会影响其1×1的网格个数,对于增大尺度后的网格个数影响非常小,这样在计算分维数时,就减弱了噪声点的干扰。
我们以加入椒盐噪声的图1(f)做试验,得到分维变化率如表2。