当前位置:文档之家› 基于熵的图像二值化算法设计二维最大熵分割

基于熵的图像二值化算法设计二维最大熵分割

基于熵的图像二值化算法设计二维最大熵分割公司内部档案编码:[OPPTR-OPPT28-OPPTL98-OPPNN08]1设计目的与要求设计目的(1)熟悉和掌握MATLAB程序设计方法。

(2)学习和掌握MATLAB图像处理工具箱。

(2)了解图像分割和图像二值化的原理。

(3)掌握图像二值化技术阈值的选取。

(4)将原彩色图像变为二值化后的图像,通过二维最大熵图像分割法对图像进行分割达到预期目的。

设计要求(1)了解图像变换的意义和手段。

(2)熟悉最大熵和二值化的基本性质。

(3)通过本实验掌握利用MATLAB编程实现数字图像处理。

(4)理解图像分割的原理,了解其应用,掌握最大熵和二值化分割的方法。

2 设计方案图像二值化图像二值化是数字图像处理技术中的一项基本技术,二值化图像的显示与打印十分方便,存储与传输也非常容易,在目标识别、图像分析、文本增强、字符识别等领域得到广泛应用。

图像二值化是将灰度图像转化为只有黑白两类像素的图像,大多采用阈值化算法处理。

在不同的应用中,阈值的选取决定着图像特。

征信息的保留。

因此,图像二值化技术的关键在于如何选取阈值。

最大熵原理最大熵原理:最大熵原理是在1957 年由 提出的,其主要思想是,在只掌握关于未知分布的部分知识时,应该选取符合这些知识但熵值最大的概率分布。

因为在这种情况下,符合已知知识的概率分布可能不止一个。

我们知道,熵定义的实际上是一个随机变量的不确定性,熵最大的时候,说明随机变量最不确定,换句话说,也就是随机变量最随机,对其行为做准确预测最困难。

图像分割中最大熵的引入:在图像分割中若假定以灰度级T 分割图像,则图像中低于灰度级T 的像素点构成目标物体,高于灰度级T 的像素点构成背景那么各个灰度级在图像分割后的两区域中的概率如下:O :ti N N ???(0<=i<=t) () B :t iN N N - (t+1<=i<=255) ()? 其中Ni 为图像中灰度级为i 的像素点个数,Nt 为灰度级从0~t 的像素点总和,N 为图像总像素点,t 为假定灰度阈值T 。

)l og()(0ti t i N N N N H ∑-= ??? ? (0<=i<=t) ? ? ())log()(t i t i B N N N N N N H ---=∑ ? (t+1<=i<=255) ()?令 H=HB+Ho .则根据最大信息熵理论在已知条件下要对图像做出分割的最佳决策即为最接近实际图像分割的理想决策。

图像分割的研究背景在一幅目标图像下,人们往往只是关注其中的一个或者几个目标,而这些目标必然会占据一定的区域,并且与周围其他目标或背景在一些特征上会有相应的差别。

但是,很多时候这些差别会非常的细微,以至于人眼很难发觉,这就需要用一定的技术对图片做一些处理。

而计算机图像处理技术的发展,很好地解决了这一难题,使得人们可以利用计算机技术来协助理这些信息,例如指纹识别、车牌识别以及医学影像的鉴别操作等方向。

图像分割是图像识别的基础,其通过一些必要的算法把图像中有意义的部分或特征提取出来,将图像分为若干有意义的区域,并形成数字特征,这些区域对应图像中的不同目标。

这些具有某种特征的单元成为图像的基元,这种经过处理的基元更容易被快速处理。

目前,数以千计的研究文献和文章提出了许许多多的图像分割算法,不同种类的图像、不同的应用要求和应用领域所需要提取出的图像特征是不相同的,所以并不存在普遍适用的最优方法,只能根据图像特征选择与值相适应的方法。

图像分割的基本原理图像分割是根据图像的直方图和结构特性或者一些具体的应用需求将图像划分成两个或多个互不相交的子区域的过程,这些子区域是在特定意义下的具有相同属性的像素的连通集合。

例如,一幅图像中不同目标物体所占的图像区域、背景所占的背景区域等都属于这样的连通集合概念。

对图像分割的定义有多种不同的解释,人们普遍接受的是通过集合定义的图像分割。

用集合R 表示整个图像区域,那么对整个图像的分割可以等价于将集合R 分成n 个满足以下准则的区域:;R R R R R n = (321)是相连的;R 时,n ,,3,2,1i 当i ⋯=∀i,;,有,对Φ=≠∀j i R R j i j i=≠∀)(,有,对j i R R P j i j i false ;=⋯=)R (P ,,,3,2,1i 对i n true 。

目前提出的图像分割方法很多,在此分为三种不同的途径对其进行分类:(1)以物体的的边界为对象进行分割;(2)先检测边缘像素,再将边缘像素连接起来形成分割;(3)以区域为对象进行分割,根据图像的灰度、色彩、变换关系或组织结构等方面的特征相似性来划分图像的子区域并将各像素划分到特定区域。

上述这些方法是互补的,不同的场合使用不同的方法,或者综合各个方法已达到最佳的分割效果。

3 设计内容先将彩色图像转换为灰度图像灰度图(Grayscale)是指只含亮度信息,不含色彩信息的图像,就像我们平时看到亮度由暗到明的黑白照片。

因此,要表示灰度图,就需要把亮度值进行量化。

通常划分成0到255共256个级别,0最暗(全黑),255最亮(全白)。

BMP 格式的文件中并没有灰度图这个概念,但是我们可以很容易地用BMP 文件来表示灰度图。

方法是用256色的调色板,只不过这个调色板有点特殊,每一项的RGB 值都是相同的,也就是说RGB 值从(0,0,0),(l ,l ,1)一直到(255,255,255)。

(0,0,0)是全黑色,(255,255,255)是全白色,中间的是灰色。

这样,灰度图就可用256色图来表示。

灰度图使用比较方便。

首先RGB 的值都一样;其次,图像数据即调色板索引值,也就是实际的RGB 的亮度值;另外因为是256色的调色板,所以图像数据中的一个字节代表一个像素。

如果是彩色的256色图,图像处理后有可能会产生不属于这256种颜色的新颜色,所以,图像处理一般采用灰度图[3]。

在本中会介绍将彩色图像转化为灰度图像的方法(图像灰度化处理)。

另外,本文所做的程序,如不做特殊说明,都是针对256级灰度图的。

图像灰度化由于实验使用的是彩色数码相机,所以最初输入计算机的是24位真彩色图像,而在本课题的后续研究中,如前面所述,主要是对灰度图像进行处理。

因此有必要将24位彩色图像转化为灰度图。

为了用计算机来表示和处理颜色,必须用定量的方法来描述颜色,即建立颜色模型,而颜色模型的基础是建立在色度学理论上的。

色度学理论是在1802年提出的,其基本内容是:任何色彩均可以由三种不同的基本颜色按不同的比例混合而成,即:321cC bC aC C ++=其中321,,C C C 为三原色(又称三基色),a ,b ,c 为三种原色的权值(三原色的比例或浓度),C 为所合成的颜色,可为任意颜色。

色彩与亮度均是一种视觉感受,这种感受分别产生红、绿、蓝的视觉感受。

实验已经证明,由对应三种视敏细胞而产生红、绿、蓝三种颜色作为任何颜色的基本色的理论称为三基色原理。

原理指出:(l) 自然界的可见颜色都可以用三种基色按一定比例混合得到;反之,任意一种颜色都可以分解为三种颜色。

(2) 作为原色的三种颜色应该相互独立,即其中任何一种都不能用其它两种混合得到。

(3) 三原色之间的比例直接决定混合色调的饱和度。

(4) 混合色的亮度等于各原色的亮度之积。

在目前提出的多种颜色模型中,RGB 颜色模型是实际应用中最多的一种。

我们在前面己经做了一些简单而具有代表性的介绍,我们在此的主要任务是如何将彩色图像转化为灰度图像,即图像灰度化处理。

灰度化就是替彩色位图的R ,G ,B 三个分量找一个合适的、相等的值,以便将其转换为灰度图的过程。

由于R ,G ,B 的取值范围是0~255,所以灰度的级别只有256级,即灰度图像仅能表现256种颜色(灰度)。

常用的灰度化处理方法有最大值法、平均值法和加权平均值法。

(l)最大值法:灰度值等于R ,G ,B 分量的最大值,即R=G=B=MAX(R ,G ,B)。

最大值法会形成亮度很高的图像。

(2)平均值法:灰度值等于R ,G ,B 分量的平均值,即R=G=B=(R+G+B)/3。

平均值法会形成比较柔和的图像。

(3)加权平均值法:根据重要性或其他指标给R ,G ,B 赋予不同的权值,并使,R ,G ,B 的值平均加权,即3)(B w G w R w B G R b g r ⨯+⨯+⨯===,式中b g r w w w ,,。

分别为R ,G ,B 的加权系数,且1=++r g r w w w 。

bg r w w w ,,取不同的值使用该方法将形成不同的灰度图像。

由于人眼对绿色敏感度最高,对红色的敏感度次之,对蓝色敏感度最低,因此使b r g w w w >>将得到合理的灰度图像,实验和理论证明,当11.0,59.0,03.0===r g r w w w 时能得到最适合人眼观察的图像。

本文采用加权平均值灰度化法处理图像,所采用的加权系数为:11.0,59.0,03.0===r g r w w w ,由于灰度图像仅能显示256色灰度级,因此对真彩色图像(24位)进行灰度化处理时,首先要将其转化为8位位图,然后按加权平均值法进行灰度化处理。

灰度化处理后的效果如图2-1所示,原始图像采于室内自然光下,且为阴天。

图原始图像图灰度化后图像先将原彩色图变为灰度图。

灰度图像是指只含亮度信息,不含色彩信息的图像, 将彩色图像转化成为灰度图像的过程称为图像的灰度化处理。

再将灰度图二值化,图像的二值化处理就是将图像上的点的灰度置为0或255,也就是使整个图像呈现出明显的黑白效果。

即将256个亮度等级的灰度图像通过适当的阀值选取而获得仍然可以反映图像整体和局部特征的二值化图像。

求出最大熵导出最佳阈值全局阈值法是指在二值化过程中只使用一个全局阈值T的方法。

它将图像的每个像素的灰度值与T进行比较,若大于T,则取为前景色(白色);否则取为背景色。

典型的全局阈值方法包括Otsu方法、最大熵方法等。

为了满足图像处理应用系统自动化及实时性要求,图像二值化的阈值的选择最好由计算机自动来完成(平均灰度值法,大津法,边缘算子法)将灰度图像转换成二值化图像图灰度图图二值化后图像4源代码及分析clear alla=imread('D:\');%读取图片Figure;imshow(a);%显示图片xlabel('ww');a=rgb2gray(a);%将彩色图变为灰度图Figure;imshow(a);%显示变换后图片xlabel('zz');count=imhist(a);[m,n]=size(a);N=m*n;L=256;count=count/N;%%%每一个像素的分布概率for i=1:Lif count(i)~=0st=i-1;break;endendfor i=L:-1:1if count(i)~=0nd=i-1;break;endendf=count(st+1:nd+1);%f是每个灰度出现的概率size(f)E=[];for Th=st:nd-1%设定初始分割阈值为Thav1=0;av2=0;Pth= %%第一类的平均相对熵为for i=0:Thav1=av1-count(i+1)/Pth*log(count(i+1)/Pth+;end%%第二类的平均相对熵为for i=Th+1:L-1av2=av2-count(i+1)/(1-Pth)*log(count(i+1)/(1-Pth)+; endE(Th-st+1)=av1+av2;endposition=find(E==(max(E))); %选取最大的熵th = st+position-1;for i=1:mfor j=1:nif a(i,j)>tha(i,j)=255;Elsea(i,j)=0;endendendfigure;imshow(a);%显示最终二值化图像xlabel('HH');5 功能仿真图及分析图原彩色图像图变换后的灰度图像图二值化后图像用上述的算法进行了实验,得到,各灰度级变化不明显,图三用最大熵的方法二值化后的人物比较清晰,背景和前景分的图像的二值化结果如图,从仿真的结果来看,图二是将彩色图像变换成灰度图像割比较明显,分割效果比较理想,方法也非常简单。

相关主题