当前位置:文档之家› 灰度图像二值化方法研究

灰度图像二值化方法研究

灰度图像二值化方法研究摘要:在人类获取的信息中,视觉信息约占60%,听觉约占20%,其它约占20%。

由此可见,视觉信息对人类非常重要。

同时,图像是人类获取视觉信息的主要途径。

图像二值化是图像预处理中的一项重要技术,在模式识别、光学字符识别、医学成像等方面都有重要应用。

论文介绍了图像及数字图像处理技术的一些概念和相关知识;对Matlab7.0 软件的发展和软件在图像处理中的应用做了简要介绍;还介绍了灰度图像二值化方法以及利用Matlab7.0软件工具进行算法的实现。

课题重点实现了图像分割技术和边缘检测中灰度图像二值化方法,如Otsu算法、Bernsen算法,并对这些算法运行的实验结果进行分析与比较。

关键词:图像处理;边缘检测;二值化;Matlab;Otsu算法;Bernsen算法Gray image binarization methodAbstract:Human beings obtain a lot of information, among which the visual information is about 60%, the sense of hearing about 20%, and others about 20%. Therefore, the visual information is very important for human beings. Moreover, the images are the primary way, by which a lot of information is obtained. Image binarization, as an important technology in image pre-processing, is widely-employed in pattern recognition, optical character recognition, medical imaging and so forth. In this paper, some notions and relative knowledge in digital image processing technology are introduced; then, the development of Matlab7.0 and its application in image processing briefly introduced; in addition, the method of grayscale image binarization and how to implement these algorithms based on Matlab7.0 are presented. This paper mainly implements the grayscale image binarization method in image segmentation technology and Marginal Detection , such as Otsu algorithm and Bernsen algorithm, and analyzes and compares the experimental results of the above algorithms.Keywords:Image processing;Marginal Detection;Binarization, Matlab;Otsu algorithm;Bernsen algorithm目录1引言 (1)1.1 图像与数字图像 (1)1.2 灰度图像二值化原理及意义 (1)2 灰度图像二值化方法 (2)2.1 课题研究对象 (2)2.2 二值化方法研究动态 (3)3 软件工具——MATLAB进行算法的实现 (5)3.1 Matlab工具箱实现的常用功能 (5)3.2 Otsu算法(最大类问方差法) (7)3.3 Bernsen算法 (7)4 Otsu方法和Bernsen方法实验比较 (8)4.1 Otsu方法实验结果分析 (8)4.2 Bernsen方法结果分析 (10)4.3 0tsu方法和Bernsen方法实验结果比较 (11)4.4 结论 (12)5 结束语 (13)参考文献 (14)致谢.............................................. 错误!未定义书签。

附录:源代码. (16)1 引言1.1 图像与数字图像图像就是用各种观测系统观测客观世界获得的且可以直接或间接作用与人眼而产生视觉的实体。

视觉是人类从大自然中获取信息的最主要的手段。

拒统计,在人类获取的信息中,视觉信息约占60%,听觉信息约占20%,其他方式加起来才约占20%。

由此可见,视觉信息对人类非常重要。

同时,图像又是人类获取视觉信息的主要途径,是人类能体验的最重要、最丰富、信息量最大的信息源。

通常,客观事物在空间上都是三维的(3D)的,但是从客观景物获得的图像却是属于二维(2D)平面的。

图像存在方式多种多样,可以是可视的或者非可视的,抽象的或者实际的,适于计算机处理的和不适于计算机处理的。

但就其本质来说,可以将图像分为以下两大类。

模拟图像。

包括光学图像、照相图像、电视图像等。

比如人在显微镜下看到的图像就是一幅光学模拟图像。

对模拟图像的处理速度快,但精度和灵活性差,不易查找和判断。

数字图像。

数字图像是将连续的模拟图像经过离散化处理后得到的计算机能够辨识的点阵图像。

在严格意义上讲,数字图像是经过等距离矩形网格采样,对幅度进行等间隔量化的二维函数。

因此,数字图像实际上就是被量化的二维采样数组[4]。

1.2 灰度图像二值化原理及意义灰度图像是指只含亮度信息,不含色彩信息的图像。

将彩色图像转化成为灰度图像的过程称为图像的灰度化处理。

彩色图像中的每个像素的颜色有R、G、B 三个分量决定,而每个分量有255种值可取,这样一个像素点可以有1600多万的颜色的变化范围。

而灰度图像是R、G、B三个分量相同的一种特殊的彩色图像,一个像素点的变化范围为255种,所以在数字图像处理中一般先将各种格式的图像转变成灰度图像以使后续的图像的计算量变得少一些。

灰度图像的描述与彩色图像一样仍然反映了整幅图像的整体和局部的色度和亮度等级的分布和特征。

图像的灰度化处理可先求出每个像素点的R、G、B三个分量的平均值,然后将这个平均值赋予给这个像素的三个分量。

图像的二值化处理就是将图像上的点的灰度置为0或255,也就是使整个图像呈现出明显的黑白效果。

即将256个亮度等级的灰度图像通过适当的阀值选取而获得仍然可以反映图像整体和局部特征的二值化图像[6]。

在数字图像处理中,二值图像占有非常重要的地位,特别是在实用的图像处理中,以二值图像处理实现而构成的系统是很多的,要进行二值图像的处理与分析,首先要把灰度图像二值化,得到二值化图像,这样子有利于再对图像做进一步处理时,图像的集合性质只与像素的值为0或255的点的位置有关,不再涉及像素的多级值,使处理变得简单,而且数据的处理和压缩量小。

二值图像在图像分析中应用非常广泛,二值图像就是指只有两个灰度级的图像,二值图像具有存储空间小,处理速度快,可以方便地对图像进行布尔逻辑运算等特点。

更重要的是,在二值图像的基础上,还可以进一步对图像处理,获得该图像的一些几何特征或者其他更多特征[7]。

2 灰度图像二值化方法2.1 课题研究对象论文主要研究边缘检测物体的边缘是以图像局部特性的不连续性的形式出现的,如灰度值的突变,颜色的变化纹理结构的突变等。

图像的边缘信息在图像分析和人的视觉中都是十分重要的,是图像识别中提取图像特征的一个重要属性。

图像的边缘有方向和幅度两个特性。

通常,沿边缘走向的象素变化平缓,而垂直于边缘走向的象素变化剧烈。

这种变化可能呈现阶跃型、房顶型和凸缘型。

在边缘上灰度的一阶导数幅值较大,而二阶导数在边缘上的值为0 ,其左右分别为一正一负两个峰,也就是说,边缘点对应于一阶微分幅度大的点,也对应于二阶微分幅度的零交叉点。

因此,利用梯度最大值或二阶导数的过零点提取边缘就成为一种有力的手段。

常见的边缘检测算子有:1.中心差分算子2(,)(1,)(1,)x f i j f i j f i j =+--∆ (2.1-1)2(,)(,1)(,1)y f i j f i j f i j ∆=+-- (2.1-2)2.Robert s 算子(,)(1,1)(,)f i j f i j f i j +=++-∆ (2.1-3)(,)(,1)(1,)f i j f i j f i j -=+-+∆ (2.1-4)3.Prewitt 算子101101101x ⎛⎫ ⎪ ⎪ ⎪⎝⎭-∆-- 111000111y ⎛⎫ ⎪ ⎪ ⎪⎝⎭∆--- (2.1-5)4.Sobel 算子101202101x -⎛⎫ ⎪∆- ⎪ ⎪-⎝⎭ 121000121y ⎛⎫ ⎪∆ ⎪ ⎪---⎝⎭(2.1-6)还有一些其它算子,如Kirsh 算子、Robinson 算子、Laplacian 算子等。

图像阀值分割是一种广泛使用的图像分割技术,它利用图像中提取的目标物与背景在灰度特性上的差异,把图像视为具有不同灰度级的两类区域(目标和背景) 的组合,以确定图像中每一个象素点应该属于目标区域还是背景区域,从而产生相应的二值图像[2]。

2.2 二值化方法研究动态作为一种高效智能的人机交互手段,身份证的快速识别技术可以广泛的应用于公民身份核查、暂住人口调查、旅店业登记核查、罪犯追逃等公安业务当中,大大提高了工作人员的录入速度,减少了用户的等待时间,提高了工作效率。

由于身份证图像背景复杂,由激光防伪阴影网格线及各种版面噪声构成;且因激光防伪标志和打印条件的千差万别,再加上身份证图像质量偏差,给身份证的字符识别带来了很大的困难。

必须经过预处理,除去大量的噪声信号,才能更好的进行字符的定位、分割,以及识别。

而二值化是预处理中非常重要的一步,也是最为关键的一步,它直接影响到OCR 系统的性能。

研究者在分析和讨论了多种图像二值化的优缺点后,在吸取各种方法优点的基础上,提出了一种新的身份证扫描图像的二值化方法——嵌入式多阈值动态自适应的二值化方法。

图像二值化是图像处理中的一项基本技术,也是很多图像处理技术的预处理过程。

在颗粒分析、模式识别技术、光学字符识别(OCR)、医学数据可视化中的切片配准等应用中,图像二值化是它们进行数据预处理的重要技术。

由于图像二值化过程将会损失原图像的许多有用信息,因此在进行二值化预处理过程中,能否保留原图的主要特征非常关键。

相关主题