基于迭代阈值的女书分割算法研究
摘要:女书文字图像分割是女书信息化处理中一个重要的环节,是进一步进行女书识别的基础。
介绍了迭代阈值分割方法的基本原理,程序流程,并将其运用到女书文字分割当中。
实验表明,该算法在女书文字分割中运行时间短,阈值选择准确,取得了较好的分割效果。
关键词:迭代阈值;女书;图像分割
0 引言
随着光学字符识别(OCR)技术的发展,越来越多的文字采用OCR 技术进行信息化处理。
女书作为一种濒临灭绝的文字,采用OCR技术对复杂背景下女书文字的识别,对保护女书具有非常重要的理论意义和实用价值。
女书文字图像分割是女书文字特征提取和女书文字识别的基础,其质量的好坏将直接影响到后续女书特征提取及识别的效果,因此,作为文字识别基础的文字分割是至关重要的。
本文将迭代阈值图像分割算法应用到女书文字分割中,该算法具有较快的运行速度,取得了较好的分割效果。
1 阈值处理
阈值处理又叫门限处理,是区域分割技术的一种,利用图像中目标和背景在灰度上的差异,选择一个或多个合适的阈值,通过判断图像中每个像素点的特征属性是否满足阈值的要求来确定图像中该像素点属于目标区域还是背景区域,从而产生二值图像,对于目标与背景有较强对比度的图像具有良好的效果。
阈值处理分为局部阈值处理和全局阈值处理。
常用的局部阈值处理有Niblack法,Bernsen法等,局部阈值处理对文字图像进行分割时,由于需要分析局部领域的灰度分布情况,处理速度较慢,同时还会出现伪影等问题。
典型的全局阈值处理有迭代阈值法、大津法和最大熵方法等,全局阈值算法简单,对于目标和背景明显分离,直方图分布呈双峰的图像效果良好,对于噪声干扰较大的非双峰直方图分布的图像,分割效果较差。
实验采用的女书文字图像目标和背景明显分离,易采用全局阈值处理。
在全局阈值处理中,大津法虽效果较好,但运行速度较慢,而迭代阈值法运行速度较快,分割效果也较好。
2 迭代阈值
2.1 迭代阈值原理
迭代阈值选择方法的基本思想是:选择一个阈值作为初始值,然后按照某种策略不断地改进这一估计值,每个新阈值应优于上次阈值,直到满足给定的准则为止。
在迭代中,每次选择最“显著”的峰值,这种算法利用不断更新的子图像直方图,越来越细地考虑了图像的局部特性,迭代阈值法进行图像分割的具体步骤如下:
(1)求出图像中最小灰度值和最大灰度值,分别记为Z min 和Z max,则初始阈值T0=(Z min+Z max )/2。
(2)根据阈值T k将图像分割成目标区域和背景区域两部分,计算两部分的平均灰度值Z O和Z B:
Z O=∑T ki=0h i•i/∑T ki=0h i(1)
Z B=∑255i=T k+1h i•i/∑255i=T k+1h i(2)
其中,h i为灰度值为i值所出现的次数。
(3)计算出Z O和Z B后,用式子T k+1=(Z O+Z
B)/2来计算出新阈值T k+1。
(4)如果T k+1=T k,T k 即为所求的阈值,则算法结束,否则转步骤(2)。
(5)根据以上步骤所得的阈值T k,将灰度图像中的每一个像素点与之比较,小于T k的像素点划分为目标区域中的点,大于等于T k的像素点划分为背景区域中的点。
即
g(i,j)=1,f(i,j)≥T k0,f(i,j)<T k(3)
2.2 迭代阈值流程图
根据上一节所介绍的迭代阈值法进行图像分割的原理和步骤,设计的迭代阈值法的程序流程图如图1所示。
图1 迭代阈值程序流程图
2.3 迭代阈值图像分割的C++Builder实现
对于以上算法使用C++Builder6.0实现,主要模块有Histogram()、GetFirstThreshold()、Iterative(),其中Histogram()对灰度图像进行灰度级统计,GetFirstThreshold()返回图像中灰度值最大与最小值和的一半,Iterative()进行迭代法求阈值。
具体代码如下:
从表中可知迭代阈值法和大津法的阈值选取接近,但是大津法运行速度较慢,这主要是由于大津法对图像进行多次遍历,取使目标与背景类间方差最大的值作为最终阈值,而迭代阈值的运行时间主要取决于迭代次数,本文迭代阈值法对选取的女书文字图像的迭代5次就获得了全局最佳阈值。
对原始图像的分割效果如图3所示。
4 结束语
图像阈值分割是图像处理中非常重要的技术之一,其
算法有很多,经实验比较,迭代阈值分割方法可以较快地获得比较令人满意的结果,其迭代次数少,运行时间快,达到了快速自动对女书文字图像进行分割的目的。
参考文献:
[1]冈萨雷斯.数字图像处理(第二版)[M].北京:电子工业出版社,2007.
[2]杨淑莹.VC++图像处理程序设计(第2版)[M].北京:清华大学出版社&北京交通大学出版社,2005.
[3]李幼仪.C++Builder高级应用开发指南[M].北京:清华大学出版社,2002.
[4]邓林华,许骏,程向明.基于迭代阈值的太阳像分割算法的应用研究[J].计算机与现代化,2010(10).
[5]周敬.图像分割中阈值法的研究[J].机电技术,2010(1).[6]刘赛,李益东.彝文文字识别中的文字切分算法设计与实现[J].中南民族大学学报(自然科学版),2007(3).。