当前位置：文档之家› 印刷体数字识别的应用

印刷体数字识别的应用

传统的模板匹配过程，是取模板的逐行逐列数据，即整个模板的数据，在被搜索图上进行逐行逐列扫描匹配，由于参与比较的数据量大，所以匹配速度很难提高。如果只取模板的隔行隔列数据，在被搜索图上进行隔行隔列扫描匹配，匹配速度明显提高，不过匹配精度会有少许下降。
同一数字在不同的位置或多或少存在一些差别，改进的模板匹配算法编程时，必须取一个误差阈值E0。匹配过程中，若模板中的某一点的灰度与子图Sij中的某一点灰度不同，就把E (i, j)的值增加1，每匹配完一列（或者一行）时，就把E (i, j) 与E0进行比较，当E (i, j )≥ E0时就停止该点的计算，继续下一点计算，这样可以提高算法的效率; 当E (i, j )< E0时，就记录下该点的位置，并把匹配数目增加1。当整个匹配过程结束时，根据记录的匹配位置和匹配数目，便能将匹配数字标示出来
印刷体数字识别的应用
印刷体数字识别是字符识别的一个分支，有多种方法，如模板匹配法、特征值提取法等。模板匹配法简单，但计算量很大，且费时；特征值提取法是基于特征的识别，关键是选取稳定且有效的特征，其计算量相对较小，识别速度快。
数字的类别只有十种，笔划又简单，其识别问题似乎不是很困难。但事实上，一些测试结果表明，数字的正确识别率并不如印刷体汉字识别正确率高，甚至也不如联机手写体汉字识别率高，而只仅仅优于脱机手写体汉字识别。这其中主要原因是：某些数字字形相差不大（譬如：手写体5 和3），使得准确区分某些数字相当困难
具体步骤是： (1)将模板在图像中漫游，并将模板中心与图像中某个像素的位置重合。 (2)读取模板下各对应像素的灰度值。 (3)将这些灰度值从小到大排成一列。 (4)找出这些值里排在中间的一个。 (5)将这个中间值赋给对应模板中心位置的像素。
中值滤波器的主要功能就是让与周围像素灰度值的差比较大的像素改取与周围的像素值接近的值，从而可以消除孤立的噪声点。它在衰减噪声的同时不会使图像的边界模糊。中值滤波器去噪声的效果依赖于两个要素：邻域的空间范围，中值计算中所涉及的像素数。一般来说，小于中值滤波器面积一半的亮或暗的物体基本上会被滤掉，而较大的物体则几乎会原样地保存下来，因此中值滤波器的空间尺寸必须根据具体的问题来进行调整。N*N模板n一般是奇数。
这时可返回一个与输入图像相同大小的数据矩阵 L，L是double型的，而num中存储着对象个数的数据。有了这个输出数据矩阵，可以利用它包含的不同整数值来区分输入图像中的不同对象，每个分离的对象对应一个整数值，而经过了模板识别的数字图片中，数字必然是主体，干扰项只有少许，由于可以统计出各个整数值的数量，数量最多的整数值对应的对象必定是数字本身，将为此整数值的位置全改为0，然后把其它整数值都改为1，把这样得到的二值图像存下来，便是消除了干扰项的数字图片。
Hale Waihona Puke 一般来说，用于数字识别的分类特征应满足以下要求： (1)具有较强的分类能力，即该特征对不同的数字应表现出较大的差异，而对相同的数字则应表现出尽可能小的差异。 (2)具有较高的稳定性和抗干扰性，对数字的平移、旋转和尺度变换不敏感，受数字笔划断裂或粘连的影响尽可能小。 (3)特征向量应便于提取，算法要尽量简便，在保证识别系统的性能的条件下，特征向量的维数不能过高，以减少机器开销，提高运算速度。
特征提取法的关键是选取稳定且有效的结构特征，其计算量相对较小，识别速度快。提取不同的特征，识别率也不同。
提取数字的两种特征：水平方向过线数和垂直方向过线数。把数字从上到下平均分成8部分，在每个部分中分别以水平方向的扫描线从左到右穿过数字，计算每条扫描线穿越黑像素区域互不相邻的交点数，在每个部分都可得到一个最多交点数，在上i/8(i=1,2,3,4)部分的最多交点数定义为该数字的上i/8高度处的过线数，在下 i/8(i=1,2,3,4)部分的最多交点数定义为该数字的下i/8高度处的过线数；同理可得到该数字的左 i/8(i=1,2,3,4)宽度处的过线数和右i/8(i=1,2,3,4) 宽度处的过线数。
直接提取上述两种特征，对于少量数字图片的识别结果不大理想，因为这些图片中个别位置有“突起”，而“突起”对于这两种特征有较大影响，从而会直接影响到识别结果。
对于突起可以对数字进行最小值滤波，所谓最小值滤波就是用像素领域内的最小值代替该像素。
根据每个数字的特征，构造编码器(数字1 由于高度与宽度的比值较其它数字的比值大，故可以单独识别)
模板匹配中标示出来的数字，经过裁剪，变成一幅幅小数字图片。这些图片中除了有数字以外，还有少量的干扰项（如黑点等），这时需要将这些与待识别数字无关的干扰项去掉，由于大部分干扰项与待识别数字是分离的，因此可以先对二值图像中各个分离的对象进行标识，而特定的边沿约定类型可取的值有4和8，分别对应着 4-连接边沿约定和8-连接边沿约定，这里取默认值8即可。
二值化对景物分析、模式识别等具有重要的意义。基于阈值的二值化算法，通过最大类间方差法即OTSU方法，统计图像的灰度直方图选取全局阈值，然后进行二值化处理。
Otsu算法步骤如下：设图象包含L个灰度级(0,1…,L-1)，灰度值为i的的象素点数为Ni ，图象总的象素点数为N=N0+N1+...+N(L-1)。灰度值为i的点的概率为： P(i) = N(i)/N. 门限t将整幅图象分为暗区c1和亮区c2两类，则类间方差 σ是t的函数： σ=a1*a2(u1-u2)^2 式中，aj 为类cj的面积与图象总面积之比，a1 = sum(P(i)) i->t, a2 = 1-a1; uj为类cj的均值，u1 = sum(i*P(i))/a1 0->t, u2 = sum(i*P(i))/a2, t+1->L-1 该法选择最佳门限t^ 使类间方差最大，即：令Δu=u1-u2，σb = max{a1(t)*a2(t)Δu^2}
模板就是一幅已知的小图像。模板匹配就是在一幅大图像中搜寻目标，已知该图中有要找的目标，且该目标同模板有相同的尺寸、方向和图像，通过一定的算法可以在图中找到目标，确定其坐标位置。
设T为M ×N的模板，将其叠放在被搜索图S(W ×H个像素)上并平移，模板覆盖被搜索图的那块区域叫子图Sij。i、j为子图左上角在被搜索图S上的坐标。搜索范围是：1 ≤i ≤H -N，1 ≤j ≤W -M。通过比较T和Sij的相似性，完成模板匹配过程。
下面简述一下数字识别过程：读取图像文件，得到图像文件的高度x和宽度y，定义并初始化数组num和sum，它们分别用来保存水平扫描线穿越黑像素区域互不相邻的交点数和垂直扫描线穿越黑像素区域互不相邻的交点数，再定义并初始化数组n和m，它们分别用来保存从上到下8个部分中每个部分的最大交点数和从左到右8个部分中每个部分的最大交点数。然后从上到下逐行逐行地扫描，把每一行得到的交点数依次地保存在数组num中，这样便可以得到从上到下8个部分中每个部分的最大交点数；再从左到右逐列逐列地扫描，把每一列得到的交点数依次地保存在数字sum中，这样又可以得到从左到右8个部分中每个部分的最大交点数。把数组n和m中的值与编码器中的对应值逐个进行比较，若与某个数字的特征值完全匹配，则待识别数字就是这个数字。
数字与其它要素的自动分离技术又是实现数字的自动识别的重要前提和基础噪声恶化了图像质量，使图像模糊，甚至淹没特征，给分析带来困难，消除图像噪声的工作称之为图像平滑或滤波。中值滤波器是最常用的非线性平滑滤波器。它是一种邻域运算，类似于卷积，但计算的不是加权求和，而是把邻域中的像素按灰度级进行排序，然后选择该组的中间值作为输出像素值。

e商务文档

印刷体数字识别的应用

相关文档推荐：