当前位置:文档之家› 一种字符识别算法在自动识别系统中的应用_刘春雨

一种字符识别算法在自动识别系统中的应用_刘春雨

25卷 第3期2008年3月微电子学与计算机MICROELECTRONICS &COMPUTERVol.25 No.3March 2008收稿日期:2007-05-08一种字符识别算法在自动识别系统中的应用刘春雨,李 俊(中国科学院计算机网络信息中心,北京100080)摘 要:基于车牌识别系统的开发,提出一种基于二值图像的字符识别算法.在该算法中,提取字符的点阵特征、特征线和网格特征,分类器采用神经网络.为充分利用各组特征向量的互补作用,采取层次结构来获得系统的最佳性能.实验表明此算法非常有效.关键词:字符识别;网格特征;神经网络中图分类号:TP393 文献标识码:A 文章编号:1000-7180(2008)03-0071-03A Character Recognition Algorithm in the Application ofVehicle License Plate Recognition SystemLIU Chun 2yu,LI Jun(Computer Network Information Center,Chinese Academy of Sciences,Beijing 100080,China)Abstr act:We extract the features including the Lattice Structure,Key Line and Gr id F eatures.T he network is used as t he classificat ion.To make full of use of all kinds of featur e vectors,the hierarchical algorithm is adapted for optimal per 2formance.We test our algorithms in car number plate database.As the experimental results show,our algor ithm is very efficient.Key words:OCR;grid featur es;nerve network1 引言车牌识别系统就是利用光学字符识别技术解决汽车牌照识别的典型系统,它的开发与应用有利于交通的控制与管理,是智能交通系统(IT S)中一个重要组成部分.车牌识别系统的软件部分主要由四部分组成,包括预处理、车牌定位、字符定位与字符识别.这四部分是顺序执行,而每个处理模块都为下一步处理作铺垫,其中字符识别模块是最后一步,也是衡量系统整体性能的一步.字符识别涉及两个方面,即特征提取和识别方法,二者是继承互补的关系.关于字符的特征提取,目前已有许多经典的算法被提出来.根据字符的图像类型不同,特征提取可以分为彩色特征提取、灰度特征提取和二值特征提取;根据字符特征提取的基础可以分为点阵式统计特征提取,骨架或者细化特征提取;根据字符特征提取的内容可以分为统计特征的提取,逻辑特征或者笔画特征提取等.利用二值图像进行字符识别已提出多种算法[126],但识别效率和计算复杂度尚不能令人满意.为此提出新的字符识别算法.2 算法经过以上的字符预处理,将二值字符图像送入识别模块,完成字符识别任务.对于二值图像作如下几个步骤:归一化、细化和识别.2.1 归一化和细化把分割的二值图像进行线性缩放归一化,这样有利于特征提取和字符识别.归一化就是对实际提取的字符进行缩放操作,最后得到预定大小的字符图像.根据车牌号图片库中提取的4万多个字符样本,统计出样本的平均宽高为:20@16像素,因此利用式(1)将字符都归一化到20@16大小.[x c,y c]=0,if(ori[x,y]==0+[x,y]|Rect)1,else(1)v Ratio=OriHeight/PreHeighth Ratio=OriWidth/PreWidthx c=OriWidth/2+(x-PreWidth/2)*h Ratioy c=y*v Ratio(2)式中,OriH eight表示原始字符高度,PreH eight表示预定义字符高度,OriWidth表示原始字符宽度, Pre H eight表示预定义字符宽度;v Ratio与h Ratio 分别表示竖直和水平放缩比例;x与y表示在原始图像上的坐标,X c与Y c表示归一化图像上的坐标; ori[x,y]表示原始图像在(x,y)处的像素值,[x c, y c]表示归一化图像下(x c,y c)处的像素值;Rect表示原始图像所在的矩形框,[x,y]|Rect表示该像素点不在图像的矩形框内,则归一化后的像素点值为0.通过归一化处理,得到PreHeight*PreWidth 大小的字符图像.根据形态学操作中的/中与丢0(hit and mass)原理,对归一化的二值图像进行细化,得到字符的骨架.2.2识别算法提取字符的笔画特征,利用模板匹配进行分类,这种方法主要应用于混淆字符或者难以辨别的字符的识别.2.2.1特征提取(1)点阵特征:该组特征基于细化的二值图像.二值细化字符图像的点阵结构反映了一个字符的整体结构特征,如果细化效果很好并且待识别的字符字体变换不大,不经过任何处理的点阵特征向量能够作为特征用于识别.通常,分类器采用模板匹配,利用距离函数计算模板与当前字符之间的相似度,其中相似度最小的那个模板所代表的字符即为识别出的字符.这种方法简单易行,并且计算复杂度低,适合印刷体的实时识别.(2)特征线:如图1所示,统计偶数行和列的线段数目,组成(PreWidth+PreHeight)/2维特征向量.该组特征基于原始图像.这种方法的特点是将点阵结构进行重组,更有效地表达字符.但如果细化效果不好,或者字符字体变化很大,这种方法就失效了.图中,1表示前景像素,0表示背景像素;H line1~H line8表示统计的偶数行中所含的线段个图1偶数行特征线段提取示意图(H line i表示第i行的线段个数)数.同样,也统计竖直方向偶数行中线段个数.线段在一定程度上反映了字符在某一方向的笔画密度,而字符笔画是联贯的,所以只需要统计单数行的线段数就能表示一个字符.(3)网格特征:该组特征基于细化的二值特征.对字符进行分块,然后统计每一个块内前景像素的个数作为统计特征,组成PreWidth/BLOCKSIZEH *Pre H eight/BLOCKSIZEV维向量(其中,BLOCK2 SIZEH和BLOCKSIZEV表示水平和竖直方向划分块的尺寸).这种方法是对点阵结构的分区,也在一定程度上缩小了特征向量的维数.网格特征与特征线都反映了字符的局部特征如图2所示.以上特征是有互补关系的:点阵特征反映字符的整体特征;特征线和网格特征反映字符的局部特征.所以,有效地利用上述特征,充分发挥各个特征向量的作用,系统性能就会提高.2.2.2识别算法利用BP神经网络来分类字符.BP神经网络包括3层:输入层、隐藏层和输出层.输入神经元的个数与特征向量的的尺寸有关,即点阵特征有PreWidth@PreHeight个输入神经元,特征线共有12+(PreWidth+PreH eight)/2个输入,网格特征共有PreWidth/BLOCKSIZEH*PreHeight/BLOCK2 SIZEV个输入,而霍夫矩共有7个输入.隐藏层包括16个神经元,而输出层的神经元个数为数字10个,字母26个.使用log sigmode作为学习函数来训练样本,设置最大叠代次数为1200.为了降低算法的计算复杂度,采取层次识别算法,即先用一些特征72微电子学与计算机2008年图2网格特征提取示意图(block i表示第i块中前景点像素个数)进行粗分类,然后再用些特征进行细分类,得出识别结果.实验证明,特征线具有较好的粗分类特点,而网格特征具有很好的细分类特点.在系统中,先用点阵特征进行识别,如果识别概率大于一定的阈值,不进行其他特征的分类;如果识别率低于该阈值,则进行二级分类,包括粗分类的特征线,细分类的网格特征和霍夫矩,最后将各个分类的结果融合,得到最佳匹配字符.分类结果融合方法很多,有投票法,也有加权和最大方法等.采用加权和最大方法,其中各个分类结果的权值根据实验得到.3实验从两个方面来验证算法性能:识别率和平均运行时间.用车牌图片数据库来检验文中的算法.在该数据库中,总共有8902个字符,其中有字母2944个,数字5752个,图像大小为16@16.用8136个字符作为训练集,766个字符用于测试.对于网格特征的提取,采取的分块大小为4@4,这样一个字符图像就可以得到16个块.正如识别算法一节描述的那样,点阵特征经过大量样本的训练具有较强的识别能力,表1是基于点阵特征的整体车牌的识别结果.在表1中,可以看点阵特征比其他特征识别率高,并且多个特征的层次分类及融合能够提高系统性能.从上面的表格可以看出,文中算法在识别率上基本能达到97%以上,并且时间上都不超过50ms,这种系统性能是能够满足车牌识别系统的实时要求.表1各种特征识别结果识别结果特征识别率/%平均时间/ms 点阵特征98.1640特征线95.8235网格特征89.9836融合98.94434结束语针对车牌识别提出了基于二值图像统计特征提取的车牌字符识别算法,提出的层次结构算法,融合各个特征向量分类结果得出最佳匹配字符,识别率很高,计算复杂度低,能够满足车牌识别系统的实时要求.参考文献:[1]Pratt W K.Digital Image P rocessing[M].2th ed.NewYork:John Wiley&Sons,1991.[2]Egmont-Petersen M,Ridder D de,Handels H.Imageprocessing using neural networks-a review[J].Pattern Recognition,2002,35(10):2279-301.[3]Khotanzad A,Hong Y H.Invariant image recognition byzernike moments[J].I EEE T rans,Patter n Analysis and Machine Intelligence,1990,12(5):489-497.[4]高珊,刘万春,朱玉文.基于SVM的车牌字符分隔和识别方法[J].微电子学与计算机,2005,22(6):34-36. [5]张春梅,田玉宝,王尚锦.具有领域独立性的通用模式识别方法的研究[J].微电子学与计算机,2006,23(8):35 -37.[6]Kimura F,Shr idhar M.Handwritten numerical recognitionbased on mult iple algor ithms[J].Pattern Recognition,1991,24(10):969-983.作者简介:刘春雨男,(1979-),硕士研究生.研究方向为网络管理、模式识别.李俊男,研究员,硕士生导师.研究方向为下一代互联网技术、网络安全技术、多媒体通信.73第3期刘春雨,等:一种字符识别算法在自动识别系统中的应用。

相关主题