当前位置:
文档之家› 基于图像处理和模式识别的身份证识别
基于图像处理和模式识别的身份证识别
Abstract
ABSTRACT
Optical camera image processing and pattern recognition theory based on optical character recognition (OCR) has been widely used in various sectors of social life. Optical character recognition has the advantages of fast speed, high efficiency, low cost, less errors in the text input. Certificate recognition developed based on optical character recognition as an emerging technology in every aspect of social life has been applied. The main research contents involved in identity information recognition software based on optical image was carefully analyzed based on the research in the domestic and foreign research present situation; the identity information recognition has been designed software based on MATLAB platform. Image preprocessing is the first step of ID identification software based on optical image. For the optical image of the ID, the average color offset was used to correct the high light areas of an image. On the basis of T.Youg theory, the ID card image was graying by using the weighted average. Binaryzation image was gotten by Ostu-Berensen method combined by the global binaryzation and local binaryzation. Finally, layout analysis of the binaryzation ID card image was done by using the method of projection and column method, character block images were gotten to be used for character recognition. For the problem of different image size and location after pretreatment, the center normalization methods of gravity position normalization, frame normalization and the size normalization method using normalized variance of distribution were analyzed. The 7 x 7 x 4 Chinese characters were formed by fuzzy stroke feature within global elastic mesh using a combination of statistical information and structural information for character recognition.After extraction of single character image through character feature vector normalization processing, character feature extraction of image preprocessing, the feature vectors needed to get into Chinese characters classifier to complete identity information. Image classifier includes the Euclidean distance classifier, the neural network classifier, support vector machine classifier and genetic algorithm classifier. With the detailed analysis of the image preprocessing, feature extraction method and the method of character classifier design, the identification software based on
万方数据
DESIGN AND IMPLEMENTATION OF ID CARD RECOGNITION SYSTEM BASED ON IMAGE PROCESSING AND PATTERN RECOGNITION
A Master Thesis Submitted to University of Electronic Science and Technology of China
万方数据
摘要
摘要
基于光学摄像头图像处理处理以及模式识别理论的光学字符识别( OCR)在 社会生活的各个行业得到了广泛的应用。光学字符识别在文字的录入方面具有速 度快、效率高、错误少、成本低等优势。在光学字符识别的基础上发展起来的证 件识别作为一种新兴的技术也在社会生活的各个方面得到了应用。课题在仔细调 研国内外研究现状的基础上分析了基于光学图像的身份证信息识别软件所涉及的 主要研究内容;基于 MATLAB 平台设计了身份证信息识别软件。 图像预处理是基于光学图像的身份证识别软件图像处理的第一步。针对身份 证的光学图像,课题采用了平均颜色偏移率校正了图像的高光区域。依据 T.Youg 提出的理论,利用加权平均值法对身份证图像灰度化。将全局二值与局部二值化 方法结合的 Ostu-Berensen 方法对灰度化后的身份证图像二值化。最后利用图像的 行方向投影和列方法投影的方法对二值化后的身份证图像进行版面分析,得到用 于字符识别的单个字符块的图像。 针对经过图像预处理后的图像大小存在位置、大小差别的问题,分析了重心 归一化和边框归一化的位置归一化方法以及利用字符图像的分布方差归一化方 法。利用统计信息和结构信息相结合的全局弹性网格内的模糊笔画特征构成了用 于汉字字符识别的 7╳7╳4 的特征向量。经过图像预处理得到的单个字符图像经 过归一化处理、字符特征提取后的字符特征向量需要送入到汉字分类器中才能完 成身份证信息的提取工作。图像分类器主要包括欧氏距离分类器、神经网络分类 器、支持向量机分类器以及遗传算法分类器几类。 详细分析了图像预处理、字符特征提取方法以及字符分类器设计的方法后, 在 MATLAB 平台上设计了基于光学图像的身份识别软件。详细论述了身份证识别 系统的关键函数原型以及函数的简单流程。函数包括图像预处理、图像二值化、 图像字符块划分、字符特征提取以及字符识别的详细分析设计。最后展示了本课 题设计的识别软件对身份证图像的识别结果,表明了该系统在身份证信息中的性 别、民族、生日、身份证号码具有较高的识别概率,而在姓名和住址两个方面的 识别能力还有待提高。 通过本课题对基于光学图像的身份证信息识别软件关键技术研究,设计出了 基于 MATLAB 平台的身份证信息识别系统软件。该软件实现了对身份证的性别、 民族、生日、身份证号码的较高识别概率,而对姓名和住址的识别概率尚且比较 低。基于光学图像的身份证信息识别软件要得到广泛的推广应用还有一个成本控
I
万方数据
摘要
制的要求和软件运行时间的要求。关于低分辨率下的身份证信息识别方法还需要 进一步展开研究。身份证信息识别软件的算法还需要进一步优化,达到快速有效 提取身份证信息的目的。
关键词:身份证、光学图像、平均颜色偏移率、Ostu-Berensen、弹性网格划分、 模糊笔划提取、字符分类器
II
万方数据
Major: Author: Advisor: School :
Master of Engineering
Song Ren Wang Binfeng
School of Automation Engineering
万方数据
独创性声明
本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及 取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得 电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一 同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明 并表示谢意。
论文题目
基于图像处理和模式识别的身份证识别系统 设计与实现
专业学位类别 学 号 作 者 姓 名 指 导 教 师
工
程 宋
硕 韧
士
201192070423 王冰峰 副教授
万方数据
分类号 UDC
注1
密级
学
位
论
文
基于图像处理和模式识别的身份证识别系统设计与实现
(题名和副题名)
宋
韧
(作者姓名)
指导教师