合肥学院毕业设计(论文)设计(论文)题目基于模板匹配算法的字符识别系统研究与实现院系名称计算机科学与技术系专业(班级)计算机科学与技术姓名(学号)指导教师系负责人摘要自从计算机问世以来,让机器具有模式识别能力一直是计算机科学家们的努力方向。
研究表明,对视觉和听觉信息的处理过程,不仅仅是一个感知过程,也是一个认知过程。
因此,研究模式识别,是理解人类智能的本质的重要途径。
字符识别是一个传统和典型的模式识别问题,脱机手写数字识别是一个典型的大类别的模式识别问题。
手写体数字具有不同字符字型相差不大、相同字符有多种不同写法、数字没有上下文关系等等特点,使得脱机手写体数字识别成为识别领域最大的难题和最终的目标。
在这种大类别识别的研究中,传统上大多采用模板匹配的方法来解决问题。
而在模板匹配算法中,得计算其特征值。
图像需要经过二值化,细化等预处理。
关键字模板匹配;特征值;细化;二值化ABSTRACTSince computer appeared, it has been an effort direction for scientist to let the computer has the ability of pattern recognition. Researching indicates that the procedure to deal with seeing and hearing not only a procedure of perception but also cognition. Therefore, studying pattern recognition is an important way in understanding the mankind’s intelligence and ability. Character recognition is a traditional and typical pattern recognition problem, and Handwritten Numeral Recognition is a typical large vocabulary pattern recognition problem. Different characters do not vary much, the same character can be written in many ways, there is no context between characters, and so on. Because of so many characteristics, Handwritten Numeral Recognition is a very difficult problem and commonly regarded as one of the ultimate goals of character recognition research. And the template matching algorithm, in its calculation of eigenvalues. Image require two value, thinning and other pretreatment.引言手写数字识别(Handwritten Numeral Recognition)是光学字符识别技术(Optical Character Recognition,简称OCR)的一个分支,它研究的对象是:如何利用电子计算机自动辨认人手写在纸上的阿拉伯数字。
在整个OCR领域中,最为困难的就是脱机手写字符的识别。
到目前为止,尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就,但距实用还有一定距离。
而在手写数字识别这个方向上,经过多年研究,研究工作者已经开始把它向各种实际应用推广,为手写数据的高速自动输入提供了一种解决方案。
手写数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值:(1).阿拉伯数字是唯一的被世界各国通用的符号,对手写数字识别的研究基本上与文化背景无关,这样就为各国,各地区的研究工作者提供了一个施展才智的大舞台。
在这一领域大家可以探讨,比较各种研究方法。
(2).由于数字识别的类别数较小,有助于做深入分析及验证一些新的理论。
这方面最明显的例子就是人工神经网络------相当一部分的ANN模型和算法都以手写数字识别作为具体的实验平台,验证理论的有效性,评价各种方法的优缺点。
(3).尽管人们对手写数字的识别已从事了很长时间的研究,并已取得了很多成果,但到目前为止机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题。
(4).手写数字的识别方法很容易推广到其它一些相关问题棗一个直接的应用是对英文这样的拼音文字的识别。
事实上,很多学者就是把数字和英文字母的识别放在一块儿研究的。
人类认知事物的过程中,视觉起到了举足轻重的作用。
视觉是人类最高级的感知器官,它不仅指对光信号的感受,还包括了对视觉信息的获取、传输、处理、存储与理解的全过程。
随着工业自动化的发展,机器视觉作为一种应用系统逐渐得到完善和发展。
机器视觉就是用机器代替人眼来做测量和判断。
其特点是能够提高生产的柔性和自动化程度,在一些不适合人工作业的危险工作环境或人工视觉难以满足要求的场合,常用机器视觉来替代人工视觉;同时在大批量工业生产过程中,用人工视觉检查产品质量效率低且精度不高,用机器视觉检测方法可以大大提高生产效率和生产的自动化程度。
而且机器视觉易于实现信息集成,是实现计算机制造的基础技术。
在机器视觉中,常常需要从图像背景中把感兴趣的物体检测出来,模板匹配是最常用也是最基本的方法。
随着信号处理技术和计算机技术的不断发展,模板匹配在工业检测、卫星遥感、半导体封装、文字识别、导航制导、医学X射线图片处理、气象云图分析、光学和雷达的图像模板跟踪、工业流水线的自动监控、工业仪表的自动监控、资源分析、交通管理、图像数据库检索以及景物分析中的变化检测等领域应用越来越广泛。
可见,匹配技术己经成为机器视觉和众多领域中不可或缺的组成部分,对图像匹配技术进行探索研究势在必行。
在下面各章我将以一个字符识别系统为例,就字符识别概述、模板匹配算法及改进、图像预处理、系统的具体实现等方面进行描述。
第一章绪论。
第二章模板匹配算法及改进。
第三章图像的预处理。
第四章系统的设计与实现。
第五章系统运行及测试。
结束语部分对本次毕业设计做出总结。
目录摘要 (2)ABSTRACT (3)引言 (4)第一章绪论1.1 课题研究背景意义 (7)1.2 字符识别概述 (7)1.3 字符识别分类 (8)1.4 研究对象及目标 (8)1.4.1 研究的对象 (8)1.4.2 研究的目标 (8)第二章模板匹配算法及改进2.1 模板匹配算法描述 (9)2.2 模板匹配算法的数学描述 (10)2.3 算法的改进及图示 (11)第三章图像的预处理3.1 图像的平滑去噪 (14)3.2 BMP图像的存储结构 (15)3.3 颜色处理 (17)3.4 图像的二值化 (17)3.5 图像的细化 (18)3.5.1 细化算法的定义 (18)3.5.2 细化的要求 (19)3.5.3 Hilditch算法描述 (19)第四章系统的设计与实现4.1 Visual C++ 6.0介绍 (21)4.1.1 环境安装及选择的原因 (21)4.1.2 MFC概述 (21)4.2 系统界面按扭的生成 (21)4.3 模板计算的实现 (23)4.3.1 模板计算设计思想 (23)4.3.2 代码实现 (23)4.4 样本测试的实现 (25)4.4.1 样本测试设计思想….…………………………………………………..… ..254.4.2 代码实现 (25)第五章系统运行及测试5.1 系统的运行 (28)5.2 系统的测试 (28)5.3 系统的评价 (30)结束语 (30)参考文献 (30)致谢语 (31)附录部分代码清单 (31)第一章字符识别概述1.1 课题研究背景意义在机器视觉中,常常需要从图像背景中把感兴趣的物体检测出来,模板匹配是最常用也是最基本的方法。
随着信号处理技术和计算机技术的不断发展,模板匹配在工业检测、卫星遥感、半导体封装、文字识别、导航制导、医学X射线图片处理、气象云图分析、光学和雷达的图像模板跟踪、工业流水线的自动监控、工业仪表的自动监控、资源分析、交通管理、图像数据库检索以及景物分析中的变化检测等领域应用越来越广泛。
可见,匹配技术己经成为机器视觉和众多领域中不可或缺的组成部分,对图像匹配技术进行探索研究势在必行。
手写数字识别有着极为广泛的应用前景,这也是受到研究者重视的一个主要原因。
比如说在大规模的数据统计(如行业年鉴、人口普查等)中,在财务、税务、金融领域中,在邮件分拣中均有着应用。
1.2 字符识别概述计算机硬件的迅速发展以及计算机应用领域的不断开拓,急切地需要计算机能够更有效的感知诸如声音、文字、图像等人类赖以发展自身、改造环境所运用的信息资料。
但就一般意义来说,目前计算机却无法感知他们,键盘,鼠标等输入设备,对于五花八门的外部世界显得无能为力。
虽然电视摄象机、图文扫描仪、话筒等设备已解决了上述非电信号的转换,并与计算机联机,但这并不能使计算机真正知道所接受的究竟是什么信息。
计算机对外部世界感知能力的低下,成为开拓计算机应用的瓶颈,也与其高超的运算能力形成强烈的对比。
因此,着眼与提高计算机感知外部信息能力的学科----模式识别得到了迅速的发展。
在模式识别领域中,手写字符的识别是一个非常活跃的研究方向。
但这方面的研究工作已有很多,其中不少成果得到了广泛的应用。
但是由于手写字符拓扑结构的多样性,目前已有的手写字符识别体统在对无限制手写字符进行分类时,始终存在这样或那样的缺陷。
字符识别是模式识别领域中的一个非常活跃的分支。
这一方面是由于问题本身的难度使之成为一个极具挑战性的课题。
另一方面,是因为字符识别不是一项孤立的应用技术,其中包含了模式识别领域中其它分之都会遇到的一些最基本的和共性的问题。
也正是由于字符识别技术的飞速发展,才促使识别领域和图像分析发展为一个成熟的科学领域。
字符识别技术的研究主要集中在特征抽取和模式匹配两个方面,这一直是光学字符识别(OCR)技术的两大关键所在。
由扫描仪转化后的字符二值图像中各点的值,可以看成是该字符的一组特征。
但由于这组特征的数量较大,而每个特征所含的信息量很少,因此有必要通过映射或变换的方法将信息集中到少量的特征中。
这个过程就叫特征抽取。