手写数字的识别研究
四、手写体数字识别中特征值提取技术
统计特征提取
计算机要把人类识别物体时的这种黑箱式的映像表达出来,一般式有两
个步骤完成的:第一步,以适当的特征来描述物体,第二步,计算机执行某种
运算完成的映像。此过程实际上就是传统的统计模式识别进行物体识别时所采 用的一般方法,具体来说就是特征提取和分类函数的设计的问题,而特征提取
三、手写体数字识别系统概述
2) 特征提取阶段 由于原始数字图像数据量大,冗余信息较多,一般不进行直接识 别,而是进行提取有效特征数据、压缩数据,然后再进行识别。换句 话说特征提取是为了去除图像信息中对分类没有帮助的部分,将图像 信息集中到几个有代表性的特征上来的过程。特征值的提取一般包括: 笔画、拓扑点、结构突变点、投影形状、点(端点、连点、三叉点、 四叉点、垂直交点,水平交点等)、弧、连通区域、凸凹形状、环、 字符整体轮廓、检查必要的基元是否存在、不可有的基元是否出现等 特征。
手写数字识别
手写数字识别(Handwritten Numeral Recognition,简称 HNR)是OCR的一个分支,它的任务是把手写阿拉伯数字(如0,1,
2,……,9)通过非键盘方式输入到计算机中,以便作进一步的处理
和应用,给计算机建立视觉系统,自动辨识人用笔写在介质上的数字。 它属于模式识别、人工智能的一个重要分支,涉及到模式识别和图像
1) 预处理阶段 在获取原始数字图像过程中,由于光照、背景纹理、镜头分辨率、 拍摄角度等原因,难免会造成图像失真并带有噪声。由于这些噪声的 影响,如果对获取得到的数字图像进行直接处理的话通常不能得到满 意的结果,因此在获取原始数字图像后,需要对图像进行预处理。对 于字符识别的预处理过程一般包括:滤波去噪、二值化、字符切分、 图像校正、归一化处理。经过预处理后的图片不仅能够有效滤除噪声, 并且能够将不同的大小、倾斜角度的字符进行归一化到一个固定大小, 对大量数据进行压缩处理。预处理阶段在该系统中是一个很重要的阶 段。预处理效果的好坏会直接影响到整个系统的性能。
手写数字的识别研究 及其特征提取技术
xxx
一、字符识别及手写数字识别技术概述 二、手写数字识别的难点 三、手写体数字识别系统概述 四、手写体数字识别中特征值提取技术
1、结构特征提取
2、统计特征提取
一、字符识别及手写数字识别技术的概念
一、字符识别及手写数字识别技术的概念
字符识别
光学字符识别(Optical Character Recognition,简称OCR) 是20世纪20年逐步发展起来的一门自动化技术,是图像处理与模式识 别领域的一个重要分支。其目的就是通过扫描、摄像等光学输入方式
是问题难点和关键所在。因此如果特征已知,就可以利用现有的数学理论来指
导设计映像函数。然而,对于特征的选择和提取,却没有可遵循的理论来指导, 我们很难比较一个物体中哪些特征是实质性,哪些特征是代表性的,哪些特征 可能是不重要或与识别无关紧要的,这些都需要大量的实验和理论指导。经过 人们在这方面的大量研究工作,提出了一些统计特征提取方法。
四、手写体数字识别中特征值提取技术
结构特征提取
虽然字符的笔划特征受字体、字形大小等影响较小,是识别字符的良好
特征,但可惜笔划特征对实际的书写文本来说比较难稳定的提取。通常,用基
于笔划段作为特征能较好的解决这一困难。采用结构特征提取方法的难点在于 笔划或笔段等基元的准确提取。虽然提取笔划或笔段的方法已有多种,但他们
三、手写体数字识别系统概述
4) 判别处理阶段 当分类完成后,为了保持系统的识别性能,通常需要对识别结果 作一次判别处理,认为该结果是否被接收还是拒绝。这个阶段可以根 据具体的应用来设计不同的判别决策。例如,在金融数字的识别中, 要求错误识别率相当高,那么在判别处理时严格限制接收条件就可以 降低识别的错误率。
处理、人工智能、统计决策理论、模糊数学、组合数学、信息论、计
算机等学科;同时也涉及心理学等,是介于基础研究与应用研究之间 的一门综合性的技术,在办公室、机器翻译等方面具有重大实用意义。
二、手写数字识别的难点
二、手写数字识别的难点
在一般情况下,当涉及到数字识别时,人们往往 要求识别系统有很高的识别精度,特别是有关金融的 数字识别时,如支票中填写的金额部分,更是如此。 因此针对这类问题,就要求手写数字识别系统具有高 可靠性和高识别率。总结数字识别的难点主要在于以 下几方面。
四、手写体数字识别中特征值提取技术
统计特征提取
从统计模式识别的观点来看,字符识别实际上是一个模式分类问题,人
对自然物体的识别,是建立在对该物体进行学习、特征分析的基础上的,计算 机模式识别的过程与人的识别过程有着相似的地方。实际上就是一种通过学习 或者其它方法,形成一个记忆知识库,进行模式识别时,清晰地表达出一种从 物体通过学形成的记忆库,对识别的物体进行一种黑箱式的映像,从记忆 库中找出相匹配的类别。
四、手写体数字识别中特征值提取技术
四、手写体数字识别中特征值提取技术
特征提取是整个字符识别系统的关键,识别算法 是根据选取特征的种类来进行选择的。所选取的特征 是否是稳定,是否代表一类字符的特点,是系统识别 率的高低关键。 手写体字符特征提取的方法可分为结构特征和统 计特征两种,下面就分别简单介绍这两种特征提取方 法的特点与一般方法。
三、手写体数字识别系统概述
3) 分类识别阶段 分类识别是数字识别的关键步骤之一,它是指分类器依据特征提 取阶段抽取的特征,就送入分类器中做最后的字符分类识别。该环节 现在普遍采用的是基于神经网络和模板匹配两种模式。考虑到神经网 络能够很好的容忍字符的形状变换、噪声的影响。因此,在分类其中, 我们将提取到的特征值输入到已经训练好的神经网络中进行分类识别。
将汉字报刊、书籍、文稿及其它印刷品的文字转化为图像信息,将图
形、表格的图像进行保存,再利用文字识别技术将图像内的文字或表 格中的资料一律变成计算机能识别的文字,以便于计算机的管理维护。
它能够减少存储容量、通讯交流的信息、循环利用已识别出的文字以
及节省因键盘输入而浪费的人力、物力、财力和时间。
一、字符识别及手写数字识别技术的概念
三、手写体数字识别系统概述
三、手写体数字识别系统概述
不同的识别系统,在具体处理一幅待识别图像时, 处理的步骤可能并不完全相同。但是就一般情况看, 一个完整的OCR识别系统可分为:原始图像获取,预 处理,特征抽取,分类识别和判别处理等模块。
原始图像获取 预处理 特征提取
识别结果
判别处理
分类识别
三、手写体数字识别系统概述
四、手写体数字识别中特征值提取技术
结构特征提取
采用结构特征提取字符进行结构分析从而达到识别的目的,是一种非常
直观的方法,其思想与人认字的原理有点相像,但又有所不同。其基本思想是:
字符可以逐级分解成部件、笔划乃至笔段,识别时可以自底向上,由像素得到 笔段,由笔段结合成笔划,由笔划构成部件,由部件组成字符,逐级分析字符
都是基于图像处理的方法,截然不同于人根据知识和经验而做出的视觉处理。
单纯建立在图像处理方法上的笔段分析只能十分机械的按图像就事论事,结果 提取到的笔段难免与人的判别不完全一致。这种情况在存在连笔、断笔、模糊 等场合尤为不可避免。所以,书写畸变对结构特征分析法有着不可忽视的影响。 因此,寻求稳定可靠的笔段提取方法仍然是当前有待进一步研究的课题。
图像的结构,根据各元素的属性、数量及其互相关系,便可以判定待识字符。
目前研究比较成熟,效果较好的是基于笔划和基于笔段分析的手写体字符识别。
四、手写体数字识别中特征值提取技术
结构特征提取
对不同的字符手写样本,尽管人书写风格千变万化,然而笔划与笔划之
间的位置关系,以笔划为基元的字符的整体拓扑结构是不变的。人认字就是抓 住了这些本质不变的特征,因此能适应不同的书写风格的文字。所以,基于笔 划来自动识别字符一直是手写体字符识别研究的一类主要研究方法。
二、手写数字识别的难点
难点
1、阿拉伯数字的字型信息量很小,不同数字写法字形相差又不大,使得准确 区分某些数字相当困难; 2、数字虽然只用10种,而且笔画简单,但书写上带有明显的地域特性,同一 数字写法千差万别,不同地域的人写法也不相同,所以很难做到兼顾各种写法 的极高识别率的通用型数字识别系统; 3、在实际应用中,对数字的单字识别正确率的要求要比文字要苛刻得多。这 是因为,文字组合一般都存在上下文关系,但数字组合存在极少的或没有上下 文关系,所以每个孤立数字的识别都至关重要; 4、由于脱机手写数字的输入只是简单的一幅图像,它不像联机输入那样可以 从物理输入设备上获得字符笔画的顺序信息,因此脱机手写数字识别是一个更 有挑战性的问题。
Thank you
2014.10
模式识别研讨课