长安大学毕业设计开题报告表
别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段。
简单来说,从影像到结果输出,须经过影像输入、影像前处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正,将结果输出等环节的过程。
随着我国信息化建设全面普及,OCR 技术的应用前景将更加地广阔。
就目前从行业需求来看,金融、保险、税务、工商、电子商务等行业对信息识别的需求已经越来越广泛,促进了识别技术的大规模应用。
而个人消费者对资料电子化、手写识别技术等各方面需求则拓展了OCR识别技术在这一领域的应用之路,另一方面,网络时代的高速发展使个人资料电子化、商务办公自动化等需求的呼声也变得越来越高。
但是,即使是再尖端的技术,终将揭开它神秘的面纱而走向大众,或许,OCR 的未来应用会伴随信息技术的大众化而变得多姿多彩。
也许,现在我们无法穷尽OCR的应用,但是,在未来,文字识别技术会出现在更多的文字出现的地方,在人们的日常生活中发挥更大的作用,也必将催生出一个无法想象的庞大市场。
三本课题的研究内容、方法、手段及预期成果
由于扫描仪的普及与广泛应用,OCR软件只需提供与扫描仪的接口,利用扫描仪驱动软件即可。
因此,OCR软件主要是由图像处理模块、版面划分模块、文字识别模块和文字编辑模块等4部分组成。
1、图像处理模块
图像处理模块主要具有文稿扫描、图像缩放、图像旋转等功能。
通过扫描仪输入后,文稿形成图像文件,图像处理模块可对图像进行放大,去除污点和划痕,如果图像放置不正,可以手工或自动旋转图像,目的是为文字识别创造更好的条件,使识别率更高。
2、版面划分模块
版面划分模块主要包括版面划分、更改划分,即对版面的理解、字切分、归一化等,可选择自动或手动两种版面划分方式。
目的是告诉OCR软件将同一版面的文章、表格等分开,以便于分别处理,并按照怎样的顺序进行识别。
3、文字识别模块
文字识别模块是OCR软件的核心部分,文字识别模块主要对输入的汉字进行"阅读",但不能一目多行,必须逐行切割,对于汉字通常也是一个字一个字地辨认,即单字识别,再进行归一化。
文字识别模块通过对不同样本汉字的特征进行提取,完成识别,自动查找可疑字,具有前后联想等功能。
4、文字编辑模块
文字编辑模块主要对OCR识别后的文字进行修改、编辑,如系统识别认为有误,则文字会以醒目的红色或蓝色显示,并提供相似的文字供选择,选择编辑器供输出等。
它的工作原理为通过扫描仪或数码相机等光学输入设备获取纸张上的文字图片。