当前位置:文档之家› 博奥汉通图书馆数字化加工方案

博奥汉通图书馆数字化加工方案

数字图书馆文献资源建设图书期刊数字化解决方案北京博奥汉通科技有限公司目录——————————————————前言.......................................................................................................................................... - 1 -方案概述...................................................................................................................................... - 2 -图书数字化解决方案.................................................................................................................. - 2 -图书数字化的工序 (3)图书数字化的种类 (4)第一类全文图像化,有简单的目录索引 ...................................................................... - 4 -第二类全文文本化,可全文检索 .................................................................................. - 4 -第三类全文图像文本化,可全文检索 .......................................................................... - 5 -第四类基于原版原样的,可全文检索 .......................................................................... - 5 -优秀的加工团队.................................................................................................................. - 9 -低廉的价格.......................................................................................................................... - 9 -完善的服务.......................................................................................................................... - 9 -与传统图书数字化的比较. (10)正确率................................................................................................................................ - 11 -加工速度............................................................................................................................ - 11 -单位价格............................................................................................................................ - 11 -图书数字化的过程.. (11)公司简介.................................................................................................................................... - 13 -联系方式:尹经理.................................................................................................................... - 13 -前言——————————————————随着全国文化信息资源共享工程与中国数字图书馆工程的起动,信息化已成为国际潮流,信息资源建设成为当务之急。

信息资源建设的重点是电子文献、各类数据库、网络资源、电子杂志、电子图书等新型数字化信息资源的建设。

在数字化信息资源建设中,很大的一个需求是将现有的纸介质印刷品数字化,使之成为能够用计算机阅读、理解、查询、检索的电子文件,最终将其应用于数据库存储,或通过CD-ROM、Internet网进行出版,或上传数字图书馆供用户使用。

以传统纸张为载体的保存方式,占据了大量的空间,需要特殊的环境,而且不方便查询,随着时间的推移,还面临着腐蚀、老化等问题。

而将纸介质文件信息进行电子化处理,保存到光盘上,具有存储、管理、共享等功能,还可以减少文件库房占地,节省保管设备和人员方面开支,又方便统计和进行远程查询。

因此,将图书、期刊、报纸等资料通过扫描仪,扫描成图像文件,再通过OCR识别成文字,建立目录和全文索引,制作成电子文件,已是当务之急。

方案概述——————————————————我公司和多家大专院校的图书馆有过多次成功的合作,并成为CADAL(高等学校中英文图书数字化国际合作项目)、CALIS(中国高等教育文献保障系统)的数字资源建设服务商之一。

在此基础上,我们充分理解图书数字化对大学图书馆建设的重要意义,同时我们也非常希望能与贵馆在信息化建设方面建立长期的合作关系。

本次与贵馆洽谈合作,拟在以博奥汉通人多年来在图书、报纸、期刊、杂志和档案方面专业的数字化服务与实施经验,为客户提供高效、高质量的信息资源数字化服务奠定了坚实的基础。

图书数字化解决方案——————————————————图书拆分→图像扫描→图像处理→文字识别→横向校对→纵向校对→对比校→索引制作→索引质检→成品验收→图书装订还原1. 图书拆分为了方便扫描加工,对可以拆的图书进行拆分扫描,加工完后再进行图书还原。

其流程为:图书封皮与书脊分离,将脱离封皮的图书书脊用电动切纸机切去胶块部份,不同情况按不同尺寸精度切开。

2.图像扫描扫描组主要负责将纸质性的图书扫描转为电子版的图像。

在过程当中保证没有少扫漏扫现象。

3.图像处理修图组是对扫描完的电子图像进行去污、校正等;同时修图组还进行质检图像模糊、原稿残缺、补扫、漏扫、图片不完整、多图重叠等图像问题。

4.识别与校对用专业的英文识别软件将图像进行标注并识别其文本,然后进行人工一、二、三校,以保障数据的质量达到出版水平。

文字识别:差错率千分之五横向校对:差错率万分之五纵向校对:差错率万分之三对比校:差错率万分之一5.索引制作:按照索引项目利用所提供的软件进行标注或人工标引。

6.索引质检:检查索引的文字正确性与索引的字段标识。

7.成品验收:对图像、文本与索引进行全面的质检,合格后提交成品。

8.装书还原:成品入库后,就可以进行图书还原工作了,把要还原的图书用平台订书机和电动打穿装订机将书的内容装订好,然后用胶订机把书粘好,还原为原书。

图书数字化根据检索和利用需求,大概分为以下几个种类:第一类全文图像化,有简单的目录索引这种类型的图书数字化,仅仅是将纸质的资料利用扫描仪扫描成图像文件,并进行简单的编目,提供目录索引,而不做文字的识别。

其流程如下:这种电子资料的好处在于投资小,每单位的价格最便宜;其缺点是没有全文检索功能,只能为读者提供简单的索引查询,图像文件较大导致浏览速度较慢。

第二类全文文本化,可全文检索这种类型的图书数字化,全部利用人工录入,建立全文文本化的电子资料,可以提供全文检索。

其流程如下:其优点是占用存储空间较小,可实现全文检索,浏览传输速度快;其缺点是未经过格式化,没有版面信息,读者阅览到的是单纯文本,单位价格较高。

第三类全文图像文本化,可全文检索这种类型的图书数字化,在提供纸质资料的扫描图像文件后,还进行了人工录入或者OCR识别,为图书建立了全文文本,因此可以提供全文检索。

其流程如下:这种类型,实际上是利用双层文件的形式向读者展示电子资料的。

它分为上下两层,上面的是图像层,下面的是文本层,但是这种文本没有经过排版,它是无格式混乱的。

读者看到的是上层的图像,而全文检索时,可以使用下层的文本。

这种类型的好处在于单位价格较便宜,但是由于在读者浏览时要同时传输图像文件和文本文件,其浏览速度最慢。

第四类基于原版原样的,可全文检索这种类型的图书数字化,利用扫描仪将纸质资料扫描加工成图像文件,再通过OCR工厂,识别成能够保留原始版面样式的文本化的文件(如:rtf、pdf格式),它既保留了版面的信息,又是全文文本化的,可以提供全文的检索。

其大致流程如下(更详细的流程参见后面的“博奥汉通图书电子化的过程”):这种类型的优点在于支持全文检索,占用存储空间较少,由于是文本格式的文件,电子资料质量(放大、缩小是不失真)和浏览速度都很好;其缺点是价格较高。

四种类型比较全文检索价格浏览速度占用存储空间第一类全图像不支持最低较慢较多第二类全文本支持较高最快最少第三类图像文本支持较低最慢较多第四类原版原样支持最高较快较少我们在图书数字化方面的优势我公司一直秉承提供最好服务于客户的理念,为客户提供优质价廉的产品与服务,帮助客户提升其价值,发挥其优势。

博奥汉通公司是专业化的信息数字化提供商,能够提供以上所有类型的服务,但是,从以上的比较中,我们可以看出第四类的图书数字化方式是具有最好性能价格比的方案,也是博奥汉通公司大力推荐的。

下面从质量、产品、规模、价格、服务、成功案例等几个方面介绍我们在图书数字化方面的优势:规模化、流水线式的数字化加工公司避于手工业作坊式的生产方式,建立了数字化加工工厂。

并创立了从资料整理去污→扫描→图像处理(纠偏、消蓝、图像增强、去杂)→OCR识别(版面分析、识别、横向校对、纵向校对、导出文件)→建立索引→刻录光盘(可全文检索、二次检索、模糊检索)等全过程的流水线式加工方式,大大提高了加工效率和效果。

相关主题