XXXXXX信息资源管理解决方案目录一、项目背景 (1)二、项目需求 (1)2.1现状描述 (1)2.2需求分析 (1)三、项目建设方案 (2)3.1资源建设加工工艺 (2)3.2普通纸质文档 (2)3.3珍贵纸质文献 (4)3.4电子文档 (6)四、应用系统设计方案 (7)4.1系统设计架构 (7)4.2资源加工管理平台 (8)4.2.1概述 (8)4.2.2功能及特点 (8)4.2.3特点 (9)4.2.4信息检索 (9)五、投资预算 (11)六、项目培训安排 (12)6.1主要培训对象 (12)6.2组织培训活动的要求 (12)6.3培训方式 (13)6.3.2一对一培训 (14)6.3.3现场指导 (14)6.3.4专题培训 (14)七、运行维护方案 (15)7.1运行维护管理体系 (15)7.1.1运行维护目标 (15)7.1.2组织机构设置 (16)7.1.3运行维护计划 (18)7.1.4运行维护方式 (18)7.2运行维护方案实施 (19)7.2.1日常维护 (19)7.2.2备份与恢复 (20)7.2.3升级维护 (21)7.2.4问题清单管理 (22)7.2.5应急事件支持 (23)八、售后服务管理 (25)8.1帮助业主组建运维中心 (25)8.2售后服务计划 (25)8.3售后服务组织结构和职责分配 (26)8.4技术支持的流程 (26)8.5完备的服务措施 (27)8.6售后服务的承诺 (29)知识管理系统建设是一个大型的、综合性的信息化工程,它涉及到 XXX 日常业务和管理的方方面面,本次项目主要针对 XXX 目前保有的资源进行数字化加工、处理、发布,是 XXX 数字化建设的主要内容之一。
知识管理系统是整个 XXX 信息化的依托,利用各种采集加工手段,如扫描、OCR、矢量化处理及数码技术等,将各种资源信息(例如文档、影像、图纸、视频、音频和手稿等)加工成为一个丰富的数字资源库,通过提供开放的检索接口,为其它平台提供数字资源信文化服务展示平台,是 XXX 进行传播、展示、交流的有效途径,也是 XXX 数字化建设的重要组成部分,不仅可以实现 XXX 内部的数字化陈列,开展社会利用,还可以通过 Internet 向世人展示 XXX 风采。
2.1现状描述经过多年的积累,目前 XXX 已经保存了大量的文档、邮件、图片等,这些资源都是 XXX 史上非常有价值的资源,迫切需要建设一个资源信息化平台,以利于搜集、整理、开发、共享、利用这些资源,为推动 XXX 数字化建设打基础、做积累。
知识管理是一项事关 XXX 资源建设向数字化、信息化迈进的大事。
需要创新手段,引进数字化、信息化、智能化等高新技术,是 XXX 资源建设中一个新的发展方向和重点。
2.2需求分析通过对 XXX 目前数字化建设的需要,以及目前建设现状的了解,我们认为需求如下:纸质资源加工:目前 XXX 的资源,本期项目主要包括文件、档案、邮件、图片、视屏等重要信息,需要首先进行处理,将这些资源数字化处理。
资源库的建设:主要是建设数据库,将文件、档案、邮件、图片、视屏等重要信息数字化的资源进行有效的组织和存储,后期会增加其他多种类型资源的建设。
资源发布设计:根据 XXX 资源的特点对其进行专门的设计,实现资源的合理发布。
三、项目建设方案3.1资源建设加工工艺资源的数字化是 XXX 数字资源库建设过程中一项重要的基础性工作,利用先进、成熟的计算机技术以及合理的加工工艺流程,将原始的纸质、电子文档等资料高效、准确、批量地转化为数字文档,是XXX 数字资源库要解决的问题,也是保护珍贵档案原件的根本措施。
知识管理系统数字资源库的资源加工系统主要针对2种不同资源载体:纸质文档和各种电子文档,针对不同的资源载体,采用不同的加工工艺。
对于纸质文档,如书籍、文献等,通过扫描、OCR识别、编改、标引、分类、检查、入库进行加工;针对专著,则通过拍照、标引、分类、检查、入库进行加工。
电子文档主要分为电子文档、视频、音频、图片、光盘等资料进行整编、分类、检查、入库。
3.2普通纸质文档纸质文档数字化就是将纸质文档转化为基于原文影像及标引信息(或全文信息)的数字文档的过程。
其工作流程主要包括文献的收集整理、扫描、图像处理功能(如图像倾斜校正、图像去噪等)、OCR识别、文字编改、目录编改、生成电子书、重新装订、备份等流程。
该流程要求支持工序回馈,形成一个闭环的质量控制系统。
(1)文献的收集与整理是数字化加工流程的预备工序,主要是将纸制的文献资料按分类要求进行分类、组卷、排列、修补、编写案卷号与页号。
(2)扫描加工通过中高速扫描仪和专用扫描软件使用300DPI以上分别率,将整理好的文献资料批量转化成图像文件并对扫描图像自动进行命名、书页管理和浏览。
扫描过程建议采用页号顺序,以方便页码的管理,保证扫描的图像质量与原件一样清晰,提高扫描工作的效率。
(3)图像处理对扫描后的文件使用文献数字化工具进行自动倾斜校正、去噪、版心校正、剪裁、反转、灰度图像页自动搜索、灰度图像页亮度及对比度的调整、整书去除装订孔、整书裁边、增加图章、内容居中等处理,并自动实现图像的压缩存储。
(4)OCR识别是通过OCR 软件将扫描生成的光栅图像文件自动辨识成文本字符的过程。
根据需要,可对档案的部分内容(如标引信息)或全文进行识别,还要求能够利用目录块文字信息,对全文进行搜索、识别,从而自动生成目录树,提供方便的、可视化的目录树编改环境。
鉴于字体、纸张状况以及识别算法等诸多因素,OCR 的识别率不可能达到100 % ,因此在自动OCR 处理之后,还需要进行人工校对和补录(简称OCR 后处理)。
OCR 后处理功能可在图文编辑工序中具体实现。
(5)图文编辑是建立电子文档的核心工序,主要实现图像处理,页号排序,建立文献标引/ 全文信息(人工录入或OCR 后处理),分类、案卷与图像挂接,目录与图像挂接,密级设置等功能。
(6)生成电子书是将已经处理好的图像、目录打包成一个标准的电子格式,如PDF 格式,用于网上浏览,系统可以结合水印方面的图像技术,保护版权。
(7)重新装订即根据被拆开的文献资料原件上的页号排列顺序,并且根据装订要求重新装订。
装订完的档案经过质检员检查后才可以归还档案库房。
(8)备份是文献数字化加工完成后必须进行的安全管理的一环。
系统维护人员使用备份软件定期将加工好的电子文献(原文影像及文字信息)从服务器中转储到光盘或磁带上,以作长期备份。
3.3珍贵纸质文献珍贵纸质文献数字化, 就是利用现代信息技术将文献转化为电子载体的形式, 通过数据库、光盘、网络等介质进行保存和传播。
珍贵纸质文献数字化有利于文献的保护与使用。
珍贵纸质文献中有些纸张已经变质变脆, 不能再流传阅读。
而有些孤珍本, 需要珍藏, 也无法正常流通使用。
为了保存这些文献, 也为了资源得到有效的开发和利用, 将这些文献进行数字化处理也是非常必要的。
在珍贵纸质文献的数字化过程中,由于专著年代久远、纸质脆弱,不耐强光和高温,因此对设备要求较高,应选用拍照式扫描仪,最大限度地减少对文献的损耗。
同时,在扫描前,要选择恰当的分辨率、清晰度和合适的尺寸等,扫描尽可能一次完成。
扫描后的图像还应进行人工处理,如去污、纠偏等。
对于珍贵纸质文献的分类、编目、主题标引,必须依据文献的自身特点,对每一本文献的题名、作者、版本、年代等检索点进行标引。
加工流程见下图。
图加工流程图具体加工工艺如下:(1)清理由于珍贵纸质文献的收藏比较重要,文献的清理是其数字化加工的关键工序,主要是将珍贵纸质文献按分类要求进行分类、编写案卷号与页号等工作。
(2)拍摄或扫描及处理珍贵纸质文献的拍照扫描加工必须通过专业拍照扫描仪和专用扫描软件,严格要求按照页号顺序,使用彩色拍照,300DPI以上分辨率,256灰度,必须保证图像质量与原件一致。
将整理好的专著资料转化成图像文件并对拍摄或扫描的图像自动进行命名、书页管理和浏览,提高扫描或拍摄的效率。
对扫描后的文件要求使用软件进行自动倾斜校正、去噪、版心校正、剪裁、反转、灰度图像页自动搜索、灰度图像页亮度及对比度的调整、整书裁边、增加图章、内容居中等工作,并通过软件自动实现图像的压缩存储。
(3)建元数据库由于珍贵纸质文献可能存在污损、残缺等情况,给OCR识别工作带来一定的困难,而且识别率很低,因此根据需要对不能识别的文献手工建立详尽的元数据库与目录树,并压缩储存相关扫描图片,以提供方便的检索功能。
(4)图文编辑是建立电子文档的核心工序,主要实现图像处理,页号排序,建立文献标引,分类、案卷与图像挂接,目录与图像挂接,密级设置等功能。
(5)图文质检是一个模拟查询调阅的过程,主要包括文字内容校对、原文图像质检、图像挂接检查与密级校核等,以综合检查扫描和图文编辑工序的加工质量。
(6)备份是珍贵纸质文献化加工完成后必须进行的安全管理的一环。
系统维护人员使用备份软件定期将加工好的电子古籍(原文影像及文字信息)从服务器中转储到光盘或磁带上,作长期备份。
3.4电子文档随着信息化程度的不断加深,部分文献信息已经以各种各样的数字化形式存在,知识管理系统数字资源库的建设就是要将这些杂乱的数字文档,进行统一格式,整理分类等操作,并发布成数据库供用户检索使用。
四、应用系统设计方案4.1系统设计架构本期项目建设主要针对资源加工、资源管理、资源发布、资源检索几个主要功能点,整体系统架构设计如下:4.2资源加工管理平台4.2.1概述资源加工管理平台将各种资源(如文献、图像、视频、音频等)按规范的元数据定义整理、加工、组织,形成有序的数字资源库,并且在此基础上,能够支持以资源(如:文档、影像、图纸等)利用为目的的多媒体发布和服务。
系统重点在于有效管理数字资源形成的一体化过程以及成果,将纷繁复杂的多媒体资源形成具有数字化保存、利用价值的资源,化无序为有序。
系统基于流程化的管理思想,设计思路灵活,系统可扩展、可定制。
该系统对于合理规划加工流程和分配加工任务、保证加工质量、提高加工效率、控制加工进度、节约加工成本、管理加工人员等都有重要和实际意义。
4.2.2功能及特点(1)分类标引工具支持文本、图片、图像、动画、音频、视频等各种媒体的的元数据标引、内容分类;支持多用户在线标引、多用户在线分类及其流程化管理;支持多用户在线检查。
(2)标引的多种形式系统支持多种形式的标引:集中标引集中进行标引,支持继承录入。
批量标引可以将外来数据(EXCEL、TXT)文件批量导入到系统中。
(3)电子图书制作工具可自动将PDF/WORD等常见格式的电子文档转换成CAJ/PDF格式;支持图象扫描及处理、OCR识别等,实现纸质资源的数字化加工。