数 字 档 案 馆 建 设 基 本 思 路 与 构 建 杭州市档案局 赵建国、林杭顺、陈莉莉、梁凯【摘 要】随着社会、经济现代化步伐加快和我国加入WTO以后,社会公众对档案、文件的利用需求和要求不断提高。
作为国家综合性档案馆责无旁贷的要迎合信息化发展的要求并全面提供档案信息资源为党委、政府领导、市级机关工作服务和社会公众服务。
档案馆保存各种文字、图表、声像等不同的馆藏载体及政府部门在其长年的政务工作中积累了大量原始档案资料,当今档案载体及其信息载体呈现出多样化的特点,因此,如何加快档案信息化管理工作非常关键。
为了更好地使馆藏档案数字化资源融入于社会基础信息资源库,数字档案档案馆建设势在必行。
以信息技术为主要特征的知识经济时代,信息化建设已成为评价一个国家信息基础水平的重要标志。
档案馆作为社会信息资源系统的一个重要组成部分,正面临着信息化时代的挑战。
当今在档案学理论界开始对数字档案馆进行了讨论和研究,内容涉及数字档案馆的概念、特征、要素、结构以及对国外数字档案馆的关注等方面。
数字档案馆较之传统档案馆的在档案的存放时效、查询速度及信息共享方面的优势是明显的,在国外先进国家都已经有了成功的建设运行实例。
本文从数字档案馆的建设,以建设的目标、内容、系统、关键技术等方面进行初探,抛砖引玉,供大家参考,请指正批评。
【关键词】信息化 档案 建设一、数字档案馆的总体建设目标数字档案馆系统将是一个区域性、开放型的文件、档案信息中心,能够为机关各单位和社会各界人士提供网上档案查询服务,以达资源共享。
对有价值的图像、文本、语音、影视、软件和科学数据等多媒体进行收集、组织和规范化再加工,并进行高质量的保存和管理,通过网络提供高速跨库连接的多媒体信息存取服务,促进社会各类信息高效、经济地传递。
这将极大地推1动了档案部门信息化工作。
数字档案馆应是一个分布式的大型数据库,即以分布式的海量数据库为支撑,基于检索智能技术和宽带高速网络技术的大型开放、分布式信息库。
要充分结合先进的信息技术、主机系统、扫描技术、网络系统、存储技术和安全管理体系。
使档案工作提高到全新的管理模式,将带来显著的管理效益和社会效益,重点体现以下几个方面:规范和制订档案、现行文件的有关标准和相关的信息标准;规范档案馆业务处理流程,提高办公效率,减轻工作强度,实现办公自动化;实现档案局与政府机关各部门档案室之间、下属区县(市)档案局(馆)数据及局内各部门的双向信息共享和交流,提高信息使用效率;整合信息资源,为政府的数据统计和决策提供相应的支持;推动职能上网和提供档案信息服务,建立一站式网站,面向公众进行服务。
二、数字档案馆建设内容根据总体建设目标,在整个系统的建设中,包括了以下几个方面的主要内容:总体架构说明2数字档案馆建设包括内网系统(数字化档案系统)、政府外网系统(网上档案馆系统)、外网系统(门户档案系统)三个系统的建设,这三个系统互有区别,又有一定的数据共享联系。
内部局域网主要实现档案馆内部办公自动化、档案数字化综合应用系统。
实现无纸化办公,数据信息共享,档案数字化管理,提高办公效率。
政府外网部分即包括与政府部门之间的数据共享,提供政府部门统一的档案管理系统和档案查询系统;同时专网还包括与上下级档案馆系统之间的数据共享,集中数据,方便共享和检索以及档案综合业务处理系统。
同时解决档案信息孤岛问题。
外网部分主要是档案门户网站,它将作为展示档案馆整体形象的窗口,同时也成为档案职能部门联系群众、服务群众的一座桥梁,为社会公众提供大量的开放档案和现行文件信息。
这三个网络根据其功能和用途不同,其保密需求程度不同,根据政府相关文件规定,外网系统与内网及专网之间需物理隔离,专网与内网之间也需逻辑隔离,保证网络系统的安全。
建议采用防火墙技术实现内网与专网之间的逻辑隔离,采用安全岛技术实现外网与内网及专网之间的物理隔离。
达到数字档案馆特定安全保障体系。
三、数字档案馆系统设计思1、应用支撑平台总体结构数字档案馆系统的应用支撑平台逻辑结构如图所示:3综合平台实现体系分解为四个层面的架构。
1.1在架构最底层,是最基础的开发平台,即基于J2EE和ORACLE或DB2的开发体系架构的分布式应用开发环境。
1.2在这个环境之上,是一个中间件平台层。
这个中间件平台层提供了可工作于不同应用内容项目中的核心服务功能,作为基础服务平台支撑在其上开发的应用逻辑的运行。
这个中间件平台由应用服务器软件(Application Server)、部件化的功能包和相应的二次开发接口组成,例如与CA认证系统的接口。
应用服务器(Application Server)推荐使用IBM公司的WebSphere。
中间件平台层还包含了3个中间件平台:分布式异源数据交换共享管理中间件、非结构化信息管理中间件、分布式动态工作流管理中间件与检索服务中间件。
1.3在中间件平台之上的是针对不同应用系统的应用逻辑功能。
这些应用逻辑功能实现了反映各个应用系统具体工作的内容。
1.4最上层的就是具体的个性化应用界面,实现单点登录和个性化应用集成。
通过这样一个完整、统一的门户支撑架构,数字化档案馆的各种分布式应用系统和网络资源,就被完整地相互交织在一起,起到了相互数据沟通、相互服务调用、相互业务协同的“无缝结合”的情景。
42、数字档案综合应用系统设计以高速扫描仪、音视频设备为信息入口,将纸张、照片、录音、录像、缩微胶片上的信息转换成电子档案,并将数字化信息的图文数据库存储到海量存储载体中,通过相应的检索技术,实现以“以文本为检索对象,图文转化接口为检索结果”的全文检索,实现数字化信息管理自动化。
全面完成档案、文件信息的数字化。
2.1具体内容如下:建立档案管理参考标准(数字档案是新的载体的档案,与传统档案不同)。
建立数字档案管理新规范。
建立档案数字化系统和对馆藏档案进行数字化加工。
支持对各种不同类型载体的档案进行数字化处理和转换,完成馆藏档案的数字化。
建立统一数据平台,对各种跨平台数据进行自动交换形成国家规定数据交换格式。
建立数字档案管理平台和业务处理系统。
实现网络处理档案局(馆)所有的档案管理业务的工作目标:支持通过网络交换(即电子归档,包括管理信息、数字化档案和数字档案);支持海量存储和检索解决方案(内网、外网);对有文本、图像、图形、音频、视频等不同形式载体的数字档案要有相应的检索和分类方法。
建立区域性档案中心。
建立与市政府局各部门和各区县(市)档案馆的档案和政府文件的互联查询资源共享。
2.2主要功能:在内网上应实现的功能:档案数据采集:(案卷级著录、文件级著录、专题著录、扫描录入、资料著录、图片著录、资料扫描、现行文件著录、多媒体导入)等;档案资源管理:(全宗数据管理、报表管理、业务工作管理、资料数据管理、现行文件数据管理、库房管理等);档案利用发布:(利用管理、综合查询)等系统。
在政府外网上实现的功能: 政府机关、各上下档案馆之间统一的档案管理、数据交换、分布查询等系统。
在互联网上实现的主要功能:政务公开、馆藏指南、网上查档、网上办事等5真正实现“三网”资源共享和信息互动。
3、技术实施原则数字化档案馆现对纸质资料、视频、音频或缩微胶卷进行电子化处理的目标。
由相关机构集中地组织负责资料扫描、加工、查询及相应的管理运作的工作。
档案电子化应能适用集中化、大作业量模式,支持集群式复合作业流程。
利用高速扫描仪发挥批作业的效率,高效地提取文档数据,对扫描部分详细编目。
借助高容量光学存储介质,结合先进的图像处理(扫描、图像压缩算法、转换等)技术,实现大容量图像档案的存储。
4、系统性能要4.1系统的执行效率在系统整体结构上采用分布式结构,在档案整理、扫描、人工审核、质量控制等各环节,通过控制中心合理动态分配工作,从而提高系统整体效率和处理能力。
对于图像处理来讲,规范操作过程是提高质量及效率的首要条件。
因此,在各个环节中应充分考虑系统的处理速度和执行效率。
4.2系统的兼容性采用将整个业务流程分步骤处理并通过控制中心控制数据流的方式,使整个系统能够在一定程度上适应不同的业务需求,在针对具体业务进行修改的过程中保持系统体系结构的稳定。
同时,还要考虑与其他地区和行业的业务兼容性问题,为今后业务的发展奠定基础。
4.3系统的安全性针对该系统,主要从以下几个方面来保证在该系统中流转的电子档案的安全性和原始性。
4.3.1用户权限控制系统需要有分级的权限设置,保证通过身份验证机制有效地杜绝非法访问。
在该系统中,设置以下几种用户权限:扫描加工权限:相应的人员可以对档案进行扫描加工、质量检查、建索6引;数据修改及图像编辑权限:有这种权限的人员,对扫描好的电子影像资料进行编辑;查询权限:查询权限按实际情况进行设置。
对各类用户群体操作权限上存在不同,则在对档案的查询权限上就要有所体现。
对应于实际工作中分工不同的用户,对应不同的权限。
保证某人有明确的分工以及赋予他对应的权限,保证了工作流的顺畅性和稳定性。
4.3.2备份机制定期对新扫描的档案资料做光盘、磁带备份,为保证系统数据安全。
备份的理由:由于存储的数字化影像需要很大的硬盘空间,为了保证工作流能长久的快速有效运作,将记录定期的进行备份。
备份的同时,删除硬盘上的记录。
这样做一方面使得保存的记录方便调阅,一方面使得硬盘空间能保持足够工作的大小。
系统中,可以选择SAN的存储设备作为大容量的存储设备。
4.3.3数据存储的安全性主要体现在数据查询过程中的身份验证。
防止非法用户通过其他手段访问数据库或浏览图像。
4.3.4索引和存储对数字化文档建索引,其中,索引的两个重要关键字:档案产生时间及档案对应的类别档案的分类等有关标准和规范密级评定及日后的密级调整,涉及一些被查看限制的档案。
存储过程中,按照文件级—>专题级—>全文进行存储。
4.3.5系统的稳定性软硬件系统配合要合理,硬件上采用高性能的处理机,操作系统采用高效稳定的设置。
档案馆信息化工程是一个需要高速度、高智能化、高准确性的应用软件系统,可根据研究、开发、测试情况不断改进完善本方案。
74.4系统结构图说明数据库数字档案馆工程建议使用ORACLE或DB2数据库。
服务器为节约系统使用的网络带宽,保证系统工作流畅、稳定,提供的影像管理系统使用二台服务器,即数据库服务器和影像服务器。
数据库服务器接受基本档案资料的查询请求。
若有关于图像的查询请求,系统自动把图像查询目标定位到影像服务器,由影像服务器负责响应查询终端的图像查询请求。
5、工作流程设计索引建立IIS服务器查询工作站影像服务器存储设备6、工作流程说明6.1档案整理检查档案资料是否存在差错,资料是否齐全。
档案资料的准备在扫描作业中是很重要的工作。
它需要将档案资料进行整理,以方便快速连续扫描及建档作业,资料破损亦需事先修补。