1.1 档案业务综合管理系统设计1.1.1 系统设计原则XX市数字档案馆系统是一个综合的、可扩展的网络应用系统,其功能涵盖了档案的数字化加工和数字档案信息的采集、处理、存储、组织、发布、利用以及系统管理全过程,为了实现项目建设目标,我们确定如下总体设计原则:1.1.2 应用系统说明应用系统名称应用说明档案资源采集系统实现档案数据著录、上报数据接收、历史数据导入、数字化成果接收等多种方式收集档案信息资源,对不同来源的档案资源进行采集和整理,充实和扩大档案核心资源数据库。
建立起包括文书、科技、照片、声像等传统档案和人物、婚姻等专题档案以及政府公开信息、现行文件、各类资料在内的目录数据库和电子文件数据库。
并对采集数据进行初步规范化处理。
档案资源管理系统实现对实体档案文件、电子档案文件、资料及现行文件等的标准化、规范化管理,提高档案馆馆藏数据的质量和管理工作效率,保证档案的安全和电子文件的真实、完整和有效。
通过档案整理、保管、鉴定等实现档案的永久保存。
档案资源利用系统实现对档案馆藏数据的利用管理,为档案管理人员和社会公众提供多样化的检索功能和利用功能,利用范围包括电子档案信息和1.1.3 档案资源采集系统1.1.3.1 功能模块划分1.1.3.2 基本功能概述1.1.3.3 详细功能描述1.1.3.3.1 档案著录档案著录主要实现对各门类档案数据的著录功能,包括档案目录著录以及实体档案的数字化加工及文件挂接等。
1.1.3.3.1.1数据著录系统提供档案目录普通界面著录、网格录入等手工著录模式。
普通界面著录允许档案管理员通过系统维护管理功能进行各个类别档案著录界面自定义,包括设定著录字段的位置、长度、默认值、字体大小、标签颜色等内容。
档案著录界面提供保存、新增、复制、上一条、下一条、首条、末条、数据关联、文件挂接及数字化扫描等功能。
数据著录完毕点击保存,系统可自动根据档案著录规则对著录元数据进行判断,如果不符合要求,系统将立即给出提示并定位错误位置,提示用户修改。
对于符合规则的档案数据条目将直接保存入库。
网格录入方式是类似Excel方式的档案目录数据快速著录模式,系统提供著录字段选择、单行复制、多行复制、自动携带复制、多行携带复制、自动保存等功能。
网格著录界面提供排序、检索、批量修改、批量替换等著录辅助管理功能。
1.1.3.3.1.2数字化采集系统提供数字文件上传和数字化采集控件两种数字化采集方式。
用户第一次使用数字化扫描加工控件需要进行安装。
该数字化控件提供在线数字化加工功能,实现对纸质文件及图像文件的数字化扫描及图像处理。
控件自动调用客户端扫描设备驱动程序,用户可以从本地服务器进行文件或图片扫描或者从本地服务器选择需挂接文件,完成文本或图像处理、文件编排、文件类型选择、文件重名命名及格式转化等操作后,数字化成果直接同档案目录进行上传挂接。
控件提供抠图、抖动、勾边、纠偏、去污点、任意角度旋转、图片截取、图像自动压缩、格式转换、图像拼接等图像格式处理操作。
控件支持将多份TIFF扫描文件拼接成为一份PDF文件进行挂接。
系统通过数字化文件上传可挂接经音视频采集、音视频转换、DVD光盘处理等数字化加工产生的各种数字化成果。
系统支持多种多媒体方式的数字化加工,具备强大的兼容性和可扩展性。
系统支持将WORD、JPEG、TIFF等各式的文本或图像文件转换成标准PDF文件,音频等转换为AVI格式,视频转换为WMV等。
1.1.3.3.1.3双机校对双机校对是提高档案著录准确性的一个重要检验步骤。
双机校对在系统后台自行完成。
双机校对提供对已著录档案目录(至少两个用户对相同档案目录分别进行著录)元数据的匹配验证。
对验证通过的档案目录系统自动转入数据管理模块,未通过验证的数据条目系统自动抛出并进行特殊颜色标注,需相关著录人员检查后进行修改并保存,供系统第二次进行匹配验证,以此类推。
双机校对的校对过程可由系统自行设定校对时间及用户点击校对按钮完成两种方式。
双机校对规则需用户通过校对参数模块进行设置。
1.1.3.3.1.4格式转换在档案管理中,文本、图像、音频及视频等需要转换成统一的管理格式。
格式转换提供上述四类电子文件向标准格式的转换。
系统通过文件后缀名判断电子文件类型,自动完成各类文件向对应类型的标准格式转换。
转换过程可由用户进行单份文件转换,批量转换以后系统后台自动转换。
扫描型文本文件及图像可以转换成PDF标准格式,可转换的格式包括TIFF、WORD、JPEG等;音频向AVI格式的转换,可转换格式包括MP3、WAVE等;视频向WMV格式的转换,可转换格式包括MPEG等。
1.1.3.3.1.5回收站当用户从系统中删除一些档案目录数据或文件数据时,系统并没有将这些数据直接清除,而是将这些信息放入回收站。
当用户发现误删除一些数据时,可以在回收站中找到相应的数据,点击“还原”按钮,系统自动将数据还原到原来的数据存放地。
回收站根据删除数据的性质分为档案目录信息回收站和文件信息回收站,分别存放从系统中删除的档案目录信息和文件信息。
1.1.3.3.2 档案接收1.1.3.3.2.1数据接收数据接收是接收来自部署在党政信息网上的“虚拟档案室”系统或者其他途径提交上来的各类档案数据。
数据接收首先要进行接收数据登记,登记信息包括报送单位信息、报送目录及文件数量、报送时间及报送人等信息。
系统将报送上来的数据进行接收后,数据将进入临时接收库,以便档案管理员进行数据审核,审核通过数据将进入档案资源正式库。
对于不符合要求的报送数据,档案管理员将进行数据退回操作,并填写退回意见等。
数据可接收的电子文件格式包括XML、TXT、DOC、WPS、PDF、CEB 等文本格式,TIFF、JPEG、DJVU等扫描图像文件格式,MP3、AVI、WAVE 等音频文件格式,MPEG、ASF、WMV、RM、RMVB等视频文件格式。
1.1.3.3.2.2数据导入系统提供对馆藏历史档案的导入,数据导入过程中,系统自动对电子目录数据及原始文件数据进行“三性”验证。
系统支持XML、XLS、DBF等多种格式的档案目录及文件导入。
1.1.3.3.2.3OCR识别OCR识别是针对扫描型文本的文字识别,识别结果将有助于扫描电子文件的利用。
OCR识别同系统进行集成,在后台进行识别处理。
系统提供单份扫描文件OCR识别、批量扫描文件OCR识别以及后台自动对符合要求的文件进行OCR识别。
系统集成[北京]清华文通OCR汉字识别产品(SDK开发包),可识别文件格式包括JPEG、TIFF、PDF、PNG等。
1.1.3.3.2.4格式转换在档案管理中,文本、图像、音频及视频等需要转换成统一的管理格式。
格式转换提供上述四类电子文件向标准格式的转换。
系统通过文件后缀名判断电子文件类型,自动完成各类文件向对应类型的标准格式转换。
转换过程可由用户进行单份文件转换,批量转换以后系统后台自动转换。
扫描型文本文件及图像可以转换成PDF标准格式,可转换的格式包括TIFF、WORD、JPEG等;音频向AVI格式的转换,可转换格式包括MP3、WAVE等;视频向WMV格式的转换,可转换格式包括MPEG等。
1.1.3.3.2.5数据检查提供系统数据接收以及收据导入是的数据完整性、规范性的检查工作。
数据检查标准参照国家及浙江省相关档案目录著录标准。
数据检查主要包括档案目录元数据字段类型检查、元数据字段长度检查、元数据置空检查、元数据内容检查、档号格式检查等。
对需要进行检验的元数据字段可通过系统后台档案库数据表结构定义以及档号自定义进行设置,可设置字段长度、类型、档号规则等。
数据手工检查还包括对全文数据能够核对图像的质量、图像与目录的挂接是否准确、条目数据是否符合著录格式等的检验。
1.1.3.3.2.6验收报告打印打印验收报告是对从虚拟档案室或其他途径接收进馆的数据进行检验的检验成果报告。
验收报告模板可由用户通过系统后台进行自定义。
1.1.3.3.2.7目录关联目录关联提供文书档案、科技档案等存在案卷目录及卷内文件目录划分的档案数据关联。
系统提供目录关联按钮,选择目录关联查看状态后,通过点击案卷目录,系统可自动显示该目录对应的卷内文件目录。
目录关联规则可通过系统后台进行自定义。
1.1.3.3.3 档案征集档案征集是指档案馆向社会征收、购置或接收公共赠送的档案资料或向社会提供个人、家庭等重要资料的档案的寄存灯管理功能。
1.1.3.3.3.1档案征购用于管理市档案馆从社会上征集或者购买来的档案资料信息,包括实体档案、电子影音等。
档案征购提供对征购档案数据的登记、著录、数字化处理、分类、移交等功能。
针对档案征购类别库结构的设计可通过系统后台进行管理。
1.1.3.3.3.2档案馈赠用于管理社会向市档案馆赠送的实体档案、电子影音文件等。
其管理模式雷同档案征购。
1.1.3.3.3.3档案寄存档案寄存用于管理社会人士借助档案馆专业管理能力对私人拥有档案的信息管理。
档案寄存将在档案资源管理系统代保管业务管理部分进行详细功能说明,在本系统中,档案寄存类送档案征购。
1.1.3.3.3.4数据管理数据管理针对档案征购、馈赠、寄存等的存储数据信息进行管理,主要功能包括增加、修改、删除、批量修改、批量替换、复合检索、文件管理、目录关联、报表打印等。
1.1.3.3.3.5统计分析统计分析提供档案征集模块相关数量、时间等的统计功能,并可打印数量统计报表。
1.1.3.3.4 文件采集1.1.3.3.4.1在线扫描在线扫描是通过数字化加工控件进行文本实体或图像实体的扫描加工。
扫描空间可自动调用客户端扫描设备驱动程序,用户可以从本地服务器进行文件或图片扫描或者从本地服务器选择需挂接文件,完成文本或图像处理、文件编排、文件类型选择、文件重名命名及格式转化等操作后,数字化成果直接同档案目录进行上传挂接。
1.1.3.3.4.2图像处理系统数字化加工控件对扫描文件提供图像再处理功能,包括抠图、抖动、勾边、纠偏、去污点、任意角度旋转、图片截取、图像自动压缩、格式转换、图像拼接等图像格式处理操作。
1.1.3.3.4.3格式转换格式转换提供文本向标准格式转换、音频向标准格式转换和视频向标准格市转换功能。
具体请参考4.1.3.3.1.4章节内容。
1.1.3.3.4.4OCR识别OCR识别提供扫描型图像文件的文字识别功能,OCR识别结果将提供档案利用之用。
具体请参考4.1.3.3.2.3章节内容。
1.1.3.3.4.5批量处理包括对档案目录相关元数据的批量处理以及电子文件的批量处理功能。
档案目录元数据的批量处理主要包括批量修改、批量替换、批量删除、批量转移等。
电子文件的批量处理包括批量格式转换、批量OCR识别等。
批量操作可由管理员通过手工选取操作数据范围进行批量操作,也可由系统对符合条件数据进行批量操作,由系统自动完成。