电子文件归档与整理•第一讲概念和种类•一、什么叫电子文件•电子文件是指在数字设备及环境中生成、以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上传递的文件。
•电子文件的基本特征:•第一,电子文件是由电子计算机生成和处理,其信息以二进制数字代码记录和表示,因此亦可称为“数字文件”。
这是电子文件与以往所有其他形式文件的基本区别,也是电子文件信息与其他数字信息的共同点。
数字信息使用0和1两种数码的组合来记录信息,每一个0或1叫做一个比特,需要记录的信息用一串比特存储于计算机存储器(包括内存储器和各种外存储器)中,并可通过通信网络进行传输。
•第二,电子文件是文件的一种类型,应该具有文件的各种属性,特别是要有特定的用途和效力。
这是电子文件与其他数字信息的基本区别,也是电子文件与其他形式文件的共同点。
•二、电子文件的种类•电子文件的种类有不同的划分标准,目前主要有以下几种划分方法:•(一)按电子文件的信息存在形式分类•1、文本文件(Text),或称为字(表)处理文件:指使用文字处理软件生成的,由字、词、数字或符号表达的文件。
••2、数据文件(Data),亦称为数据库电子文件:指在事务处理系统中单独承担文件职责,或者作为文件的重要组成部分出现的数据库对象,或者以数据库形式存在具有文件属性的记录。
•3、图形文件(Graphic):指根据一定算法绘制的图表、曲线图,包括几何图形和把物理量如应力、强度等用图标表示的图形等等。
••4、图像文件(lmage):指使用数字设备采集或制作的画面,如用扫描仪扫描的各种原件画面,用数码相机拍摄的照片等。
•5、影像文件(Video):指使用视频捕获设备录入的数字影像或使用动画软件生成的二维、三维动画等各种动态画面。
•6、声音文件(Audio):指用音频设备录入或用编曲软件生成的文件。
•7、命令文件,亦称计算机程序(Program):指为处理各种事务用计算机语言编写的程序,是一种计算机软件。
••(二)按文件的功能分类•分为主文件和支持文件、辅助性、工具性文件。
主文件是指表达作者意图、行使职能的文件。
支持文件主要指生成和运行文件的软件,辅助性、工具性文件主要是指在制作、查找主文件过程中起辅助、工具作用的文件。
••7、命令文件,亦称计算机程序(Program):指为处理各种事务用计算机语言编写的程序,是一种计算机软件。
••(二)按文件的功能分类•分为主文件和支持文件、辅助性、工具性文件。
主文件是指表达作者意图、行使职能的文件。
支持文件主要指生成和运行文件的软件,辅助性、工具性文件主要是指在制作、查找主文件过程中起辅助、工具作用的文件。
••主文件和支持性、辅助性、工具性文件是相互作用,相辅相成的。
没有主文件,支持性、辅助性、工具性文件不能独立地行使文件的职能,没有支持性、辅助性、工具性文件,主文件可能无法正常运行和查找。
•(三)按文件的生成方式分类•分成计算机系统中直接生成的原始文件和将纸质或其他载体(如胶片)文件重新录入生成的转换文件。
••第二讲电子文件的特点••一、电子文件的数字化信息形态•电子文件是在电子计算机中产生和处理,其信息形态是数字化的。
在电子计算机内部,无论是传输还是存储等处理,电子文件均以数字编码的形式存在。
•二、电子文件对设备及标准的依赖性•电子文件对设备依赖性,从以下几个方面体现:一是数字编码,二是硬件,三是软件,四是技术设备更新,五是加密。
•三、电子文件载体的非直读性•电子文件的非直读性体现在很多方面:一是数字编码记录于载体上;人的眼睛无法分辨,何况磁性载体上的“磁畴”极性是物质内部的物理性质,根本不可能看到;二是载体上的信息记录密度极大;三是载体上的数字信息往往进行过压缩编码、加密等处理,即使有设备,如果不解压或解密也不能读取其内容。
•四、电子文件的物理结构与逻辑结构关系的复杂性及对元数据的依赖性•电子文件的物理结构是指其存储在载体上的位置及分布情况。
信息的逻辑结构是指其自身的结构。
电子文件物理结构和逻辑结构往往是不一致的。
同一个电子文件的正文、图形、批示、附件等可以不在载体上连续存放,甚至可以存放在不同的载体上,而不影响其正常的显示输出。
•元数据则是电子档案的技术数据,电子文件的元数据必须特意附在文件信息中,否则将无法恢复电子文件的原貌。
电子文件的动作往往是在网络上进行的,操作者互不见面,体现行政背景的元数据就不那么完整、详细。
如果不特意提供或补充这种元数据,就可能给电子文件的动作和归档带来问题,这就是电子文件对元数据的依赖性。
•五、电子文件信息与载体相分离性•电子文件内容存放的位置不是固定的,而是可以变化,甚至可以从一个载体转换到另一个载体,其内容却不发生任何变化。
还可以通过网络传给远方的一个或多个接收者,在这些对保密有特殊要求的网络中,还采取把电子文件的内容分解后分别通过不同的路径传递,存放在不同地点不同设备的处理方式,只是在需要时才临时把文件的内容装配起来。
•六、电子文件的信息共享性及不安全性•电子文件可以做到用网络上的任何终端设备去读取存储在某一个设备上的电子文件。
另一方面,一个终端上的电子文件也可以同时发给若干个网络终端,就像发布文告一样。
电子文件由于不受物理载体传递的限制,所以对信息获得者来说,可以产生一种共享的感觉,从而摆脱了时间和空间的制约。
••随着网络化的发展,网络安全问题已日益突出。
•七、电子文件信息的易更改性•电子文件在起草阶段或做其他处理时的突出优点就是增、删、改很方便,改后又不留痕迹。
••第三讲电子文件的收集与积累••一、电子文件的管理现状•电子文件的完整保留、妥善保护等方面有以下一些问题:•第一,草稿性电子文件的“自生自灭”状态。
•第二,辅助性电子文件的无人管理的状态。
•第三,正式电子文件往往只进行了逻辑归档。
•第四,有些电子文件的存贮载体不安全。
•第五,电子文件生成的设备环境数据,缺少登记,一些相关软件参数也缺少妥善的保护措施。
•二、电子文件的收集•电子文件收集的内容:•1、归档电子文件:指具有参考和利用价值并作为档案保存的电子文件。
•2、背景信息:指描述生成电子文件的职能活动、电子文件的作用、办理过程、结果、上下文关系以及对其产生影响的历史环境等信息。
•3、元数据:指描述电子文件数据属性,包括文件的格式、编排结构、硬件和软件环境、文件处理软件、字处理和图形工具软件、字符集等数据。
•三、电子文件的积累工作•1、电子文件的积累过程和方法•电子文件的积累,可分为两种类型:一种是在电子计算机网络系统上,系统应设计自动记录的功能,可以记载电子文件的产生、修改、删除、责任者、入数据库时间等。
在进入数据库之前,通过对记有档案标识的内容进行鉴定、归档。
另一种是用载体传递的电子文件,要按规定进行登记、签署,对于更改处,要填写更改单,按更改审批手续进行,并存有备份件,防止出现差错。
•2、电子文件的积累范围•电子文件的收集、积累应包括以下两方面的内容:•(1)按归档要求应接收归档的电子文件。
•(2)对未列入应接收归档的电子文件,有的也要收集,因为有时需要对一些项目做补充归档或扩大归档。
•第四讲电子文件的归档工作••一、归档范围•(一)电子文件的归档范围应遵循的原则•一是按现行公文、科技等文件的有关归档范围执行;二要考虑电子文件的特殊性,根据电子文件的形成规律,尽量具体列出阶段的、系统的、权威的电子文件组合,保证电子文件的完整性;三是电子计算机的软硬件环境,表达电子文件内容的•基本格式及有关元数据等也必须列入归档范围。
•收集材料包括:•第一,归档文件的支持软件及软件的文档、表达电子文件内容的基本格式及有关坏分子数据。
•第二,纸质文件、缩微胶片。
•第三,电子文件管理的许多环节的成果和文件信息。
•(二)电子文件的归档范围主要包括•1、在行使本机构职能以及行政管理、业务管理活动中形成的各种文本文件;对需要保存草稿的文件,修改应在拷贝件上进行,加版本号积累,并将草稿、定稿一起归档。
•2、利用计算机辅助设计、辅助制造、检测、仿真实验等技术形成的具有查考利用价值的数据文件、图形文件、模型文件等。
•3、本机构制作的各种数据文件,如数据库、图形库、方法库等。
•4、对于软件生产商而言,在其研究开发活动中形成的程序文件。
•5、为保证电子文件的长期可读性而收集的各种支持软件,包括操作系统、应用软件,以及相关的数据、配套的文档资料。
••二、不归档范围•不归档的电子文件包括:•(一)上级机关单位无保存价值不归档的电子文件•(二)本机关单位无保存价值不归档的电子文件•(三)同级机关单位和非隶属机关单位无保存价值不归档的电子文件•(四)下级机关单位发来无保存价值不归档的电子文件•三、双套归档制原则•我国规定在电子文件归档的同时,应归档相同的纸质文件,这就是“双套归档制”。
•在条件许可下,可以单独归档电子文件而不予或无法归档纸质文件的有:••通过局域网传递的上级来文;•在纸质条件下不予归档的微观文件;•已实现计算机辅助生产的CAD文件;•某些数据量大保存年限短的数据文件;•多媒体文件;•超文本文件。
•四、归档方式•电子文件的归档方式有两种:逻辑归档和物理归档。
•(一)逻辑归档•逻辑归档是指在计算机网络上进行,不改变原存储方式和位置而实现的电子文件向档案部门移交的过程。
•逻辑归档的电子文件控制方法:第一,把这些电子文件纳入机构的数据备份方案,永久保存的电子文件应有脱机保存的备份;第二,定期将有用的文件信息从网络上下载,进行物理归档,以减少网络的荷载,提高网络速度。
•(二)物理归档•物理归档是把计算机及其网络上的电子文件集中传输至独立的或可脱机保存的载体上,向档案部门移交的过程。
物理归档的方式又可分为以网络传输方式归档和以介质传递方式归档两种。
网络归档是指将归档电子文件通过网络直接传输到档案部门,或加工后传输到档案档案部门规定的地址中,并存储在档案部门本地载体的过程,也称在线式归档。
介质归档是指将电子文件存储在一定介质上移交给档案部门,也称卸载式归档。
••电子文件的归档时间分实时归档和定期归档两种。
实时归档指电子文件形成后即刻归档;定期归档是指按照机构有关规定,在电子文件形成一段时间之后再向档案部门移交。
双套归档的电子文件和纸质文件,归档时间应统一。
•电子文件的归档一般在年度或任务完成后,或一个阶段之后的一段时间内进行归档(称为阶段归档),一般以不超过2—3个月为宜。
•六、归档要求•1、“前端控制”的思想在归档阶段应得到充分体现•归档是档案部门正式接管电子文件管理工作的起点,但是档案部门对于电子文件管理工作的介入要向前延伸,从文件生命周期的“前端”就开始控制文件的归档活动。
防止失误,控制差错的最佳时机应放在所有可能出现失误和差错的环节之前,把保障电子文件安全、可靠、完整、可读的措施附加于文件形成过程中,可以有效地防止其他管理环节对电子文件的损伤和破坏。