当前位置:文档之家› 4电子文件通用元数据规范

4电子文件通用元数据规范

电子文件元数据标准(征求意见稿)1.范围本标准适用于各级机关、团体、企事业单位、社会组织。

本标准规定了电子文件元数据的结构、定义、编码体系。

本标准描述的数字对象为通用的电子文件核心元数据,主要为原生电子文件与数字化文件(文本、图像)元数据。

根据发展需要,扩展编制图形、影像、声音等文件类型的元数据标准。

2.编制目的2.1 对文件及相关实体进行标准化描述;2.2 实现不同机构、不同系统之间文件及信息的互操作;2.3 为电子文件在不同时间、不同空间、不同应用软件中的再利用提供统一的元数据;2.4 为电子政务、办公自动化、电子文件中心、文档管理、档案管理等系统提供成熟的电子文件全过程管理的设计模式。

3.规范性引用文件下列文件中的条款,通过本标准的引用而成为本标准的条款。

凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。

凡是不注日期的引用文件,其最新版本适用于本标准。

GB/T 2659-2000 世界各国和地区名称代码GB/T 2260-2002 中华人民共和国行政区划代码GB/T 11714-1997 全国组织机构代码编制规则GB/T 9704-1999 国家行政机关代码编制规则GB 2312-1980 信息交换用汉字编码字符集基本集GB/T 4880-1991 语种名称代码GB/T 4880.2-2000 语种名称代码第2部分:3字母代码GB/T 4881-1985 中国语种代码GB/T 3792.1-1983 文献著录总则GB/T 13959-1992 文件格式与代码编制方法GB/T 15418-1994 档案分类标引规则GB/T 3760-1995 文献叙词标引规则GB/T 9704-1999 国家行政机关公文格式GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充GB/T 18894-2002 电子文件归档与管理规范GB/T 7156-2003 文献保密等级代码GB/T 19667 基于XML电子公文格式规范DA/T12-1994 全宗卷规范DA/T13-1994 档号编制规则DA/T18-1999 档案著录规则DA/T 19-1999 档案主题标引规则DA/T 22-2000 归档文件整理规则DA/T 1-2000 档案工作基本术语中办发[1996]14号中国共产党机关公文处理条例国发﹝2000﹞23号关于发布《国家行政机关公文处理办法》的通知国档发[1987]4号关于颁发《编制全国档案馆名称代码实施细则》的通知ISO15489 信息与文件—文件管理ISO23081-1 信息与文献—文件管理流程—文件元数据-总则ISO23081-2 信息与文献—文件管理流程—文件元数据-概念与实施问题ISO14721 空间数据和传输系统—开放档案信息系统—参考模型ISO11179 信息技术--元数据元素的规范与标准化ISAD(G)档案著录规则(总则)W3C Namespaces in XML XML的命名空间(Namespaces)4.术语与定义下列术语和定义适用于本标准。

4.1通用术语4.1.1业务系统Business system将硬件、软件、信息或服务、政策、程序、人有机地组合在一起,实现对机构业务信息的保存、整理和提供。

如:电子政务系统、办公自动化系统等。

4.1.2电子文件管理系统 Electronic Records Manage System (ERMS)为了满足业务对电子文件管理需要而设计的系统,用以捕获、保存、提供获取业务处理过程中产生的有证据价值的文件的功能。

电子文件管理系统包括:档案工作者和文件使用者;授权政策、责任分配、权力授予、程序和做法;政策声明、程序手册、用户指南和其他用以批准和颁布政策的文件、程序和做法;文件本身;控制和记录的专门资料和文件系统;软件、硬件、其它设备、必要工具等。

4.1.3实体Entity指过去、现在和将来存在的任何具体或抽象的事物以及它们之间的联系。

比如:人、物体、事件、想法、过程等等。

4.1.4文件实体Record entity在处理公务或事务过程中,由团体或个人形成或接收和保存的任何形式或载体的记录信息。

可以是单份文件,也可以是文件的集合。

4.1.5责任者实体Agent entity对文件的信息内容负有责任的个人或团体。

4.1.6业务实体Business entity指业务过程中对文件进行处理与管理的一系列活动。

4.1.7关系实体Relationship entity描述文件、责任者、业务等实体自身、相互关系及这种关系的背景信息实体。

4.1.8电子文件元数据Electronic Records Metadata描述电子文件内容、背景和结构信息及整个管理流程的数据。

4.1.9元数据集Metadata schema规定和描述标准元数据集元素以及元素间相互关系的框架。

语句集为元数据元素提供正式的结构(句法)和语义(定义)。

4.1.10元数据结构Metadata structures元数据集由一系列的元素组成,元素之间的相互关系形成了元数据的结构。

元数据结构体现元数据扩展的方法与机制。

元数据抽象模型的建立对其元素的扩展与整个元数据方案的规范具有参考作用。

4.1.11元数据语义Metadata Semantic元数据的本质是描述对象的各种属性及相关关系等内容,每一个元素的语义明确定义了其含义、内涵与外延。

语义定义是一个元数据规范的基本要素,也是元数据应用与元数据互操作的最重要的基础。

4.1.12元数据句法Metadata syntax句法的问题即是一个形式化描述的问题,元数据集所有语义与结构及描述的内容以计算机可读或人可读的形式化方法描述出来。

从标准、开放、互操作角度,采用标识语言对元数据集进行描述。

本标准采用XML语言对元数据集进行描述。

4.1.13编码体系 Encoding Scheme编码体系有助于对元素修饰词值的理解。

这类体系包括控制词表及正规的符号或解读方式。

值的表示采用来自控制词表的标记符号(如分类体系或主题词表的术语)或者具有特定含义,或以一定形式组成的字符串。

4.1.14信息总体 Information Package电子文件与其元数据可以分开保存,也可以被封装在一起保存,后者称为电子文件信息总体。

封装是指创建的一个由电子文件及其元数据组成的自我包含的实体。

信息总体便于对电子文件的独立理解,支持并长期保证电子文件的真实性、可靠性和完整性,同时提供电子文件与其形成背景之间的可靠而有意义的逻辑联系。

电子文件封装入信息总体,该文件可以存在于任何存储或操作环境中,因其包含了嵌入其中的有关开始和过程的所有细节,包括那些用于存取、传递和表述文件的细节。

信息总体需要将元数据捕获的多个点包含进文件,因为文件的处理历史像其最初的捕获元数据一样至关重要。

本标准采用ISO14721《信息技术--元数据元素的规范与标准化》定义的封装技术,定义了信息总体的封装格式,包含维护真实性的技术机制。

信息总体封装格式(E ncapsulating Format for I nformation P ackage - EIP)见附录B。

.4.1.15信息总体固化 Fixity of Information Package电子文件元数据与其文件一样,需要受真实性规则、规范或标准的控制,以保证电子文件具有可信性,这种控制称为元数据固化。

本标准采用数字签名技术来进行信息总体的固化。

4.2数据模型概念4.2.1属性Attribute物体或实体的特征。

4.2.2类别Class:对具有相同属性,操作,方法,关系和语义的对象集的描述。

4.2.3概念数据模型/概念模型Conceptual data model/conceptual model通过数据模型对现实世界进行抽象地表达。

5.总则电子文件形成、捕获、登记、分类、存储和保管、利用、跟踪、处置、传输、归档移交及长期保存等过程中都需记录在元数据中,并应保持连续、一致,以确保电子文件的真实性、完整性与有效性。

为实现电子文件全过程管理与监控,电子文件及其元数据与结构稳定、定义良好的元数据标准相一致,特制定本标准。

本标准的制定遵循国际文件管理的系列标准规范: 按ISO15489《信息与文件—文件管理》规定的文件管理过程要求定义电子文件管理元数据,采用ISO/TS 23081《信息与文献—文件管理流程—文件元数据》定义的电子文件管理元数据概念模型、实体及关系模型;采用ISO14721《空间数据和传输系统—开放档案信息系统—参考模型》定义的信息包(SIP、AIP及DIP)数据模型,实现电子文件内容、背景、结构信息的封装,以确保在分散与集中管理过程中电子文件的真实性、完整性、有效性,确保电子文件在不同应用系统间的安全传输;采用ISO14721定义的数字信息长期保存模型,实现电子文件的长期保存与利用。

本标准支持元数据值的再利用、元数据元素的互操作及可扩展性和模块化。

元数据来源于机构文件处理方案、主题词表或关键词表、编码方案、电子政务系统、办公自动化系统、电子文件管理系统、档案管理系统、E-mail系统、网站。

6.元数据概念模型文件管理业务系统的各个流程,需要通过元数据实现对文件或档案的管理。

元数据最主要的用途之一是用来描述业务系统中实体。

关键实体如下:文件实体:文件本身,不管是单份文件还是文件集合体;责任者实体:业务环境中的人或组织结构;业务实体:业务办理。

根据元数据类型,可将元数据分为下列几类:关于文件自身的元数据、关于责任者的元数据、关于业务工作或过程的元数据、关于业务规章制度、政策以及法规的元数据、关于文件管理过程的元数据。

图1 主要实体及其相互关系电子文件元数据模型的建立是以文件连续体理论为基础的。

文件实体、责任者实体和业务活动实体,是用元数据帮助确保文件真实性、完整性和有效性,实施档案化管理必须充分关注的要素。

文件作为交流、传递、贮存、利用信息的工具,其生成、处理、运转必然与文件责任者处理某项事务相关。

对该事务的办理,形成文件的业务活动,构成了文件的来源..。

这种业务活动构成了文件的背景。

责任者作为文件的形成和处理者,为业务活动或事务处理活动的实施者。

作为业务活动的主体,责任者与业务活动的推进息息相关,人们的业务活动自身也是划分为一定层次并且与相关文件群体(文件集合)的层次相对应。

从微观到宏观区分为以下层次:1)事务处理:即处理每一件具体事务的业务活动,在这种业务活动中形成的文件一般情况下可以构成一个文件组合(案卷)。

2)业务活动:即处理某种类型事务而进行的职能活动,有可能是由某个机构的一个职能部门进行;也可能该职能活动属于某个相对独立的业务活动项目,是其中的一个子项目。

相关主题