大亚湾核电站电子文档元数据著录研究作者:廉旭姣来源:《办公室业务(上半月)》 2019年第12期文/生态环境部核与辐射安全中心廉旭姣【摘要】元数据在核电站电子文档管理中占据着重要地位,电子文档元数据描述了电子文档的内容、属性、背景和结构等信息,较全面地反映描述对象的全过程,便于电子文档的检索、存取、利用以及信息共享等。
大亚湾核电站电子文档的元数据,能够较好地解决电子文件的真实性、完整性和长期可用性,提升电子文档管理和开发利用的效率,是实现电子文档凭证价值和参考价值的重要工具。
【关键词】电子文档;元数据;著录大亚湾核电站的文档管理贯穿于核电生产活动中的各个方面,根据HAF040《核电厂质量保证安全规定》的要求,必须按照书面程序和指令建立和执行有关质量保证记录的产生、鉴别、收集、标引、立卷、存放和处理的制度,必须在质量保证大纲实施过程中编写质量保证记录,以证实核电厂已经按照特定要求完成影响质量的各项活动。
为此,大亚湾核电站制定出了严格的文档管理体系,具体的工作大致分为文档控制、文档管理和文档服务,从文件的产生、生效、分发、使用、记录报告的收集等各个环节进行了文件控制管理。
为了有效地运作文件管理体系,依据《核电电子文件元数据》NB/T20418-2017的要求,分析大亚湾核电站文档管理元数据著录的规范。
一、元数据标准体系元数据标准体系由元数据标准框架、根据元数据标准框架扩展出来的专门元数据标准以及对应的元数据标准管理系统和元数据著录系统构成。
其中,元数据标准框架又由核心元数据标准和它的扩展原则构成。
它们之间的相互关系如图所示。
二、元数据元素定义方法元数据表中各个元素都用13个属性进行描述:1.编号:按一定规则排列的元数据的顺序号。
2.中文名称:元数据元素的中文标识。
3.英文名称:元数据元素的英文标识。
4.定义:元数据元素含义的描述。
元数据的一般定义是关于数据的数据(data?about?data)。
详细来讲,元数据是指提供关于信息资源或数据的一种结构化的数据,是对信息资源的结构化的描述。
其作用是描述信息资源或数据本身的特征和属性,规定数字化组织,具有定位、发现、证明、评估、选择等功能。
标识信息是指:根据文档的来源信息,为科学、有序地管理文件及档案而赋予文档的各种标识符。
内容信息是指:内容信息是描述、揭示与文档内容相关的内部与外部特征的信息,如题名、版本信息、语种、主题、内容描述。
结构信息是指描述文档的物理结构,如排列组合方式、文件构成方式、各构成部分之间的连接方式、相关文件之间的关系及在存储器中的构成等信息的元数据,包括文件集合类型、文件格式、文件大小等。
背景信息是指描述生成文档的职能活动、作用、办理过程、结果、上下文关系以及对其产生影响的历史环境等信息。
即文档在归档之前产生的各种信息。
背景元数据由文件的生成、流转、登记、分发、办理、关联信息、技术环境信息等构成。
管理信息是指记录文档所有管理操作活动的信息,包括鉴定信息、归档信息、权限管理、维护历史等信息。
1.目的:描述该元数据元素必要性和作用。
2.约束性:说明采用该元数据元素的强制性程度,分“必选”“条件选”和“可选”。
“必选”表示必须采用;“条件选”表示满足某一特定条件,则必须采用;“可选”指根据用户需要选用或不选用。
3.可重复性:元数据元素是否可以重复出现。
4.数据类型:为表达元数据元素值而规定的值集合的描述符。
本标准数据类型包括字符型、数值型、日期时间型。
容器型元素没有数据类型。
5.编码修饰体系:对该元数据元素信息的描述应遵循的编码规则。
6.值域:可以分配给元数据元素的值。
7.缺省值:该元数据元素的默认值。
8.信息来源:元数据元素值的来源。
9.注释:对元素的进一步说明或事例。
三、核电文档元数据集结构根据核电文件、档案的构成,及其生成、管理与利用等不同时期的特征,对核电文档元数据表进行了定义。
核电文档元数据子集分为:标识信息、内容信息、背景信息、管理信息。
每个元数据子集对应的元素和子元素,元数据属性中[M]表示必选,[O]表示可选,[C]表示条件选(满足条件时必选),[R]表示可重复(数据可多次输入,不覆盖)。
结构信息贯穿于标识信息、内容信息、背景信息、管理信息这些核电文档的元数据子集中,结构的形式根据具体要求可以是聚合层次,元数据的属性为[O],还可以文件组合类型,元数据的属性为[C]。
载体信息有载体规格(元数据的属性为[M])、计量单位(元数据的属性为[M])、介质(元数据的属性为[M])、载体数量(元数据的属性为[O])。
电子文件大小的元数据属性为[M],电子文件格式、电子文件类型的元数据属性为[M][R]。
(一)标识信息元数据子集。
1.档案标识:编号为M1。
档案标识元素对应的子元素为:(1)档案馆代号:编号为M1-1,元数据属性为[C]。
(2)档案馆名称:编号为M1-2.元数据属性为[C]。
(3)全宗号:编号为M1-3,元数据属性为[C]。
全宗号需要在系统里进行著录。
(4)全宗名称:编号为M1-4,元数据属性为[C],全宗名称需要进行著录标引。
(5)全宗形式:编号为M1-5,元数据属性为[C],全宗形式需要进行著录标引。
2.核电站标识:编号为M2。
核电站标识元素对应的子元素为:(1)核电站代号:编号为M2-1,元数据属性为[M][R],核电站代号需要进行著录标引。
(2)核电站名称:编号为M2-2,元数据属性为[M][R],核电站名称需要进行著录标引。
(3)反应堆类型:编号为M2-3,元数据属性为[O],根据核电厂具体采用的反应堆类型进行著录标引。
(4)机组号:编号为M2-4,元数据属性为[M]。
在业务上需要进行著录标引。
(5)机组功率:编号为M2-5,元数据属性为[O],根据核电厂机组的功率进行著录标引。
(6)核电基地名称:编号为M2-6,元数据属性为[O],根据核电厂基地进行著录标引。
3.文档标识:编号为M3。
文档标识元素对应的子元素为:档案编码(编号为M3-1)、文件编码(编号为M3-2)、文件编码说明(编号为M3-3)、文件原文编码(编号为M3-4)、接收渠道号(编号为M3-5)。
其中档案编码、文件编码的元数据属性[M],二者在业务上都需要档案和文件控制。
文件原文编码和接收渠道号的元数据属性都为[O],在业务上,文件原文编码进行著录标引,接收渠道号需要进行文件控制。
4.位置标识:编号为M4。
位置标识的子元素有存档位置(编号为M4-1)、存档号(编号为M4-2)、逻辑位置(编号为M4-3)、物理位置(编号为M4-4)、存储载体标识(编号为M4-5)、电子文件名(编号为M4-6),其中存档位置、存档号、存储载体标识的元数据属性为[M],在业务上需要库房管理。
(二)内容信息元数据子集。
1.题名:编号为M5。
提名标识的子元素有文件中文题名(编号为M5-1)、文件英文题名(编号为M5-2)、案卷中文标题(编号为M5-3)、案卷英文标题(编号为M5-4)、副标题及提名说明(编号为M5-5)。
文件中文题名和案卷中文标题的元素属性为[M],在业务上都需要文件控制或者是档案控制,文件英文题名、案卷英文标题、副标题及提名说明的元素属性为[O],文件英文题名和案卷英文标题在业务上需要档案控制,副标题及提名说明在业务上进行著录标引。
2.版本信息:编号为M6。
版本信息的子元素有稿本(编号为M6-1)、版本号(编号为M6-2)、版本日期(编号为M6-3)。
版本号和版本日期的元素属性为[M],在业务上进行文件控制。
稿本的元素属性为[O]。
3.主题:编号为M7。
主题的子元素有中文主题词(编号为M7-1)、英文主题词(编号为M7-2)、中文关键词(编号为M7-3)、英文关键词(编号为M7-4)、人名(编号为M7-5)、地名(编号为M7-6)、机构名(编号为M7-7)、系统代码(编号为M7-8)、厂房代码(编号为M7-9)、设备功能位置码(编号为M7-10)、设备类型代码(编号为M7-11)。
其中中文主题词、英文主题词、英文关键词、厂房代码、设备功能位置码、设备类型代码的元素属性为[O][R],在业务上根据核电厂的具体情况需要进行著录标引。
人名、地名、机构名的元素属性为[O],系统代码的元素属性为[O][R],中文关键词的元素属性为[M][R],在业务上进行著录标引。
4.内容:编号为M8。
内容的子元素有风险等级(编号为M8-1)、质量安全等级(编号为M8-2)、摘要(编号为M8-3)、覆盖范围(编号为M8-4)、附件(编号为M8-5)、卷内文件的起始日期(编号为M8-6)、卷内文件的终止日期(编号为M8-7)、图纸类别(编号为M8-8)、基准文件(编号为M8-9)、文件分类(编号为M8-10)、文件类型(编号为M8-11)、文件等级(编号为M8-12)、页数(编号为M8-13)、发文单位(编号为M8-14)、收文单位(编号为M8-15),其中风险等级、质量安全等级、摘要、覆盖范围、卷内文件的起始日期、卷内文件的终止日期、图纸类别、基准文件、文件分类、文件类型、发文单位、收文单位的元素属性为[O],在业务上根据核电厂的具体信息进行著录标引。
文件等级、页数的元素属性为[M],在业务上进行著录标引。
附件的元素属性为[O][R],根据核电厂的具体信息进行著录标引。
(三)背景信息元数据子集1.文件制作:编号为M9。
文件制作的子元素有编制单位(编号为M9-1)、编制者(编号为M9-2)、编制原因(编号为M9-3)、编制日期(编号为M9-4),编制单位、编制者、编制日期的元素属性为[M][R],在业务上进行著录标引。
编制原因的元素属性为[O][R],根据核电厂进行著录标引。
2.文件流转:编号为M10。
文件流转的子元素有校核者(编号为M10-1)、会签者(编号为M10-2)、会签日期(编号为M10-3)、校核日期(编号为M10-4)、审核者(编号为M10-5)、审核日期(编号为M10-6)、批准者(编号为M10-7)、批准日期(编号为M10-8)、批准者(编号为M10-9)、流转状态(编号为M10-10)、紧急程度(编号为M10-11)、接口状态(编号为M10-12)、文件审查结果(编号为M10-13)、母本文件移交时间(编号为M10-14)、签收人(编号为M10-15)、签收日期(编号为M10-16)。
校核者、会签者、会签日期、校核日期、审核者、审核日期、批准者、流转状态、签收人、签收日期的元素属性都为[O][R],紧急程度、接口状态、文件审查结果、母本文件移交时间的元素属性都为[O],批准者和批准日期的元素属性为[M][R],文件流转的子元素中,除了签收人和签收日期在运用中需要库房进行控制,其余的子元素在业务上需要文件控制。