当前位置:
文档之家› 元数据与科学数据信息的组织及管理
元数据与科学数据信息的组织及管理
2.3 完整性报告
2.4 位置精确性(横向位置精 确性报告、纵向位置精确性报 告)
2.5 数据获取方法及有关文献 (方法、来源、过程步骤)
科学数据信息元数据的标准 (6)
实体和特性信息 (Entity and attribute information)
5.1 详细描述(特性名称、定义、 定义来源,特性允许值范围、特性 允许值的起始日期和终止日期、特 性值的精确性信息)
• 用于组织这些数据的概念及相关关系复 杂性增加
• 从这些数据库中抽取知识无异于一个巨 大的挑战,必须动用最强的系统来应付 这样的挑战
本资料来源
背景(2)
• 数字化图书馆、数据网格(data grids), 及永久 性档案一体化的发展
– 国会图书馆国家数字化信息基础和保护计划(Library of Congress National Digital Information Infrastructure and Preservation Program)
科学数据信息元数据的标准 (3)
标识 (Identification) 类下的主要子类:
1.1 引用文献信息 1.2 描述(文摘、目的、补充信息) 1.3 内容所涉及的时间 1.4 状态(进展、维护及更新 1.5 空间地理数据 1.6 关键词(主题、地点、层次、时间) 1.7 检索限制 1.8 使用限制 1.9 联系信息 1.10 图片浏览 1.11 数据集制作单位或人员 1.12 安全信息 1.13 原始数据集环境 1.14 交叉参照 1.15 分析工具(分析工具描述、工具检索信
美联邦科学联盟元数据通道(1)该集元结数了据各整个合学中科心领
域的数据库,用户 发一个检索指令, 可以同时检索分布 于全美国的科学数 据信息
美联邦科学联盟元数据通道(2)
检索过程的界面:
美联邦科学联盟的信息资源
• 最主要的特点是信息的来源和权威性
– 所收集的信息是有各部门的信息管理人员或图 书馆员选取,而不是像商业网站的自动收集
expressions • 结构、物理、计算模型 Structural, physical and computational
models • 表格、图形、图表、地图、图片 Tables, graphs, charts, maps and
images • 实地与试验笔记 Field and laboratory notebooks • 图书及其它学术文献 Monographs and other scholarly documents • 述评 Critical reviews and discourse • 实用分类系统 Ontologies • 学术文献参考目录 Bibliographic references to scholarly literature
2004年数字图书馆前沿问题研讨班
元数据与科学数据信息的组织 和管理
提要
• 科学数据信息资源的范围 • 美国政府和民间利用元数据管理利用科学数据信
息的做法 • 科学数据信息元数据的标准 • 下一步的计划
背景 (1)
• 伴随计算技术的发展产生了大量的科学 观察和模拟数据
• 专门学科领域的数据量以tens of terabytes 计, 许多学科正在计划建造更 大的数据库
服务的方法
美国政府和民间利用元数据 管理利用科学数据信息的做法 (2)
美联邦科学联盟成员
• 农业部 • 商业部 • 国防部 • 教育部 • 能源部
• 公共卫生部 • 内务部 • 环境保护局 • 国家航空航天部 • 国家科学基金会
由CENDI支持协调
目标
• 为从事科学工作的公民,包括专业科学人 员、学生、教师、工商业人士、及任何对 科学有兴趣的公众,提供跨部门的检索通 道来查找和使用经过选取的权威性的美国 政府有关科学技术的信息资源。
息、工具联系信息、工具有关文献)
科学数据信息元数据的标准 (4)
主题
层次
关键词是标识
类的一个子类,
共分主题、地
地点
点、层次、时 间四大块。
时间
科学数据信息元数据的标准 (5)
数据质量信息 (Data quality)
2.1 特性准确性(特性准确性报 告、计量特性准确性评估)
2.2 逻辑一致性报告
– 信息内容都产生于政府资助的研究开发项目或 类似的有美国政府投入的活动
– 各部门负责对联邦科学联盟中属于本部门的信 息内容进行更新
科学数据信息元数据的标准 (1)
科学数据信息元数据的标准 (2)
• Biological Data Profile
– 所有元素分成七大类:
– 标识 (Identification) – 数据质量 (Data quality) – 空间数据组织 (Spatial data organization) – 空间参照 (Spatial reference) – 实体和特性信息 (Entity and attribute information) – 发行 (Distribution) – 元数据参考信息(Metadata reference)
– 国家档案纪录管理局以数据格为基础的永久性档案样 品
– 利用数据网格建立国家科学基金会科学数字化图书馆 – 知识之间相互关系的产生、管理、及检索是信息技术
面临的主要挑战
Next
本资料来源
The BIRNHale Waihona Puke data gridBack
科学数据信息资源的范围
• 观察模拟数据 Observation and simulation data • 分类术语表 Taxonomies • 数学表达式 Mathematical expressions • 分子、化学、基因表达式 Molecular, chemical, and genomic
美国政府和民间利用元数据 管理利用科学数据信息的做法 (1)
• 酝酿 ( 1992-1994):
– 政府机构牵头制定标准
• 开发(1995-1998):
– 研究实施对策 – 将标准草案推出,发动公众对标准草案提修改意见 – 标准定稿,编制标准使用指南
• 整合服务(1999-现在)
– 通过建立元数据通道,整合分散的科学数据信息 – 利用新的信息技术研究深层次组织科学数据信息提供