医药卫生科学数据共享网
政策与法规系列文档
医药卫生科学数据共享网
建设概论
(征求意见稿)
(本稿完成日期:2008年5月)
医药卫生科学数据共享网管理运行机制课题组 MSDS/T ×××—2008
医药卫生科学数据共享网建设概论
第一章 范围与引用文件
第一条 范围
本系列文档适用于医药卫生科学数据共享网项目的建设、组织与管理工作。包括项目的组织方式、项目的运行与管理、项目的评价与监督、数据资源整合方法与步骤以及共享运行奖惩机制。
本系列文档同时适用于医药卫生科学数据共享网项目在后续年度申请国家科技基础条件平台建设的工作中,以新的项目名称所命名的共享网建设项目。
注:文中用“共享网”的简称来代替“医药卫生科学数据共享网”以及随后继续申请的项目名称,例如“人口与健康科学数据共享网”。
第二条 引用文件
下列文件中的条款通过本规定的应用而成为本规定的条款。凡是注明日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本规定。但鼓励根据本规定达成协议各方研究是否可使用这些文件的最新版本。凡是不注明日期的文件,其最新版本适用于本规定。
SDS/T 1003—2004 科学数据共享工程技术标准 科学数据共享工程概念与术语 第一部分:概念
SDS/T 1003.2—2004科学数据共享工程技术标准 科学数据共享工程概念与术语 第二部分:术语
SDS/T 2111—2004科学数据共享工程技术标准 元数据标准化原则与方法
SDS/T 2112—2004科学数据共享工程技术标准 科学数据共享元数据内容
SDS/T 2121—2004科学数据共享工程技术标准 数据分类与编码的基本原则与方法
SDS/T 2122—2004科学数据共享工程技术标准 科学数据共享工程分类编码方案
SDS/T 2131—2004科学数据共享工程技术标准 公用数据元目录
SDS/T 2132—2004科学数据共享工程技术标准 数据元标准化的原则与方法
SDS/T 2132—2004科学数据共享工程技术标准 数据模式描述规则与方法
MSDS/T S001—2006 医药卫生科学数据共享技术标准 数据集分类与编码方案
MSDS/T S002—2006医药卫生科学数据共享技术标准 数据集元数据标准
MSDS/T S003—2006医药卫生科学数据共享技术标准 数据元标准化原则与MSDS/T ×××—2008
方法
MSDS/T S003—2006医药卫生科学数据共享技术标准 数据模式描述规则
WS/T D003—2007卫生信息数据集分类与编码规则
第二章 共享网建设概念与术语
第三条 共享网建设相关概念
1.国家科学数据共享平台 National Scientific Data Shared Platform
国家科技基础条件平台的重要组成部分。由国家科技部牵头,依托国家相关部门、行业系统和科研教育系统等科学数据或信息管理机构,基于因特网等现代信息技术,最大限度地整合各类科学数据资源,形成科学数据共享网络服务体系,面向政府部门、科技教育界和社会各界提供科学数据服务的网络共享平台。
2.科学数据资源 Scientific Data Resources
特指以公益性和基础性为研究应用价值的数据资源,包括观测、监测、调查、试验、实验以及研究等科学技术研究活动过程中产生的原始性数据,以及按照不同科技活动需求进行系统加工整理的各类数据。
3.主体数据库Core database
依据国际标准、国家标准或行业标准分类体系构建的二级学科及其分支学科的科学数据集,并基于计算机系统运行的数据库。
4)数据集 DataSet
具有一定主题,可以被标识的数据集合。
数据集是共享王建设的最小粒度,是最小的共享资源单位。
5.元数据Metadata
对其它数据进行定义和描述的数据。
6.核心元数据Core Metadata
特指国家科学数据共享工程中,描述科学数据集基本属性的必选元数据元素。
7.扩展元数据 Expand Metadata
特指医药卫生科学数据共享网中,描述科学数据集特殊属性的可选元数据元素(即核心元数据之外的元素)。
8.科学数据共享服务Scientific data shared services
为提供科学数据共享所提供的技术服务,包括:目录服务、导航服务、数据信息发布、数据检索、数据产品加工、数据以数据产品分发等。
9.数据服务基础平台Infrastructure for data services MSDS/T ×××—2008
用于实现科学数据共享服务功能的信息基础设施,主要包括Internet服务、数据库服务、GIS服务、专业应用服务等各类服务,以及访问控制、信息安全等软硬件基础平台的总称。
10.运行机制Runinng mode
严格区分投资来源和数据的产权性质。由国家投资产生的数据应该全民受益;由公司投资开发的数据,公司理所应当获得利益。我国需要在科学数据管理机制上进行调整。调整的重点应该是在国家保密机制基础上,根据投资者的不同,区分公益性和商业化两种不同的运行机制。即:对国家投资产生的科学数据和数据产品,应实行完全、开放的无偿共享;对企业或个人投资产生的科学数据和数据产品,应实行商业化运行,实现有偿共享,并积极探索商业性科学数据有偿服务的共享管理模式,努力培育科学数据产品市场和数据产品服务产业。
第四条 术语
1.科学数据共享工程科学数据资源体系
科学数据资源是指科技活动或通过其它方式所获取到的反映客观世界的本质、特征、变化规律等的原始基本数据,以及根据不同科技活动需要,进行系统加工整理的各类数据集。支撑科研活动的科学数据的集合,称为科学数据资源。科学数据资源有以下不同的来源:
1)科技工作者从所开展的研究活动中获得科学数据资源
任何一项科研活动都离不开数据资源的分析、实验、综合等活动, 科技工作者在这些活动过程中,不仅要采用已有的数据资源作为它的研究基础,还要通过科技工作者本身的研究探索,产生出一系列的科技数据成果,将这些数据成果长期积累和系统化就形成了重要的科学研究数据资源。
2)通过观测获取科学数据资源
空中对地观测的技术不断成熟,因此为获取地球系统科学数据提供了十分有利的条件,所以现在研究地球系统科学已经离不开空中对地观测系统的支持,它的地面分辨率可以按实际研究的要求而设置。
3)利用地面监测站(点)获取数据资源
几乎地球科学、环境科学、资源科学、生物、农业、市场等等的学科领域,为了有效的获取相关的第一手数据资料,都毫无例外的在地面或海洋布设若干监测站(点),获取实际的数据, 它与空中观测方法紧密配合,为研究地球系统科学提供全面的数据资源。
4)自下而上的统计获取数据资源
统计数据资源是获取数据信息的重要手段和方法,为科学研究提供重要的数据支撑。
5)利用各种实验手段去获取数据资源 MSDS/T ×××—2008
实验手段是获取科学数据的最重要手段,几乎它应用在所有学科领域,通过实验去测试和读取若干重要的科学数据,使数据从它的客体上分离出来,变成十分有价值的科学化、系统化和标准化的科学数据源。
6) 宇宙空间的探测手段获取对宇宙认识的科学数据
人们可以利用地球以外的空间布设若干对地球的观察,获取地球科学的一系列数据,为研究地球提供基础科学数据;同时人们也可以利用地球这个大平台,设置若干对宇宙空间探测科学数据的系统,从而获得研究宇宙的数据。
7)从若干相关数据资源中整理选择科学数据资源
数据的产生是以某种目的去进行的,但是由于数据是客观世界本质、特征和变化规律的反映,所以虽然在获取数据时不是完全为科研活动的需要,但这些数据同样具有科研的价值,或者相关产生的数据具有从事科研活动的价值;因此,我们完全可以从若干其它用途的数据资源系统中去挑选和整理为科研活动所需要的数据资源,从某种意义上讲这是获得科研数据最广泛的源泉。
2.科学数据的基本特性
科学数据包括以下基本性质:
公益性:对全社会大多数成员甚至是所有成员的共同有利性。
基础性:科学数据是社会经济活动中的基础和支撑。
可共享性:科学数据作为信息,与传统的资源不同,对其使用不具有排他性、消耗性。数据不会因多次使用而消失,也不会因某人使用而排斥其他人的使用。
流动性:科学数据可以通过文字记录、出版发行、计算机网络等介质和方式进行传递与流动。
可转化性:有两层含义,其一是科学数据的表现形式和内在属性可以转化,如字符方式的科学数据可以在计算机软件的帮助下以可视化图形方式表现;其二是科学数据可以转化为生产力,直接为经济建设带来效益。
可增值性:通过对科学数据的处理加工和分析研究,可以增加科学数据本身的价值。
第三章 科学数据资源
第五条 医药卫生科学数据共享网建设科学数据资源来源
结合对科学数据共享工程科学数据来源的定义,以及对医药卫生科学数据共享网所在领域的实际情况与特点,对医药卫生科学数据共享网科学数据资源的来源归纳为以下几类: MSDS/T ×××—2008
通过科学研究获取的数据资源。
通过观测、探测、调查等业务工作获取的数据资源。
对于生产生活有用的历史数据。
社会公益性数据。
通过分析、挖掘和二次开发得到的数据资源。
第六条 医药卫生领域实施科学数据共享建设的普遍意义
医药卫生领域在其发展过程中,积累了数量庞大、符合科学数据定义的数据资源,在医药卫生领域实施共享本身就具备了科学数据共享建设和推广的重大意义,包括以下方面:
1.增殖科学数据价值
由于医药卫生领域的科学研究项目的数据结果成为“抽屉数据”或者某个部门、某个专家私人数据的,所以国家大量的科研投入最终都没有发挥出应有的科研和社会价值。推行实施科学数据的共享与交流,将打破这些造成资金和成果闲置浪费的信息孤岛,使这些数据被社会和公众更加充分的利用,增大科学数据的价值,扩大国家进行科研投资的社会效益和经济效益。
2.避免科研成果的重复投资
与其他行业相似,目前的医药卫生领域也存在着大量的重复研究、重复投资现象,2003年的SARS研究中我国的国家和地方各级研究力量各自为战,不仅浪费大量的人力物力而且最终也没有取得应有的效果。实施共享机制,让数据和研究人员在受到知识产权保护的情况下实现交流与合作,将在很大程度上降低目前医药卫生领域科研事业中由于重复投资而造成的大量浪费。
3.构建合理的科学研究基础数据环境
美国等一些发达国家,通过早期制定的关于对数据进行共享的法规和制度,目前已经形成了良好的数据共享环境,许多科研成果数据已经被整合成为可供他人使用的公众资源,节约了大量的科研经费,甚至实现了一些研究项目的“零成本”投资。在医药卫生领域实施跨越专业、跨越部门的科学数据资源共享,打造我国医药卫生领域权威、全面的数据资源,必将为推动医药卫生领域的科研发展提供有力的数据资源支持。
第七条 医药卫生领域实施科学数据共享的特殊意义
除了具有一般科学数据资源实施共享后的普遍意义,由于医药卫生领域的特殊性,所以医药卫生领域科学数据资源的共享还具有以下特殊性:
1)降低科研投入成本
由于医药卫生领域内门类繁多,学科林立,既有西医、中医,又有预防医学、药学、保健学,既互相关联,又各成独立体系。在当前情况下的科研设计、课题