当前位置:文档之家› 元数据

元数据

元数据1.元数据概述元数据(Meta Date),关于数据的数据或者叫做用来描述数据的数据或者叫做信息的信息。

这些定义都很是抽象,我们可以把元数据简单的理解成,最小的数据单位。

元数据可以为数据说明其元素或属性(名称、大小、数据类型、等),或其结构(长度、字段、数据列),或其相关数据(位于何处、如何联系、拥有者)。

举几个简单的例子:使用过数码相机的同学都应该知道,每张数码照片都会存在一个EXIF信息。

它就是一种用来描述数码图片的元数据。

根据EXIF标准,这些元数据包括:Image Description(图像描述、来源. 指生成图像的工具 )、Artist(作者)、Make( 生产者)、Model (型号)、….、等等。

生活中我们填写的《个人信息登记表》,包括姓名、性别、民族、政治面貌、一寸照片、学历、职称等等这些就是锁定kent.zhu这个人的元数据。

通常情况下元数据可以分为以下三类:固有性元数据、管理性元数据、描述性元数据。

固有性元数据;与事物构成有关的元数据。

管理性元数据;与事物处理方式有关的元数据。

描述性元数据;与事物本质有关的元数据。

当然,并不是说所数据总能清晰的划分在以上3类中。

比如:一张由kent 拍摄的大小为20K的JPG格式的印着一只小狗的圣诞卡照片。

它的固有性元数据包括:20K、JPG;管理性元数据:kent拍摄、圣诞卡;描述性元数据:狗、小狗、圣诞、照片、圣诞节、…但是,圣诞卡则可以放在以上任何一个分类中。

与事物构成有关(说明这个东东是什么)、与事物处理方式有关(说明这个东东的用途是什么)、与事物本质有关(可以直接用来描述这个东东)。

2.元数据之于信息架构的意义元数据是一种很有效的方法,用以确保网站上各种形式的内容确实都能被查找到。

比如我们常常为搜索很久之前看到的一张美女图片犯愁,而如果一个图片网站如果信息架构足够好,我们就能凭借我们回忆到的元数据(关于武藤兰的?2000年拍摄的?)清晰的找到。

元数据之于信息架构就像是房子的砖瓦,它可以根据需要摆放成不同的信息检索系统。

元数据是所有组织系统的基础,从搜索到电子商务网站上的导航系统都强烈的依赖于元数据。

前面提到,元数据实际上是为产品的可查找性(Findability)服务的。

而用户在查找信息的时候不会按照机器思维去找(不会输入该照片的ID),而是直接输入关于信息的描述性信息如:“小狗圣诞卡”。

也就意味着在创建关于描述性元数据的时候要尽量的提取出任官关于这个对象所讲述的故事,这些才是人们能记住的和习惯搜索的细节。

我们会发现,机械生成的元数据常常是不靠谱的,如在UCH系统下发布日志的时候系统会自动根据标题进行机械分析生成的一些元数据。

而充分利用手工元数据(handcrafted metadate)是提高可查找性的一个好方法。

最常见的例子就是我们见到的Tag。

Tag就是一种用户自创的元数据,其特点是无层次结构、自定义。

比如这张Flickr照片下的手工元数据就为在Flickr 上查找提供了更多的方便。

3.科技名词定义元数据最本质、最抽象的定义为:data about data (关于数据的数据)。

它是一种广泛存在的现象,在许多领域有其具体的定义和应用。

元数据被定义为:描述数据及其环境的数据3.1数据仓库领域在数据仓库领域中,元数据按用途分成技术元数据和业务元数据。

首先,元数据能提供基于用户的信息,如记录数据项的业务描述信息的元数据能帮助用户使用数据。

其次,元数据能支持系统对数据的管理和维护,如关于数据项存储方法的元数据能支持系统以最有效的方式访问数据。

具体来说,在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:(1)描述哪些数据在数据仓库中;(2)定义要进入数据仓库中的数据和从数据仓库中产生的数据;(3)记录根据业务事件发生而随之进行的数据抽取工作时间安排;(4)记录并检测系统数据一致性的要求和执行情况;(5)衡量数据质量。

3.2软件构造领域软件构造领域的定义在软件构造领域,元数据被定义为:在程序中不是被加工的对象,而是通过其值的改变来改变程序的行为的数据。

它在运行过程中起着以解释方式控制程序行为的作用。

在程序的不同位置配置不同值的元数据,就可以得到与原来等价的程序行为。

3.3图书馆与信息界在图书馆与信息界,元数据被定义为:提供关于信息资源或数据的一种结构化的数据,是对信息资源的结构化的描述。

其作用为:描述信息资源或数据本身的特征和属性,规定数字化信息的组织,具有定位、发现、证明、评估、选择等功能。

一般认为,所谓元数据是关于数据的数据,或关于数据的结构化的数据。

从已有的结论看,元数据的含义是逐渐发展的。

元数据一词,早期主要指网络资源的描述数据,用于网络信息资源的组织;其后,逐步扩大到各种以电子形式存在的信息资源的描述数据。

目前,元数据这一术语实际用于各种类型信息资源的描述记录。

此外,元数据在地理界,生命科学界等顶域也有其相应的定义和应用。

4.元数据简介元数据(Meta Data)是关于数据仓库的数据,指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。

同时元数据还包含关于数据含义的商业信息,所有这些信息都应当妥善保存,并很好地管理。

为数据仓库的发展和使用提供方便。

元数据是一种二进制信息,用以对存储在公共语言运行库可移植可执行文件 (PE) 文件或存储在内存中的程序进行描述。

将您的代码编译为 PE 文件时,便会将元数据插入到该文件的一部分中,而将代码转换为 Microsoft 中间语言(MSIL) 并将其插入到该文件的另一部分中。

在模块或程序集中定义和引用的每个类型和成员都将在元数据中进行说明。

当执行代码时,运行库将元数据加载到内存中,并引用它来发现有关代码的类、成员、继承等信息。

元数据以非特定语言的方式描述在代码中定义的每一类型和成员。

元数据存储以下信息:程序集的说明。

标识(名称、版本、区域性、公钥)。

导出的类型。

该程序集所依赖的其他程序集。

运行所需的安全权限。

类型的说明。

名称、可见性、基类和实现的接口。

成员(方法、字段、属性、事件、嵌套的类型)。

属性。

修饰类型和成员的其他说明性元素。

5.元数据的优点对于一种更简单的编程模型来说,元数据是关键,该模型不再需要接口定义语言 (IDL) 文件、头文件或任何外部组件引用方法。

元数据允许 .NET 语言自动以非特定语言的方式对其自身进行描述,而这是开发人员和用户都无法看见的。

另外,通过使用属性,可以对元数据进行扩展。

元数据具有以下主要优点:3.4自描述文件公共语言运行库模块和程序集是自描述的。

模块的元数据包含与另一个模块进行交互所需的全部信息。

元数据自动提供 COM 中 IDL 的功能,允许将一个文件同时用于定义和实现。

运行库模块和程序集甚至不需要向操作系统注册。

结果,运行库使用的说明始终反映编译文件中的实际代码,从而提高应用程序的可靠性。

3.5语言互用性和更简单的基于组件的设计元数据提供所有必需的有关已编译代码的信息,以供您从用不同语言编写的 PE 文件中继承类。

您可以创建用任何托管语言(任何面向公共语言运行库的语言)编写的任何类的实例,而不用担心显式封送处理或使用自定义的互用代码。

6.属性.NET Framework 允许您在编译文件中声明特定种类的元数据(称为属性)。

在整个 .NET Framework 中到处都可以发现属性的存在,属性用于更精确地控制运行时您的程序如何工作。

另外,您可以通过用户定义的自定义属性向 .NET Framework 文件发出您自己的自定义元数据。

有关更多信息,请参见利用属性扩展元数据。

7.元数据的意义说到元数据的意义,可以从其应用目的来谈的。

虽然做数据仓库言必称元数据,必称技术、业务元数据,但其到底用于何处?离开了目标去谈元数据,就发现元数据包含太多的东西,因为他是描述数据的数据嘛。

还是拿客户关系系统来比喻,这个系统维护客户信息当然是有目的的,是要用这些信息进行一些自动的流程处理、去挖掘一些客户潜在的价值、做好客户服务。

当然没有必要去维护客户的生命特征信息,诸如指纹、犯罪史等,这些信息跟客户关系管理的目标关系不大。

元数据也是如此,你可以将所有数据的结构、大小、什么时间创建、什么时间消亡、被那些人使用等等,这些信息可以延伸得太广,如果不管目标,而试图去建一个非常完美的元数据管理体系,这是一种绝对的"自上而下"做法,必败无疑。

8.元数据列举基于应用,可以将元数据分成以下的若干种。

数据结构:数据集的名称、关系、字段、约束等;数据部署:数据集的物理位置;数据流:数据集之间的流程依赖关系(非参照依赖),包括数据集到另一个数据集的规则;质量度量:数据集上可以计算的度量;度量逻辑关系:数据集度量之间的逻辑运算关系;ETL过程:过程运行的顺序,并行、串行;数据集快照:一个时间点上,数据在所有数据集上的分布情况;星型模式元数据:事实表、维度、属性、层次等;报表语义层:报表指标的规则、过滤条件物理名称和业务名称的对应;数据访问日志:哪些数据何时被何人访问;质量稽核日志:何时、何度量被稽核,其结果;数据装载日志:哪些数据何时被何人装载;9.元数据开发应用的标准化框架1、数字图书馆资源组织框架2. 元数据开发应用框架2.1 元数据的基本意义 Metadata(元数据)是“关于数据的数据”;元数据为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具;元数据为分布的、由多种数字化资源有机构成的信息体系(如数字图书馆)提供整合的工具与纽带。

离开元数据的数字图书馆将是一盘散沙,将无法提供有效的检索和处理。

3. 元数据应用环境3.1 Metadata的应用目的(1)确认和检索(Discovery andentification),主要致力于如何帮助人们检索和确认所需要的资源,数据元素往往限于作者、标题、主题、位置等简单信息,Dublin Core是其典型代表。

(2)著录描述(Cataloging),用于对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体、位置与获取方式、制作与利用方法、甚至相关数据单元方面等,数据元素数量往往较多,MARC、GILS和FGDC/CSDGM是这类Metadata的典型代表。

(3)资源管理(Resource Administration),支持资源的存储和使用管理,数据元素除比较全面的著录描述信息外,还往往包括权利管理(Rights/Privacy Management)、电子签名(Digital Signature)、资源评鉴(Seal of Approval/Rating)、使用管理(Access Management)、支付审计(Payment and Accounting)等方面的信息。

相关主题