当前位置:文档之家› Ontology理论研究和应用建模

Ontology理论研究和应用建模

Ontology理论研究和应用建模——《Ontology研究综述》、w3c Ontology研究组文档以及Jena编程应用总结1 关于Ontology1.1Ontology的定义Ontology最早是一个哲学的范畴,后来随着人工智能的发展,被人工智能界给予了新的定义。

然后最初人们对Ontology的理解并不完善,这些定义也出在不断的发展变化中,比较有代表性的定义列表如下:关于最后一个定义的说明体现了Ontology的四层含义:●概念模型(cerptualization)通过抽象出客观世界中一些现象(Phenomenon)的相关概念而得到的模型,其表示的含义独立于具体的环境状态●明确(explicit)所使用的概念及使用这些概念的约束都有明确的定义●形式化(formal)Ontology是计算机可读的。

●共享(share)Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体。

Ontology的目标是捕获相关的领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇之间相互关系的明确定义。

1.2Ontology的建模元语Perez等人用分类法组织了Ontology,归纳出5个基本的建模元语(Modeling Primitives):●类(classes)或概念(concepts)指任何事务,如工作描述、功能、行为、策略和推理过程。

从语义上讲,它表示的是对象的集合,其定义一般采用框架(frame)结构,包括概念的名称,与其他概念之间的关系的集合,以及用自然语言对概念的描述。

●关系(relations)在领域中概念之间的交互作用,形式上定义为n维笛卡儿积的子集:R:C1×C2×…×C n。

如子类关系(subclass-of)。

在语义上关系对应于对象元组的集合。

●函数(functions)一类特殊的关系。

该关系的前n-1个元素可以唯一决定第n个元素。

形式化的定义为F:C1×C2×…×C n-1→C n。

如Mother-of就是一个函数,mother-of(x,y)表示y是x的母亲。

●公理(axioms)代表永真断言,如概念乙属于概念甲的范围。

●实例(instances)代表元素。

从语义上讲实例表示的就是对象。

在实际建模过程中,概念之间的关系不限于上面列出的4种基本关系,可以根据领域的具体情况定义相应的关系。

1.3Ontology和语义网络1.4Ontology的描述语言目前在具体应用中Ontology的表示方式主要有4类:●非形式化语言●半非形式化语言●半形式化语言●形式化语言可以用自然语言来描述Ontology,也可以用框架、语义网络或逻辑语言来描述。

目前普遍使用的方法列表如下:1.5已有的Ontology及其分类●知识表示Ontologies●普通Ontologies●顶级Ontologies●元(核心)Ontologies●领域Ontologies●语言Ontologies●任务Ontologies●领域-任务Ontologies●方法Ontologies●应用Ontologies但它们之间有交叉,层次不够清晰。

1.6构造Ontology的规则出于对各自问题域和具体工程的考虑,构造Ontology的过程各不相同。

目前没有一个标准的Ontology的构造方法。

最有影响的是Gruber在1995年提出的5条规则:●明确性和客观性:Ontology应该用自然语言对所定义的术语给出明确、客观的语义定义。

●完全性:所给出的定义是完整的,完全能表达所描述的术语的含义。

●一致性:由术语得出的推论与术语本身的含义是相容的,不会产生矛盾。

●最大单调可扩展性:向Ontology中添加通用或专用的术语时,不需要修改已有的内容。

●最小承诺:对待建模对象给出尽可能少的约束。

目前大家公认在构造特定领域的Ontology的过程中需要领域专家的参与。

2 Ontology的研究和应用Ontology的研究和应用主要包括以下3方面:●理论上的研究,主要研究概念及其分类,Ontology上的代数;●信息系统中的应用,主要包括处理信息组织、信息检索和异构信息系统互操作问题;●Ontology作为一种能在知识层提供知识共享和重用的工具在语义Web中的应用。

2.1Ontology的理论研究Ontology的理论研究包括概念和概念分类、Ontology上的代数。

最有代表性的是Guarino 等人对概念的分类所做的深入和细致的研究,他们从一般的意义上分析了什么是概念、概念的特性、概念之间的关系以及概念的分类,提出了一套用于指导概念分类的可行理论。

基于这个理论,他又提出了Ontology驱动的建模方法,在理论上为建模提供了一个通用的模式。

Guarino认为概念之间的差别不仅体现在概念的定义上,同时也体现在概念的某些特性上。

从这些特性出发,归纳出概念的元特性(最基本的特性),从而用公式给出元特性的严格的形式定义。

在此基础上,他们又讨论了元特性之间的关系和约束,最终把研究结果作为概念分类的基本理论工具并提出一套完成的概念分类体系结构。

Guarino的理论可以归纳如下:概念分类理论的基础是概念的元特性。

以概念的元特性为出发点,按照一定的规则,把具有相同元特性组合的概念归为一类,进而给出一般意义上的概念分类体系。

概念的基本元特性包括:持久特性、非持久特性、反持久特性、半持久特性、载体标识特性、支持标识特性、外部依赖特性等。

以下是对各种特性的说明:2.2Ontology在信息系统中的应用Ontology具有良好的概念层次结构和对逻辑推理的支持,在知识检索中有广泛应用。

基于Ontology的信息检索的基本思想有:●在领域专家的帮助下,建立相关领域的Ontology;●收集信息源中的数据,并参照已建立的Ontology把收集来的数据按规定格式存储在元数据库(RDB,KDB等)中;●对用户检索界面获取的查询请求,查询转换器按照Ontology把查询请求转换成规定的格式,在Ontology的帮助下从元数据库中匹配出符合条件的数据集合;●检索的结果经过定制处理返回给用户。

关于Ontology的表达,主要分为两种情况进行处理:●检索系统如不需要太强的推理能力,Ontology可用概念图的形式表示并存储,数据可以保存在一般的关系数据库中,采用图匹配技术完成检索;●如要求较强的推理能力,一般需要一种描述语言(Loom等)表示Ontology,数据保存在知识库中,采用描述语言的逻辑推理能力完成检索。

目前Ontology用于信息检索的项目列举如下:2.3Ontology和语义Web提高Web信息检索的质量包括两方面的内容:●如何在现有的资源上面设计更好的检索技术;●如何为Web上的资源附加上计算机可以理解的内容,便于计算机处理,即给出一种计算机能够理解的表示资源的手段。

基于后一种考虑,Berners-Lee在2000-12-18的XML2000的会议上提出了语义Web。

语义Web的目标是使得Web上的信息具有计算机可以理解的语义,满足智能软件代理(Agent)对WWW上异构和分布信息的有效访问和检索。

下面是Berners-Lee为未来Web 发展提出的基于语义的体系结构-语义Web体系结构:* 核心层,用于表示Web信息的语义。

XML和RDF都能为所表述的资源提供一定的语义。

但是XML中的标签(tags)和RDF 中的属性(properties)集都没有任何限制。

一个例子是:XML可以用“<Author>TOM</Author>”表示TOM是教师。

而“<rdf:Description about=/Home/Lassila><s:Creator>OraLassila</s:Creator></rdf:Description> ”这个RDF片断描述了Web页的创建者问题。

而上面的Author和Creator完全可以用Writer来代替。

另一个例子是:某医院和某大学的Web页上都有<Doctor>,但是不知道它代表医生还是博士。

综上,XML和RDF在处理语义上存在的问题是:●同一概念有多种词汇表示;●同一个词汇有多种概念(含义)。

Ontology通过对概念的严格定义和概念之间的关系来确定概念精确含义,表示共同认可的、可共享的知识,从而解决上面的问题。

因此在语义Web中,Ontology具有非常重要的地位,是解决语义层次上Web信息共享和交换的基础。

为了便于Web上应用程序使用方便,需要有一个通用的标准语言来表示Ontology,就像XML作为标准的数据交换语言一样。

目前正在开发中的语言有:SHOE、OML、XOL、Riboweb、RDFS和OIL。

下面将就w3c提出的OWL(Web Ontology Language)做进一步的分析。

目前语义Web是一个新兴的研究方向,Ontology在其中的应用刚刚起步。

3 Web Ontology Language (OWL)概述3.1OWL简介OWL(Web Ontology Language)适用于这样的应用,在这些应用中,不仅仅需要提供给用户可读的文档内容,而且希望处理文档内容信息。

OWL能够被用于清晰地表达词汇表中的词条(term)的含义以及这些词条之间的关系。

而这种对词条和它们之间的关系的表达就称作Ontology。

OWL相对XML、RDF和RDFSchema拥有更多的机制来表达语义,从而OWL超越了XML、RDF和RDFSchema仅仅能够表达网上机器可读的文档内容的能力。

3.2OWL在语义网中的地位语义网是对未来网络的一个设想,在这样的网络中,信息都被赋予了明确的含义,机器能够自动地处理和集成网上可用的信息。

语义网使用XML来定义定制的标签格式以及用RDF的灵活性来表达数据,下一步需要的就是一种Ontology的网络语言(比如OWL)来描述网络文档中的术语的明确含义和它们之间的关系。

下图给出了w3c的Ontology语言栈描述:W3C2002年7月31日透露了发行OWL Web 本体论语言(OWL Web Ontology Language)工作草案的细节,其目的是为了更好地开发语义网(Semantic Web)。

W3C 发言人Ian Jacobs说,开发语义网的目的是能够在互联网上进行更结构化的智能处理,例如,当一个人确定要参加某个城市的会议后,就可以自动查找有关航班和酒店的信息。

W3C称,W3C Web 本体论工作小组正在对OWL Web本体论语言进行设计,OWL是本体论Web 语言(Ontology Web Language)的字母缩写。

相关主题