当前位置:文档之家› 网格环境下基于本体的知识库模型研究

网格环境下基于本体的知识库模型研究

第51卷第5期 2005年10月武汉大学学报(理学版)J.WuhanUniv.(Nat.Sci.Ed.)Vol.51No.5 Oct.2005,603~608

收稿日期:2004211210 󰂍通讯联系人 E2mail:chenhr@public.wh.hb.cn基金项目:湖北省教育厅科学研究计划(2003A012);湖北省自然科学基金(2003ABA049)资助项目作者简介:黄 屹(19692),男,博士生,现从事分布式系统与分布式流媒体等研究. E2mail:huangyi@wangking.com文章编号:167128836(2005)0520603206

网格环境下基于本体的知识库模型研究

黄 屹1,顾进广1,2,陈莘萌1󰂍,陈和平3

(1.武汉大学计算机学院,湖北武汉430072;2.武汉科技大学计算机科学与技术学院,湖北武汉430081;

3.武汉科技大学信息科学与工程学院,湖北武汉430081)

摘 要:针对知识技术仅用于描述网格服务的可用性以及如何被发现、调度和进化的现状,在开放网格服务体系结构(OGSA)的基础上,给出了知识库本体的形式化定义,分析了构建知识库所需的本体,在此基础上提出了网格环境下知识库通用体系结构及基于语义适配器的存储模型,克服了Sesame存储模型在存储不同格式文件和本体方面所存在的不足,讨论了网格知识库的访问机制.关 键 词:知识库;开放网格服务体系结构;知识网格;本体中图分类号:TP391 文献标识码:A

0 引 言

网格[1]作为分布式环境下资源共享与协作计算的集成基础设施,网格正受到越来越多的关注.网格应用涉及海量数据与密集计算,对目前的互联网和网络基础设施而言是一个极大的挑战,网格中间件正试图在通信、调度、安全、信息、数据访问和错误检

测等多个领域迎接挑战.开放网格服务体系结构(OGSA)[1,2]借助Webservice成果,在网格中引入了服务定位.网格服务是Webservice的集合,它遵守一组控制、差错恢复和安全管理协定,并通过标准接口提供服务.知识网格[3]使用知识本体来描述网格资源,是网格和语义网络的一种演变.VEGA2KG(http://kg.ict.ac.cn)[4,5]和PDKD[6,7]是该方面研究的典型范例.然而,目前关于知识和网格的研究主要集中在使用知识技术来描述网格服务的可用性,描述它们是如何被发现、调用和进化的,并且从服务描述和网络元素中获取知识.相反,网格上的知识却很少讨

论.本文提出了一种网格知识应用———在网格的分布式节点上存储知识,使用网格与知识网格的基本概念如面向服务的中间件,网格的知识技术,基于本体的知识表示机制等等,来描述分布式知识库节点

的资源处理能力.作为词汇集和概念关系的形式化说明方法,知

识本体在语义网和知识网格中发挥重要作用.知识

本体为确定领域中的应用提供共享概念,减少或消

除多个概念和术语之间的混淆,使领域知识的处理

更加精确和方便.使用DAML+OIL等描述逻辑语

言来表示基于本体的知识,DAML+OIL采用一种面

向对象的方法进行建模,一个领域通常用类和特性来

表示,它在RDF(ResourceDescriptionFramework)的

基础上进行了扩充,丰富了语言的建模能力.用类

Horn逻辑语言如TRIPLEI[8]表示知识规则.

1 知识库的本体定义

本体的主要目的是提供一种通用的方法,通过

该方法,多个应用程序及使用者可以采用通用的方

式来理解所涉及的领域知识及概念,达到重用资源

的目的.通常用类、关系、函数、定理、实例的集合表

示本体,文献[9]中给出了本体、关系、定理和词典的

定义,本文在其基础上对本体进行扩充.定义1 本体O可用一个八元组来表示,O∶=

(C,R,AC,AR,≤C,≤R,σ,L),其中,①C和R为两

个集合,分别表示概念集合和关系集合;②AC,AR

是两个属性集合容器,分别代表概念属性的集合容

器和关系属性的集合容器,容器的每一个元素代表武汉大学学报(理学版)第51卷一个概念或关系的属性集合;③≤C是作用于C上的偏序关系,称为概念层次;④≤R是一个作用于R上的偏序关系,称为关系层次,对于1≤i≤|σ(r1)|,如果r1≤Rr2意味着|σ(r1)|=|σ(r2)|而且πi(σ(R1))≤Rπi(σ(R2));⑤函数σ:R→C+;⑥假设

L为一逻辑语言,本体O的L2axiom系统是一个二元组A∶=(IA,α),其中IA是一个集合,它的元素被

称为公理标识,α是公理实例;在本文的系统中,采用类似于TRIPLE风格的逻辑语言表示公理.在构建知识库的过程中,需要建立以下本体.

1.1 领域本体领域本体是构建知识库最重要的本体,它通常

用类和属性来描述保存于知识库各节点中的知识的概念模型.通常,按以下几个步骤来构建领域本体:

Step1 确定目标和范围:定义本体的领域和范围是本阶段最关键的工作.定义包含本体的规范,用途,应用场景,描述特征和粒度的术语集.

Step2 构建本体,可以细分为3个步骤.(a)本体获取:包括知识获取,与阶段1的需求相交互.(b)

本体编码:以一种概念模型来组织领域知识.(c)集

成现有本体:通过重用现有本体可以加速本体的开

发过程.

Step3 评估:本体的确认和评价.

Step4 每个阶段的指导.在Step2(a)和(b)阶段,采用自顶向下法来构

造本体.首先识别关键的概念和属性.一个非常有用的办法是将这些术语写成一列,用术语造句或者写出

它们的解释,以说明这些术语及其属性.自顶向下的

开发过程从定义领域中的最通用的概念出发,定义

这些概念所采用的说明.一旦完成基本概念的定义,必须用属性来描述它们的内部结构.其次通过分类关系来定义概念的层次.分类通

过单重/多重继承来组织领域中的本体知识.一类是

特殊/一般(“is2a”)关系,“is2a”关系说明,如果类A中的每个实例同时也是类B的一个实例,那么A是

B的一个子类.另一类是is2part2of关系,它定义了一个类的子类构成.开发过程的第3步是公理的构造.公理提供一

种方法以表示概念的更多信息,例如内部结构的限制,它们的相互关系,正确性校验和新信息的推理.在Step2(c),采用自底向上的方法从现有本体中抽取一个新的本体.

1.2 资源本体在网格环境下,客户获取知识的请求可能在某个节点得不到满足,而被转送到其他的网格节点执

行.网格如何知道该节点能否提供客户所需要的服

务呢?MDS(MontoringandDiscoveryServices)服

务发现机制是必需的.传统的服务与资源发现和匹

配是在对称的、基于属性匹配的基础上完成.在本文

的系统中,使用资源本体来定义资源与知识库节点

服务,在请求者和提供者之间进行一种有目的的比

较,使得资源发现与匹配服务更加高效.资源本体使用DAML+OIL语言来描述知识

库节点所能提供的资源和服务.资源本体能够描述

下面的信息:

●节点上的操作系统与版本;

●节点上内存与磁盘信息;

●IP地址及安全级;

●网格环境下节点的角色;

●能够向用户提供何种知识;

●提供它所拥有的知识的视图服务?

●节点能够提供的其他服务.系统还使用基于规则的公理如TRIPLE来表

示一些背景知识以及服务和资源的限制.

1.3 层次本体

在同一知识库节点上保存相同领域的知识是一

个较好的选择,它意味着在同一个局域网的单一服

务器或服务器对等节点上保存同一领域的知识.当

请求者在网格上查询时,如何发现所需的知识呢?在此问题的推动下,有必要在不同的知识库节点上

维护一个分类类别.层次本体的一个作用是表示知识

库节点上的知识以及不同节点间关系的背景知识;另

一个重要作用是维护节点存储的语义背景知识.

2 知识库通用体系结构

2.1 知识库的形式化定义

定义2 知识库可以用一个五元组来表示,KB∶=(CKB,RKB,I,lC,lR),其中①CKB和RKB是两个

集合;集合CKB的元素被称为实例标识符或实例;

RKB的元素为知识库的关系实例;②被称为概念实例的函数lC:CKB→R(I);③被称为关系实例的函数

lR:RKB→R(I+).定义3 知识库KB的实例词典可以用一个二

元组来表示,IL∶=(SI,RI),其中①集合SI中的元

素被称作实例标识;②关系RIΑSI×I被称为实例

词典参考.带有词典的知识库是一个二元组(KB,

IL),KB是一个知识库,IL是KB的一个实例词典.406第3期黄 屹等:网格环境下基于本体的知识库模型研究

2.2 知识库通用体系结构知识库体系结构定义于网格服务和工具包的上

层.这些服务被称为适配器服务,它采用“中介者”(Mediator)方式构建服务体系.“适配器”一词源于软件开发活动中广泛使用的适配器软件设计模式.知识

库适配器的设计目标是:服务能够像J2EE的JDB2

CADO.NET中的数据适配器那样轻松地部署.知识库通用体系结构如图1所示.一个知识访问节点对库

中知识的访问能够通过知识库适配器服务来实现. 知识库适配器服务可以用图2描述.适配器服

务可以被分成3个层次. 存储层.在本地或网络磁盘阵列中存储知识和

其他背景知识.系统中使用了一个改进的Sesame[10]

知识库存储层,它表示网格中的一个知识库节点.管理层.处理知识访问、语义映射以及资源发现

与匹配服务.所有的管理层服务都运行在执行虚拟

图1 网格环境下知识库体系结构

图2 知识库适配器服务示意图引擎的TRIPLE/XSB上,虚拟引擎为知识库节点

提供规则库知识推理.客户层.与管理层通过基于DAML+OIL的查

询和操作消息来进行通信,它从客户端接受类似于

SQL的知识查询请求,并且将请求打包为DAML+

OIL消息模式,然后通过基于Globus通用网格环境

发送消息给网格知识库适配器.

2.3 语义映射服务

不同的领域对于知识有不同的理解,即使他们

使用相同的词语来表示概念和属性.将不同的局部

本体映射为全局本体非常重要,这个服务被称为语

义映射服务,它在背景知识和以下组件的基础上使

用本体映射引擎(OME)执行映射服务.

MDD(元数据目录):它包括一些信息源的描

述,例如语义、存储路径、类型和供应者等等.

SKB(语义知识库):它包括理解本体概念和属

性所需要的知识,例如同义词、中英文比较等等,这

些知识对于概念匹配来说是十分必要的,SKB在匹

配过程中能够自动扩展.

VMT(词汇映射表):即使是相同的语义,在不

同的本地RDF/RDFS文档中,RDF/RDFS也可能

有不同的名称.为了获取一致的属性含义和数据描

述视图,有必要定义一个全局词汇和本地RDF/

RDFS的相同语义描述表.例如:(Ontology.term,Description;Source(1).

term;Source(2).term;…;Source(n).term)

其中Ontology.term是建立在本体中的全局术语,

Description是它的意义描述,Source(i).term是在

本地语法中使用的相应的术语.有关本体映射与翻译服务的一些其他的信息可

以参考OntoMerge[11]和MAFRA[12].

2.4 知识提供服务

知识提供服务知识访问服务中获取请求,然后

转换为TRIPLE格式,并在本地存储网络中利用

TRIPLE/XSB搜索引擎搜索本地存储的知识,将得

到的结果以DAML+OIL的格式返回给客户端.客

户端调用知识显示服务在客户节点中显示知识.

TRIPLE/XSB引擎使用存储层提供的RDFAPI从

存储层中获取知识.如上所述,知识提供服务提供两种服务,一种是

在本地节点上存储知识的存储服务,另一种是在本

地节点上搜索知识的搜索服务.将来或许还有一些

其他的特性要添加进来,如维护本地节点上知识的

一致性.506

相关主题