当前位置:文档之家› 领域本体的构建方法研究

领域本体的构建方法研究

一般来说,本体具有两个特征:静态性和动态性—静态性指的是它反映的概 念模型,没有涉及动态的行为;动态性指的是它的内容和服务对象是不断变化的, 针对不同的领域,可以定义和构造不同的本体[6]。
1.1.2 本体的构成
本体的体系结构应该包括 3 个要素:核心元素集、元素间的交互作用以及这
些元素到规范语义间的映射关系。ISO 704 标准和 OKBC 模型是现有的有关本体
3.4.3 自动构建本体 结论 参考文献
摘 要:
领域本体的构建方法是当前本体研究的热点问题之一。但是,目前领域本体 的创建还缺乏系统的、针对所有领域的、工程化的方法。本文介绍了本体的相关 理论,并结合领域本体一般构建原则,分析了手工建立本体的六种常见本体构建 工程思想,归纳总结出了构建领域本体的一般步骤。此外本文还重点分析了现有 的领域本体构建方法以它们及存在的问题。
关键词:
本体 领域本体 构建方法
引言
本体(Ontology)是近年来计算机及相关领域普遍关注的一个研究热点,作为 一种能在语义和知识层次上描述信息系统的概念模型建模工具,已被广泛应用于 知识工程、系统建模、信息处理、数字图书馆、自然语言理解、语义 Web 等领 域之中[1]。虽然 20 世纪 90 年代以来,研究人员从各自的专业角度出发对本体的 理论和应用进行了深入研究,取得了丰富的研究成果,本体理论与技术也随之日 趋成熟,但是领域本体的建设问题仍然制约这些应用的发展。本文将详细研究和 分析目前领域本体构建的各种方法以及存在的问题,为寻找新的构建方法提供参 考。
被计算机存储、加工、利用,或在不同的系统之间进行互操作。[9] 本体语言使得用户为领域模型编写清晰的、形式化的概念描述成为可能,因 此它应该具备良好定义的语法、语义,有效的推理支持,充分、方便的表达能力。
自上个世纪 90 年代以来,大量的研究工作者活跃在该领域,因此诞生了许 多本体描述语言,有 RDF 和 RDF-S,OWL(注:DAML+OIL 认为它是 OWL 的 一个过渡)、KIF,SHOE,XOL,OCML,Ontolingua,Cycl,Loom。这里简单 把它们归类如下:
第一类包括 Ontolingua、OntoSaurus、WebOnto 等。这三个工具的共同点是, 都基于某种特定的语言,并在一定程度上支持多种基于 AI 的本体描述语言。
第二类包括 Protégé 系列、WebODE,OntoEdit,OliEd 等。这些工具最大的 特点是独立于特定的语言,可以导入/导出多种基于 Web 的本体描述语言格式(如 XML,RDF(S),OWL 等)。其中,除了 OliEd 是一个单独的本体编辑工具外, 其他都是一个整合的本体开发环境或一组工具。它们支持本体开发生命周期中的 大多数活动,并且因为都是基于组件的结构,很容易通过添加新的模块来提供更 多的功能,具有良好的可扩展性[10]。
instance-of
表达概念的实例与概念之间的关系,类似于面向对象中的 对象和类之间的关系。
attribute-of
表达某个概念是另一个概念的属性。如概念“颜色”是概念 “玫瑰花”的一个属性。
在实际建模过程中,不一定要严格地按照上述 5 类基本建模元语来创建
Ontology,概念之间的关系不限于上面列出的 4 种基本关系,可以根据领域的具
1 本体的相关理论
本体又称为实体,源自于形而上学的哲学分支,它对客观世界的事物进行分 解,发现其基本的组成部分,进而研究客观事物的抽象本质[10]。
1.1 本体的概述
本体最早是一个源于哲学的概念,是一种对“存在”的系统化解释,用于描述 事务的本质。后来知识工程学者借用了这个概念,在开发知识系统时用于领域知 识的获取[8]。
体系结构的规定。ISO 704 认为本体的体系结构应含概念、定义和术语 3 部分。
ISO 704 建议,一个概念应该用一个自然语言的术语得到理想的表达。
பைடு நூலகம்
对于本体的具体构造过程,可以用以下公式(1-1)形象地表示:
本体 = 概念(Concept) + 属性(Property) + 公理(Axiom) + 取值(Value)
其中,领域本体在一个特定的领域中可重用,它们提供该领域特定的概念定 义和概念之间的关系,提供该领域中发生的活动以及该领域的主要理论和基本原 理等。对特定领域的本体研究和开发目前已涉及许多领域,包括企业本体、医学 概念本体、酶催化生物学本体、陶瓷材料机械属性本体等。
领域本体主要有以下作用: 可以明确专业术语、关系及其领域公理, 使其形式 化;在人与人之间、人与机器之间达到共享;实现一定程度的领域知识复用[10]。
本体工程已成为现阶段研究中的一个热点问题。如何才能大规模的构造本体? 如何集成现有的不同本体?如何维护本体及其进化过程?这一系列的问题都需要 方法论作为指导,目前该领域研究还处于探索阶段,没有形成成熟的方法论,是 一个有价值的研究方向。
此外,本体构造不仅需要理论上的探讨和研究,还必须实实在在的构造出本 体。如何能利用软件系统辅助人们构造本体?这些软件能在哪些方面自动化或者 半自动化的发挥作用?本体开发过程中如何支持协同工作?不同软件开发的本体 如何集成?构造好的本体如何管理和维护?这些也成为该领域函待解决的问题。[4]
领域本体的构建方法研究
(马文虎,南京理工大学信息管理系)
目录
引言 1 本体的相关理论 1.1 本体的概述 1.1.1 本体的定义 1.1.2 本体的构成 1.1.3 本体的分类 1.1.4 本体的应用领域 1.2 本体的描述语言 1.3 本体的编辑工具 1.4 建立本体的难点 1.5 本体研究的现状 2 领域本体的构建研究 2.1 领域本体构建遵循的原则 2.2 本体的构建工程思想 2.2.1 IDEF-5 方法 2.2.2 Skeletal Methodolody 骨架法(Uschold 方法) 2.2.3 TOVE 企业建模法 2.2.4 Methontology 方法 2.2.5 循环获取法 2.2.6 七步法 2.3 构建领域本体的步骤 2.3.1 确定领域本体的专业领域和范畴 2.3.2 考虑复用现有的本体 2.3.3 列出本体涉及领域中的重要术语 2.3.4 定义分类概念和概念分类层次 2.3.5 定义概念之间的关系 3 现有的领域本体构建方法及存在的问题 3.1 构建领域本体的知识工程方法 3.2 基于叙词表的领域本体构建 3.3 基于顶层本体构建领域本体的构建方法 3.4 领域本体构建过程中存在的问题 3.4.1 手工构建 3.4.2 复用已有的本体
1.1.1 本体的定义
近年来,本体的概念被越来越多的应用于计算机知识工程领域,用于对客观 世界的存在进行系统化描述,方便知识的重用和交互。人们已经从不同的角度和 方面为本体论概念进行了定义。
虽然不同研究者对本体有不同的描述,但是从内涵上来看,他们都是把本体 当作某个领域内不同主体(人、代理、机器等)之间进行交流的一种语义基础,即 由本体提供明确定义的词汇表,描述概念和概念之间的关系,作为使用者之间达 成的共识[10]。因此,本体的用途包括交流、共享、互操作、重用等。
(2)基于 AI(Artificial Intelligence)的本体实现语言有:KIF,Ontolingua,Cycl, Loom,OCML,Flogic。KIF 己经是美国国家标准,但是它并没有被广泛应用于 互联网,作为一种交换格式更多的应用于企业级。[10]
1.3 本体的编辑工具
到目前为止,已经出现了许多本体编写工具。根据这些工具所支持的本体描 述语言,大致可以分为两类。
(l)基于 Web 的本体语言(也叫做本体标记语言)有:RDF 和 RDF-S,OWL, SHOE,XOL。其中 RDF 和 RDF-S,OWL,XOL 之间有着密切的联系,是 W3C 的本体语言栈中的不同层次,也都是基于 XML 的。而 SHOE 是基于 HTML 的, 是 HTML 的一个扩展。
体情况定义相应的关系,以满足应用的需要,案例如图 1 所示。
图 1 本体的构成案例[8]
1.1.3 本体的分类
目前关于本体的研究非常广泛,尤其是在国外,许多研究组织和机构都研究 建立了各种各具特色的本体。针对目前出现的各种各样的本体,也出现了不同的 分类方法,最为广泛的分类方法是根据本体应用主题,将这些为数众多的本体划 分为五种类型:领域本体、通用或常识本体、知识本体、语言学本体和任务本体。
本体是用于描述一个领域的术语集合,其组织结构是层次结构化的,可以作 为一个知识库的骨架和基础。一般认为本体就是 Gruber 提出的“本体是概念模型 的明确的规范说明”。Fensel 时这个定义进行分析后认为本体的概念包括概念化、 明确、形式化和共享四个主要方面。
总而言之,本体的目标是获取、描述和表示相关领域的知识,提供对该领域 知识的共同理解,确定领域内共同认可的词汇,并从不同层次的形式化模式上给 出了这些词汇(术语)和词汇间相互关系的明确定义[6]。从而能够描述领域内部甚 至更广范围内的一些概念和概念之间的联系,使得这些概念和联系在共享的范围 内有着明确唯一的解释,这样人、系统之间就可以进行交流[11]。
1.2 本体的描述语言
关于本体的标记语言,可称之为置标语言,又称本体的构建语言或者是表示 语言。作为表示本体的语言工具,应该具有如下的基本功能:
1) 为本体的构建提供建模元语(Modeling Primitives)。 2) 为本体从自然语言的表示格式转化成为机器可读的逻辑表达格式提供
标引工具。 3) 为本体在不同系统之间的导入和导出提供标准的机读格式。 4) 形式化语言表示,利用机器可读的形式化表示语言表示本体,可以直接
图 2 依照领域依赖程度的本体分类[5] 1.1.4 本体的应用领域
目前,本体已经被广泛应用于知识工程、自然语言处理、数字图书馆、信息 检索和 Web 异构信息的处理、软件复用、面向对象技术和语义 Web 等领域。典 型的应用有:
相关主题