当前位置:文档之家› 基于本体的知识集成研究综述

基于本体的知识集成研究综述

基于本体的知识集成研究综述1李跃龙,李勇大连海事大学计算机科学学院大连(116026)E-mail:liyao1120@摘要:本文对知识管理中研究的重点和热点—知识集成的概念、基于本体的知识集成现状进行了综述。

由于对知识集成本身的研究时间不长,因此无论是在理论和实践中都缺乏系统性的研究,形成了研究的丛林。

本文通过详实的文献,阐述了知识集成的概念、本体概念及研究现状和基于本体的知识集成研究现状等多个问题和主要进展。

关键词:知识集成,本体,综述中图分类号:TP3111.引言不论对知识经济持何态度,在管理领域,知识已经成为企业竞争力的源泉。

Davenport 和Prusak指出科技不是能够维系的竞争优势来源,而知识的优势是可以长久维系的,因为它能源源不断地创造效益和优势。

哈佛大学的学者们认为,当前的企业管理已经进入全球化和知识化的阶段,在这个阶段持续成长成为管理的目标,知识管理成为管理的主题。

在知识管理中,集成(Integrate)和应用(Apply)组织知识(Organizational Knowledge)的能力是企业创造和维持竞争优势的关键[1-2]。

这主要是因为如果知识不能够被集成和共享,那么它对于实现组织目标来说价值就极其有限。

因此,知识的集成和应用就成为知识管理所面临的挑战[3]。

知识的有效集成和共享将对企业的长远发展起到关键性作用并能够提升企业竞争力[4]。

知识集成是组织获取知识所带来的收益并创造竞争优势的根本过程[5]。

这表明了知识集成具有非常重要的战略意义和实践价值。

迄今为止,关于知识集成的概念还没有统一的认识。

知识集成最早是由Demsetz在1991年提出的,而正式提出来的是Grant,他认为企业的重要作用就是进行知识集成,知识集成为企业创造了优势[6]。

2.知识集成的定义许多学者提出了自己的知识集成的定义,本文将介绍国外具有代表性的定义,并分析他们的共同点。

然后,根据我们对知识集成的理解,尝试给出一个具有知识集成主要特征的综合定义。

在基于资源理论、创新管理、组织学习等理论的基础上, Wernerfelt, Barney和Penrose提出了企业知识集成的观点,他们强调知识在企业中的应用。

Garud和Nayyar认为知识集成促进组织不同层面知识的传授、组合和整合。

通过集成和整合,专业的知识才能产生价值[7]。

Conner和Prahalad, Grant, Kogut和Zander认为组织的首要作用就是为知识提供集成的意境和手段,以生产产品和服务[8]。

Tiwana提出知识集成是一个项目团队通过实践将他们的组件知识(Component Knowledge)集成为在项目执行中的高层次的体系知识(Architectural Knowledge)。

知识集成也经常被认为是企业吸收能力(Absorptive Capacity)的一部分[9]。

Huang则认为知识集成是通过组织成员的社会交往持续进行共享信念的构建、积累和提炼的集体过程[6]。

知识集成意味着知识可以在需要的地方被交换、共享、发展、精炼等[10]。

因此,知识集成的概念可以从组织、团队和个人不同层面来理解。

从组织层面看,知识集成是组织为配合企业战略发展目标,选择来自市场多个供给主体1本课题得到国家自然科学基金(项目编号:60672031)的资助。

的知识流,并经整理、归类而纳入知识库,为员工和决策者共享和利用。

组织知识集成的目标是通过对组织知识的捕获、共享和集成,提高组织获取、使用和开发知识的能力,形成组织智慧,提高企业应变和创新能力。

从团队层面看,知识集成是将团队成员所掌握的个体知识与团队目标相结合,使每个成员在最大程度上贡献知识并享用其他成员的知识,同时形成面向具体任务的综合知识并在团队内部进行共享和应用,从而高效、优质地完成团体任务。

从个人层面看,知识集成是个人对其所掌握的隐性和显性知识进行内化而形成新知识的一个知识创造的过程。

综合而言,知识集成就是识别、获取并应用与完成日常工作或特定任务相关的组织内外部知识。

知识集成的目标就是打破知识壁垒/边界,解决组织中知识的孤岛,提高知识共享,产生新的知识并作为组织记忆存储,是对知识的利用,以及为知识的有效(包括效果和效率)共享和应用提供支持,从而提高组织的执行力和持久竞争力。

本文概括的知识集成概念为:知识集成(Knowledge Integration, KI)是指通过信息技术和业务过程的组合,以多种形式进行知识的表示、组织、获取、存储、使用和创新的过程。

3.本体为了解决知识集成中应用技术的多样性、统一性、标准性等问题,本体的发展为问题的解决带来希望。

本体原是表述哲学理论的一个术语。

17世纪初,西方哲学家提出本体论概念,认为本体论是关于存在及其本质和规律的学说。

18世纪初,本体论已在哲学界被广泛采用。

在20世纪的分析哲学中,本体论正式成为研究实体存在性和实体存在的本质等方面的理论。

可见,存在论本体是以体系化说明万事万物为目的,探究存在实体间的区别和关系的学说。

存在论研究的理论与体系等知识称之为本体。

3.1 本体的定义近10年来,本体的研究越来越为人们所关注。

根据参考文献[11-14]可以知道,本体通过对于概念、术语及其相互关系的规范化描述,勾画出某一领域的基本知识体系和描述语言。

本体的定义众说纷纭,比较有代表性的定义是:本体是共享概念模型的明确的、形式化的规范描述。

这包含4层含义:概念模型、明确化、形式化和共享。

“概念模型”指通过抽象出客观世界中一些现象的相关概念而得到的模型。

概念模型所表现的含义独立于具体的环境状态。

“明确化”指所使用的概念及使用这些概念的约束都有明确的定义。

“形式化”指本体能被计算机处理。

“共享”指本体中体现的是公共认可的知识,反映的是相关领域中公认的概念集,即本体针对的是团体而非个体的共识。

3.2 本体的应用和研究现状3.2.1 总体研究现状从总体上来看,当前对本体的研究包含3个层次上的内容[15]。

1)本体论工程。

其主要目的是研究和开发本体的内容,包括两个方面,其一是研究和创建特定领域的本体库,其二是研究和建立通用知识的(或常识知识的)本体库。

2)本体的表示、转换和集成。

研究用于表示各种本体的知识表示系统,提供形式化方法和工具,使所建立的本体能够方便地被共享和重用,提供不同的本体评价和比较框架,研究不同本体之间的转换方法和不同本体的集成方法,提供不同本体之间互操作的手段。

3)本体的应用。

主要研究以特定领域本体或通用知识本体为基础的应用。

图1 本体论研究与开发的层次图1展示了目前关于本体论研究与开发的不同层次上的工作。

其中,顶级本体主要研究非常通用的概念,如,空间、时间、事物、对象、事件、行为等等,它们完全独立于特定的问题或领域。

因此可以说顶级本体是在一个很大的范围内共享。

来自于工程、哲学、信息科学等领域的研究者组成了标准上层本体SUO(Standard Upper Ontology)研究组。

研究组于2000年10月向IEEE 提交7项目申请,并于2000年12月获准成立了SUO 工作组。

工作组的任务是详细定义一个上层本体的语法和语义,建立通用术语的定义和下层领域本体的基础结构;第二层的领域本体则研究与一个特定领域相关的术语或词汇。

在同一层上的任务本体则定义通用任务或推理活动,它们都可以引用顶级本体中定义的词汇来描述自己的词汇;第三个层次上的应用本体则描述特定的应用,它既可以引用涉及特定的领域本体中的概念,又可以引用出现在任务本体中的概念:最后一个研究层次是本体描述和操作语言,它为各个层次上的本体提供表示、开发和操作工具。

3.2.2 国外的应用和研究现状表1列举了国外对本体研究的主要项目[16],从本体论的目标和内容进行分类:项目1, 2, 6主要建立一般化的本体;项目3, 5, 7, 8, 10主要建立特定领域的本体。

其中8, 10侧重应用于企业信息集成:项目4, 9侧重讨论本体的一般性表示的建立。

表1 本体项目研究项目名称 项目描述 1 CYC Project[17] 适用于常识知识的一般化本体项目 2 Generalized Upper Model [18]面向一般任务和领域独立的本体项目 3GENSIM Project [19] 一般性的仿真系统本体项目 4KIF [20] 以描述性语义定义的本体语言 5PLINLJS Project [21] 表达陶瓷材料的机械属性的本体项目 6J.SOWA [22] 综合哲学见解的一般化的本体项目 7TOVE Project [23] 应用于企业建模的本体项目 8Enterprise Ontology [24] 应用于企业信息集成的本体项目 9KACTUS [25] 本体的形式和框架 10 UMLS Project [26]医学概念本体项目3.2.3 国内的应用和研究现状国内对本体的研究刚刚起步,主要有信息检索[27]、产品信息建模、虚拟企业建模[28]、常识知识库[29]等方面,如中国科学院计算机技术研究所大规模知识系统的研究[30]、中国科学院数学研究所常识知识库的研究[31]、浙江大学人工智能研究所基于本体论的产品信息集成研究等[32]。

4. 本体与知识集成本体的目标是捕获相关领域的知识,确定该领域内共同认可的词汇,通过概念之间的关系来描述概念的语义,提供对该领域知识的共同理解。

不同应用系统(包括不同组织)必须对隐含的知识有共同的理解才能真正共享信息,进行正确的交互和协作。

关键问题是如何将分散的知识整合为统一的组织知识以及如何确保组织知识的扩展性。

尤其是如何集成不同的独立的知识库和如何整合对于有着不同规范程度的相同知识的不同表示的整合。

Chandra等指出基于本体的技术能够提高系统的有效性和能力。

4.1 基于本体进行知识集成管理的有关研究Ontobroke[33]针对Web中或组织结构Intranet异构、分布的半结构化信息源,采用AI 技术以改进对这种信息源的访问,Ontobroker使用Ontology标记Web页面、规范化查询、推导查询的结果。

为了标记Web文档,结构化甚至封装Web文档,Ontobroker支持三个方面的语言:表示语言、标记(annotation)语言和查询语言,同时Ontobroker还依赖于两个工具:Web爬虫(WebCrawler)和推理引擎。

On2broker是对Ontobroker扩展的一种原型系统[34],On2broker 把查询和推理引擎分开,并把W3C的XML和RDF标准集成在内。

On2broker框架中包括了一个数据库管理器、一个信息Agent、一个查询引擎和一个推理引擎,在On2broker中,Ontology是总的结构化原则:信息Agent使用Ontology提取事实:推理引擎实际上是一个Agent,使用Ontology推理事实;数据库管理器对数据进行结构化;而查询引擎利用Ontology规范化查询。

相关主题