国内主题地图研究综述[摘要]作为一种新兴的知识组织技术——主题地图,在国内外得到了广泛的研究和应用。
利用文献调研法对国内关于主题地图的相关研究进行详细调研;采用内容分析法对这些研究内容进行深入分析。
在此基础上,揭示国内关于主题地图的研究现状,为主题地图在国内的应用和发展提供一些参考和启示。
[关键词]主题地图知识管理知识组织信息检索知识导航1引言主题地图(topic maps),又名主题图,是一种数字化知识组织技术,主要用于信息管理和信息交互领域,它既可以揭示信息资源知识概念之间的相互关系,又可以定位知识概念所在的位置,被誉为信息世界的全球定位系统(navigation satellite timing and rangingglobal position system,gps)。
主题地图的思想最早起源于书后索引的合并,最初的模型定义于1992年,使用的是hytime 标准,出现在由gcari(graphics communications association research institute)研究所赞助的“hytime应用公约”(conventions for the application ofhytime,capri)项目中。
后来主题地图模型由iso国际标准组织逐渐细化并最终形成iso 13250。
在国际标准iso 13250:2003中,主题地图被定义为“一套用来组织信息的方法,使用这种方法可以提供最佳的信息导航”。
作为一种知识组织技术,主题地图提出了一种以主题作为基础的元数据组织和描述方式,能够为用户提供语义层次的信息导航;而作为一种知识表示语言,它与可扩展标记语言xml(extensible markuplanguage,xml)的结合使得它在知识组织、知识导航和语义网领域得到了广泛的应用,它的这些特性能够帮助人们在信息知识时代更加充分有效地组织、检索与利用信息资源。
因此,通过对国内主题地图相关研究文献进行统计并进行深入的内容分析,揭示出目前国内主题地图的研究现状对于我们充分有效地利用主题地图是十分必要的。
2国内主题地图研究现状本次调研以cnki中国学术文献网络出版总库、万方数据资源库、维普中文科技期刊数据库作为来源数据库,以“主题地图”或“主题图”为关键词进行检索,经过整理,得到主题地图相关研究文献共110篇,其中期刊文献85篇、学位论文22篇、会议文献3篇。
从发文时间上,可以看出国内关于主题地图的研究始于2003年,2006年、2008年和2010年是研究的高峰时期,其中,2006年、2008年各为17篇,而2010年则为22篇。
从刊载主题地图研究文献的期刊分布上可以看出,主要研究力量集中在图书馆学情报学学科领域,其次是计算机学科领域,还有一些其他学科如教育、地质学科等,但这些学科研究相对较少。
关于主题地图的研究内容主要划分为两大部分:主题地图的基础理论研究和应用研究。
其中,基础理论研究部分主要涵盖了对主题地图的基本结构和核心概念、主题地图与其他知识组织技术的比较与互操作以及主题地图的技术工具的研究。
基于对国内主题地图应用研究相关文献的关键词统计分析可以看出,国内关于主题地图的应用研究主要分布在知识管理、知识组织与信息检索、知识导航三大领域。
2.1主题地图的基础理论研究2.1.1主题地图的基本结构和核心概念主题地图的基本结构是在独立于信息资源之外建立了一个信息资源索引,构建了一个结构化的语义网,并通过通用资源标志符(uniform resource identifier,uri)将信息资源与信息资源索引连接起来。
它的核心要素包括三个部分:主题、关联和信息资源实体。
在主题地图中,除了上述三大核心要素之外,还有三个不可忽视的部分,即主题身份识别、分面和范围。
主题地图的基本结构如图1所示:关于主题地图的基本结构和核心概念,国内学者基本都参照国外研究者所自发成立建设的主题地图网站topic 中关于主题地图的基本结构和核心概念的介绍,即主题地图是一套用来组织信息的方法,使用这种方法可以提供最佳的信息导航,它既可以定位某一知识概念所在的资源位置,也可以表示知识概念之间的相互关系,一个主题地图就是一个由主题、关联和资源实体所组成的集合体。
如艾丹祥和张玉峰的《利用主题图建立概念知识库》,黄晓斌的《网络主题图的原理及应用》,秦铁辉和郭延吉等人的《信息时代的“全球定位系统”——主题地图》等,他们都对主题地图的基本结构和特点、核心概念、主要功能和应用进行了详细的介绍。
在关于主题地图的基本结构上,国内研究文献大都是对主题地图的核心要素即主题、关联和资源实体进行了详尽的介绍,而关于主题地图其他几个要素如主题身份识别、分面和范围则研究较少。
2.1.2主题地图与其他知识组织技术的比较与互操作在主题地图的基础理论研究领域,除了其基本结构和核心概念之外,另一个研究热点就是主题地图与其他知识组织技术的比较与互操作。
首先是rdf(resource description framework),它作为w3c提出的一种知识表示模型,与主题地图之间既有相同之处,也有相异之处。
张佩云和吴江等人将rdf标准与主题地图之间的相同点概括为:提出的背景相似,都提供了抽象的元数据模型来描述信息,都基于xml 交换和结构,都有一个类似面向对象的程序设计和建模系统的类系统;将两者的不同点则归纳为技术的根源不同、数据模型不同以及处理信息的方式不同等方面。
刘茜认为主题地图与rdf的不同主要体现在不同的基础和观点(主题地图的基础是传统的查询辅助工具,而rdf的基础是形式逻辑和数学图形理论),辩证的相对的观察点,不同的语义程度,角色和方向,n元关系以及范围和多种语言上。
关于rdf与主题图之间的互操作,吴江和张佩云等人认为可以进行基于模型(model-based)的映射。
刘茜则提出rdf和主题地图在具备互操作的基础(即两者都定义了基于xtm的抽象模式和交换语法)上,可以通过模式模拟和模式映射两种方式来实现互操作。
张玉涛对国外主题图和rdf的数据互操作方法进行了详细的研究分析,从互操作研究发展阶段的角度进行了梳理,首先是侧重语法层面的对象映射,其次是侧重语义层面的语义映射,最后是侧重实际操作层面的本体映射。
他将主题图和rdf互操作存在的问题归纳为以下6点:①如何更好地平衡转换结果的语义性和实用性;②如何建立一种兼容机制满足不同语义层次的需要;③通用映射词表的完善和标准化问题;④主题图中的关联和rdf的statement的映射问题;⑤主题地图合并时所带来的问题;⑥如何兼容两者更高层次的规范及实现两者高层标准的转换。
除了rdf之外,主题地图与其他知识组织方法如索引、叙词表、概念图以及分类法之间也存在着异同。
马建霞在《主题图技术与相关知识组织方法的比较研究》一文中对主题地图与这些知识组织方法进行了详细的比较分析。
她认为主题图吸收了索引中的基本思想,并在联系类型和合并机制上比索引更进一步;与叙词表相比,主题图吸收了叙词表在词汇控制方面的思想,所表达的概念之间的关系更为具体;主题图与分类法相比在定义关联上更具有优势;与概念图相比,主题图不仅是知识组织工具,还是一种知识表现工具,可以提供以被机器理解和处理为目标的标记语言标记的文件方式。
2.1.3主题地图技术工具研究主题地图的技术工具是实现其高效的知识组织、知识表示及知识导航的重要桥梁。
目前国外已经开发出一系列的主题图技术工具,主要分为三大类型:主题地图引擎、主题地图编辑器以及可视化工具。
目前已经开发完成的主题地图引擎包括:omnigator、tm4j、tmproc(不支持xtml.0)、semantext、goose works topic map toolkit、perl xtm;主题地图编辑器包括:tmtab、topincs、tm4l editor viewet、atop、wandora;可视化工具包括:xsiteable、tmview、startree、topic map designer、the“v”topic mapbrowser、gnowsys、panckoueke、tm3d。
在主题地图技术工具中,有的是集主题图引擎、编辑器和可视化工具为一体的综合性工具,有的则只具备其中的一项功能。
如ontopia公司开发的oks samplers就是集引擎、编辑器和可视化工具为一体的主题图工具。
tm4j(topic maps for java)就是一种开源主题图引擎。
国内有部分学者专门对主题地图的一些技术工具进行了研究,主要是tm4j和ontopia。
关于tm4j,朱良兵和赵金海、满红芳等人都进行了详细研究。
他们都对tm4j的功能、特征以及基本结构进行了详细的介绍,但不同的是,朱良兵在分析tm4j的基本体系结构、主要类和核心接口的基础上,对tm4j的应用案例进行了详细的讲解分析;赵金海和满红芳等人则重点阐述tm4j的主项目、子项目组成结构以及其界面层、基本执行层、合并执行层和兼容层等。
关于开源主题图引擎ontopia,李清茂对其工作机制进行了全面分析,他在分析oks知识组件和ontopia体系结构的基础上,深入分析了引擎api的主要开发包、核心接口之间的构成关系和实现形式。
2.2主题地图的应用研究随着主题地图的引进与研究,后来有些研究者逐渐开始尝试使用一些国外的主题地图技术工具进行小范围的实验性研究,以期在试验基础上对主题地图的应用领域进行分析和总结,这也是国内研究者对于主题地图进行研究的主要方式。
2.2.1知识管理知识管理从狭义上讲,是对知识本身的管理,包括对知识的创造、获取、加工、存储、传播和应用的管理;从广义上讲,不仅包括对知识的管理,还包括对于知识有关的各种资源和无形资产的管理。
主题地图在知识管理领域的应用主要体现在狭义的知识管理概念层次上,由于主题地图能够为用户提供一个标准的技术方法来构建和分享知识,并且能定义复杂的、变化的知识结构,以元数据的形式体现和表现知识,因此能够使知识的获取、加工、存储和传播过程更加高效,使用主题地图的知识管理系统能够清晰地揭示知识本身的特征以及知识资源之间的相互关联。
关于主题地图在知识管理中的应用,国内学者从不同的角度对其进行了研究。
吴振华认为topic maps是知识组织和知识呈现的有力工具,利用主题地图建立和导航资源库,能够方便资源检索提高资源的利用率,他将主题地图在知识管理应用的领域归纳为商业出版、网站建设、企业应用和教育资源库建设。
张佩云和孙亚民等人提出了一个基于主题地图的知识管理系统模型,从本体论的角度,结合元数据技术,对企业中存在的大量知识进行知识类型描述、信息抽取与表示等,用以提高企业知识的共享、重用以及有效检索。