情报探索 第8期(总178期)
我国信息检索可视化研究现状与发展趋势分析
朱云霞
(南京人口管理干部学院信息科学系 江苏 210042)
摘 要:对近年来发表在国内期刊上有关信息检索可视化的文献进行了梳理,分析了国内有关信,g-检索可视化的研究现状 与主要研究内客,并对研究热点和发展趋势作了的归纳总结。 关键词:信息检索 信息可视化检索模型 中图分类号:G353 文献标识码:A doi:10.3969/j.issn.1005—8095.2012.08.038
0 引言
飞速增长的信息资源给传统的信息检索理论和
技术带来新的挑战。这些挑战使人们对信息检索的
有效性和交互性提出更高的要求。信息可视化能够
将隐藏在资源内部复杂的、抽象的语义以直观的图
形或图像的方式呈现,利用人能够快速识别这些可
视模式的自然能力,帮助用户更好地接受和理解信
息。随着信息检索从传统的以机器为中心转移到以
用户为中心,用户的信息需求、检索行为及体验评价
日益受到重视,成为改进检索效果新的突破口。逐渐
深入的用户认知模式和行为特征研究.以及不断涌 现的人机交互技术,为现代信息检索的发展提供了
有力的支持。信息可视化与信息检索之间存在着天
然的联系,可视化技术为信息检索提供了新的发展 空间。
本文在对国内近几年来发表的信息检索可视化
论文分析的基础上,试着梳理信息检索可视化研究
的主要研究内容,归纳该领域的研究热点和发展趋 势,以期为相关学者的研究工作提供帮助与参考。
1 信息检索及其可视化的概念和分类
1.1 信息检索 信息检索是情报学重要的研究领域。信息检索
指的是信息用户为处理解决各种问题而查找、识别、 获取相关的事实、数据、知识的活动及过程…。广义
的信息检索包括两个基础部分,即信息的组织与信
息的检索,其中信息组织是信息检索系统中最为重
要、不可或缺的部分。传统的信息组织强调信息资源
的有序化工作,典型的方法包括分类组织法和主题
组织法,组织实体也逐步由以文献为单位的信息单 元向以概念、主题为单元的知识组织过渡。可视化的
信息检索要求对信息资源采取全新的组织方式,以
更好地适应可视化的检索需求
I-2可视化
根据Mc Cormick等的观点,可视化是一种计算
的方法,用以将抽象的变成具体的,让研究员能够模
拟和估算,从而提供找出未知规律的一种方法,丰富
如以上代码所示,使用Range Object技术中的
Microsofl Text Range中的Selection对象对目标语句
通过CreateRange()方法进行初始化。实现在线书间
笔记与在线阅读分享时可以配合Textarea录入内
容.然后以文章ID为对应关系存储在数据库相关的
数据表内,例如本例子所建的数据表为UsersNote。
根据读者录入内容的权限为非公开或公开.决定本
次操作的功能为在线书问笔记或在线阅读分享。
实现划词信息查询时需要根据各个搜索引擎的
不同而对Selection对象的内容重新编码。本例子实
现了划词后连接本馆的OPAC、连接外部搜索引擎
Google Scholar和百度 这三个检索功能要求的URL
连接对检索词字符串进行URI编码处理,因此,定制
连接功能时对检索词使用EncodeURI()方法进行编
码.并嵌套在各检索连接的URL中。
4结束语
目前,自建数字文献资源库的使用只局限于内
112 容的发布和显示.功能单一。典型的是以资源为中心
模式。本文使用Range Object技术对自建数字文献
资源的功能进行扩充,主要目的是让读者在数字文
献资源的使用过程中处在中心地位,读者既是知识
的获取者,同时也是对知识进行二次创造和分享的
参与者.从数字资源的角度突出读者参与图书馆资
源建设的重要性。但不能回避的是.使用Range Ob—
iect技术也存在一定的局限性。就是只能在自建数
字资源中发挥作用。通过本文的论述与实践,希望能
把“以读者为中心”的模式更好的应用在自建数字文
献资源的开发与利用的过程中。 参考文献 [1] 中华人民共和围新闻出版总署.电子出版物出版 管理规定[EB/OL].[2012—02-20].http://WWW.gapp.gov.cn/ cms/cms/website. 『2] 张谦.张志彬.广东省高校网书馆数字文献资源读 者利用状况调研分析[J].深圳信息职业技术学院学报,
2006,4(3):78—82 2012年8月 朱云霞:我国信息检索可视化研究现状与发展趋势分析 第8期(总178期)
了科学研究的方式 ]。
可视化一般可分为科学可视化与信息可视化两
大类,其中与信息检索相关的属于信息可视化范畴。
IEEE信息可视化专题会议上将信息可视化定义为 “它不仅仅是一个计算方法,更是一个过程,它将信
息转换成视觉形式,使人们可以观察、浏览、理解信
息”.“它的典型形式是用计算机进行信息处理,通过
计算机屏幕用交互式的图形、图像和可视化形式观
察信息”[ 。目前信息可视化已经成为图情领域的研
究热点。 1.3信息检索可视化
研究表明.人们获取的信息70%来自视觉,20% 来自听觉,10%来自触觉,将信息检索与可视化技术
结合也正好吻合人们对信息感知特点,提高人的信
息认知能力。信息检索可视化是把文献信息、用户提
问、各类信息检索模型以及信息检索过程中不可见
的内部语义关系。展示在一个低维的可视化空间中,
并向用户提供信息检索服务[4]。 张进博士将信息检索可视化分为三种模式:第
一种模式,即提交初始检索式到信息检索系统,将搜
索的结果进行可视化;第二种模式,即对数据集进行
可视化展示,用户在可视化环境下提交检索需求;第
三种模式.即仅有信息浏览的模式 ]。而通常我们习
惯性地将信息检索可视化分为检索过程的可视化与
检索结果的可视化。
2信息检索可视化的研究现状
信息检索一直是情报学重要的研究领域,近年
来随着可视化技术研究的升温,有关信息检索可视
化研究也日趋受到学者的关注。首先是从期刊发文 量上充分证明了这一点。笔者2012年1月5日在
CNKI中以主题“信息检索”&“可视化”进行检索,共
查到文献178篇.图1显示了该领域2000~2010年
的发文量情况(因2011年统计数据不全,故未被列
为对比性数据)。
30
25
—20 理
15
l0
0
0 其次是逐步形成了一支具有一定影响力的学术
研究群体.学术研究机构数量也在不断扩大。利用文
献计量法,对信息检索可视化研究领域的发文作者
及其所在机构作一统计,主要学者有张学福、周宁、
张进、孙巍、陈颖、冯小琴、张会平、曹锦丹、李春旺和
隆捷等,主要研究机构有黑龙江大学、武汉大学、中
国科学院文献情报中心、华中师范大学、中国科学院
国家科学图书馆、中国科学技术信息研究所、北京师
范大学、哈尔滨工业大学、北京大学信息管理系和吉
林大学。 再次是研究的范围不断扩大,研究内容不断深
入.从简单的文本信息检索发展到多媒体信息、语义
信息的检索,从早期的国外技术追踪报道,到目前逐 步建立起一定的理论研究框架,在技术开发与系统
应用方面取得了较大发展,实践性研究层出不穷,并
不断与多种学科主题交叉融合。图2是由万方科技
创新辅助决策支持平台提供的《科技创新辅助决策
支持报告——主题分析报告》所得,即为信息检索可
视化研究与其他主题学科渗透性示意图。图2表明,
信息检索可视化研究与工业技术和文化、科学、教
育、体育的渗透性较好。
3信息检索可视化的研究内容 在对信息检索可视化领域研究文献阅读和综合
分析的基础上,将该领域近年的主要研究内容作一
介绍。
3.1理论研究方面
张学福 2o06年在中国图书馆学报上,论述了 信息检索可视化研究的基本问题,主要包括:信息检
索模型、信息内容描述、可视化映射技术、可视化显
示技术、聚类分析、全局映射与局部映射以及实时可
视化与人工参与的可视化等。黄丰¨6 介绍了信息可
视化的检索模型、应用及未来发展趋势,从信息资源
的特征出发研究信息可视化问题,并简单讨论了信
息可视化的发展趋势。周宁 等认为尽管映射技术
2 。
19 / /
, 1
卜
◆ ... . ..
2000 200 1 2002 2003 2004 2005 年份 图1 信息检索可视化研究历年发文量 可产生能忠于大量数据信息结构的可
视化显示形式,但可视化显示仍将依赖
于可视化显示是否有接近于用户经验
和知识的最佳描述。张学福隅 提出了基
于知识模型的信息检索可视化模型的
系统设计原则和体系结构,利用信息资
源的元数据信息来进行可视化检索。张
进I9]介绍信息检索可视化的模型主要
有多参考点模型、欧几里德空间特征模
型、自组织图、路径搜寻相关网络模型
和多维尺度模型。这几种方法是目前可
视化中比较成熟、主流并且被广泛应用
和认可的方法,同时也是信息检索可视
化中具有代表性的方法
113 2012年8月 情报探索 第8期(总178期)
其 他 主 嫌台蛙豳斗S 环魄 鞋安垒嗣学 虢棼航天 变通运输 工业捷术 农业籽学 匿薯卫生 生 掌 天文'枣 地球鹅攀 数璎鞫掌和化掌 韪撼籽学慧诧 历史 地穗 题艺术 文举 语肖、文掌 科 交化、摹碍芍 辍肖、幅胃 经济 军事 霹 措 蠢藤 社盎剁掌息论 髀 耳免思主义、珊宁主义、毛褥累 . i 0 黼曦卫 |0 氇
色 t 强蠹 强秘稻 2 |0
0 疆 0
0 鼹1 0 1
与其他学科交叉篇数(篇) 图2主题学科渗透性示意
3.2技术介绍方面 张学福[5]认为的可视化显示技术有Focus+Con— text技术、Tree—map、Cone Tree以及NicheWork法。
其中NicheWork采用3种布局方式:圆、六角形和
树,特别适合大型数据结构的显示。陈艳n。。讨论了可
视化基本技术、面向不同信息类型的可视化技术以
及面向网络及大规模信息资源的可视化技术。并在
此基础上分析了两个具有代表性的可视化信息检索
工具。孙巍等… 分析了基于引文的信息检索系统、可
视化系统及检索可视化系统3类系统的评价标准,
从14个方面对6个典型系统进行深入的比较分析,
找出现有的基于引文的信息检索可视化系统存在的
一些不足。曹艳ll2 讨论了信息可视化交互和视觉设
计.结合Aquabrowser Library,阐述了信息可视化在
图书馆OPAC中应用的意义,讨论了书目信息检索
与信息可视化技术融合需关注的一些问题。王畅[13 3
以EBSCOhost2.0为例,介绍了可视化信息检索技术
的基本概念、应用于信息服务中的优势及其功能。刘
姝_I4]介绍了知识可视化的基本概念,以3个例子重
点阐述了知识可视化在北京大学图书馆信息检索中
的实际应用,并对如何深化可视化在信息检索中的
应用提出了建议。周宁等l15 讨论了文献检索结果如
何通过可视化形式提供,内容涉及基于词频分析和
基于图的检索结果可视化,从Java Applet技术运用
的角度.阐述了实现文献检索结果可视化的过程。窦
淑庆 结合信息检索与计算机技术,阐述了图书馆
可视化文献检索系统设计的理论方法和实际意义,
并进行了可视化文献检索系统的设计。洪菀吟 将
信息可视化应用于多语言检索环境,提出一个多语
言信息检索系统可视化模型及其设计方案,并指出
该领域未来的发展方向。
3-3 系统开发方面
114 张会平等 将把信息可视化
的相关方法和技术应用到跨语言
信息检索中,提出了一个跨语言信
息检索可视模型,并给出了一个原
型系统加以验证。颜端武等 针对
军用飞机的领域本体,基于Java开
发平台.设计和实现了可视化的检
索界面。陈颖等 说明了新的信息
环境下将共词分析方法与信息检
索可视化技术相结合的必要性.设
计并实现了基于共词分析的中文
信息检索可视化系统。戴超凡等112o:
针对传统研讨信息静态可视化视
图杂乱、难以辨认等问题,提出研
讨信息可视化框架和基于交互式 可视化技术的解决方案。利用
Java、XML技术,借助JFreeChar、Prefuse软件包实现
交互式可视化平台 该平台基于节点链接结构,允许
用户交互式操作,支持可视化检索和分析。
由上述研究内容可以看出。目前国内对信息检
索可视化研究主要还集中于理论性的探讨与国外先
进技术的介绍。例如信息检索可视化的模型构建、可
视化的基本技术、不同可视化检索系统的比较、信息
检索可视化的应用意义等,而对于实际应用系统开发
的研究还非常缺乏,技术也很不成熟,研究只是针对
某一领域或某一具体方法展开,目前国内还没有将可
视化与信息检索技术很好融合的通用性检索平台。
4信息检索可视化研究的热点与趋势
通过对近年来信息检索可视化研究的文献调
研,不难看出信息检索可视化正逐步从理论研究向
实践性研究过渡。通过文献内容分析与关键词共词
分析等方法,现将该领域的研究热点与发展趋势作
一归纳总结。
(1)信息检索可视化模型研究。信息检索可视化
的核心是信息检索可视化模型的多样性,采用优秀
的可视化模型和算法,能够在有限的可视空问中将
对象的主要属性进行展现。
(2)可视化映射技术研究。因对象属性的高维和
对象问关系的复杂,可视化必须考虑降维处理。降维
的本质与信息映射是一致的,目前可视化映射的主
要技术有主成分分析法)、多维尺度度量、自组织映
射、潜在语义索引等,针对不同的信息资源,必须考
虑不同的降维技术。
(3)语义化检索的可视化研究。随着语义网的不
断发展,语义化工具日趋普及,语义化信息检索是信
息检索的重点研究方向,语义的可视化表达成为新
的研究内容,例如将本体技术与可视化检索进行结
合。在构建本体的同时即考虑到本体的可视化问题。