第六章检索策略的制定与优化
灵活使用同义词和近义词。
如何正确使用关键词与主题词
例1:城市生活污染研究 • 关键词: • 城市(都市、城区) • 生活污染(生活污水、生活垃圾、电磁辐射污染等) 例2:有关室内装修污染方面的研究 • 关键词:室内、装修、污染 • 同义词或近义词: 室内(住宅、居室、房屋) 污染(放射性、化学、氡气、甲醛、苯等)
四、如何制定检索策略
分析主题内容,确定正确的检索词(关键词或主题词) 正确选择各种算符,如逻辑算符,位置算符,截词符,字段限定符 等,编制合理的计算机检索式。 分析学科范畴,以便确定所要检索的学科领域,提高查全率。 确定检索年代、文献类型 选择检索方法
确定检索的信息源(包括中外文数据库和网络资源等)
1.分析主题内容,确定检索词
正确的主题分析是制定检索策略的保证,它决定了检
索策略的质量和检索效果的好坏。因此,务必要掌握好所
检课题的内容实质,然后概括出能最恰当地代表主题概念 的检索词。
选择检索词时应考虑将课题内容分解或综合成某些
概念,提炼核心概念,发掘隐含概念,排除非核心与宽
泛概念,力求检索词能反映用户信息需求和检索主题内 容。 应遵循主题词(规范性的受控词)优先,关键词、 自由词配合使用的原则。
《中图法》分类表
4. 分析检索年代以及文献类型
• 用户的检索目的和要求是多种多样的,是撰写学位论
文,还是申报科研课题,是技术革新还是成果鉴定,
目的不同,检索的策略和范围也不同。检索要求主要 反映在用户对命中文献的类型、语种及所需文献的年 代等不同。
5.选择检索方法
常用法:顺查法、倒查法及抽查法
如:遥感和地理信息系统用于监测热带雨林 关键词:热带雨林 地理信息系统(GIS) 遥感 监测 主题词:地理信息系统 遥感 环境遥感 森林遥感 环境监测 组配词:应用
下面以EBSCO全文数据库EI和CSA数据库为例比较主题词与关键词
图1
图2
图3
2. 正确运用各种算符,构建计算机检索式 逻辑运算符 AND OR NOT AND (中文用* + -表达) 截词算符(* ?!$等等) 位置算符(NEAR W/N PRE/N等等) 字段限定算符(TI KW SU AU AF JN等等) 短语算符 “ ” 括号算符 ( )
确定检索策略以及评价检索效果的依据。
• 不同类型的课题,其信息需求的范围和程度也不 尽相同。 • 例如,申请发明、申报成果奖励、鉴定及立项类 的查新课题,往往需要全面地收集某一主题范围 的文献信息,这类课题具有普查、追溯的特点, 应着眼于查全;而对于科研、生产中为解决某一 特定问题的攻关课题,往往只要求检出的信息对 自己的研究有所帮助,而对查找的文献范围不需 要很广。因此,这类课题则要求查准。
利用所查到的这批文献后面的参考文献追溯检索的方
法。
使用这种方法检索文献时,最好先获取几篇与研 究课题有关的综述文献,因为综述文献所附参考文献 较多,可视作小型情报源。但用此种方法检索容易漏 检,所查文献很不全面,往前追溯的年代越远,所获
得的文献就越陈旧。
科学引文法 从被引用作者的文献查找引用作者的文 献的方法。这种方法可以通过先期的文献被 当前文献的引用,来说明文献之间的相关性 及先前文献对当前文献的影响力。我们可以 以某一特定论文的作者为线索,从被引用作 者追溯检索引用作者的文献,了解同行的研 究状况,达到扩大检索的目的。
• 检索结果表明:
检索词的选择、逻辑算符的使用、同义词近义词的
扩展、检索字段的选择等变化,对检索结果数量的 多少、检索的查全和查准有很大影响
3. 分析学科范畴
分析课题研究的学科范畴,目的是确定所要检索 的学科领域,提高查全率。 信息用户的文献需求一般分为四种类型
了解学科发展动态的要求 了解某一研究主题的片断性信息 了解某一研究主题的全面性信息 检索特定的文献信息
率较低。
倒查法 它是一种逆时间顺序,由近及远的往前追溯查找 文献的方法。检索时,从当前开始,逐年向前,进行 查找,直到查到的结果满意为止。这种方法主要适用 于一些前人没有研究过的新课题;或者前人虽然已经 作过研究,但现在仍有研究价值;或者时科技工作者 在工作中碰到了问题需要解决,查找解决问题的办法。 运用倒查法查找文献,比顺查法节约时间,检索效率 较高。但对于有些课题,特别是带有周期性的或阶段 性研究的检索课题,如果未查到研究阶段,容易造成 漏检。
抽查法
是针对某一学科的发展特点,在发表文献 用以解决要求快速检索的课题。由于学科发展
的高峰期,发表文献数量也较多,这种方法可
较多的一段时间内(几年或十几年)进行检索,
以在较短的时间内检索倒较多的文献,但前提
是必须实现了解该学科和课题研究发展的历史
背景。
参考文献法
利用文献后面附的参考文献查找到一批文献,又
二、检索策略制定的原则
快,即从检索请求的提出到检索结果的提交要快速;
准,即检索结果要准确,避免检索出过多无关内容;
全,检索结果全面,满足用户的需;
效益原则,即以最低的费用获取所佳的信息。
三、检索策略的实施技巧
信息需求是人们客观上或主观上对各种情报 信息的一种需求。这种需求是人们索取情报信息 的出发点,也是计算机信息检索时选择数据库、
网上免费资源的获取
访问数据库的镜像站点 进入清华大学图书馆、北京大学图书馆或上 海交大图书馆等镜像服务站点检索:如"EI、CSA、 Elsevier Science等数据库 CALIS网站—中国高等教育文献保障系统 ( China Academic library & Information System) /
追溯法:参考文献法和科学引文法两种
循环法:分段法或综合法
顺查法 是从用户要求查找的起始年代,或从课题分析 所得出的该课题研究的起始年代开始,顺着时间的
推移由远及近的查找文献的方法,运用这种方法查
找文献,查找的文献比较全面、系统、可靠,查全
率比较高,在一定程度上可以反映该课题研究发展
的全过程。不足之处是耗时费力,劳动强度大,效
镜像数据库:数据资源在我馆,访问速度快且比较 全面、准确 国内访问权:数据资源在国内网络种,访问速度稍 慢,如镜像站点设在清华大学图书馆、上海交通 大学图书馆或北京大学图书馆等。 国际访问权:数据资源在国外网络种,用户终端需 具有国际访问权。 注意:由于版权问题,许多数据库只能为我校读者 提供访问服务,校外读者在使用这些数据库时, 会出现访问权限的控制问题。
为实现检索目标而实施的方法。也就是为满足信息需求所制定的一 系列检索方案。
计算机信息检索,实质上由计算机将输入的检索策略与系统中存贮
的文献特征标识及其逻辑组配关系进行类比、匹配的过程。由于信息需求 本身具有不确定性,加之对数据库中的文献特征标识不能充分了解,以及 系统功能的某些限制,都会不同程度地影响检索效果。但是只要遵循一定 的检索步骤,制定良好的检索策略,便可以减少各种不利因素的影响,尽 可能地使检索提问标识与信息需求和检索系统保持良好的一致性,从而在 系统中检索出满足用户需求的信息。最终达到优化检索过程,提高检索效 率,全面、准确、快速、低成本地找到所需信息的目的。
例二 城市交通基础信息系统研究 1)城市交通基础数据的快速获取与管理方法 2)交通出行行为特征分析与行为模型构建 3)多元、异构城市交通数据的融合、知识发现 与动态预测 4)支持城市交通战略决策的专题信息提取、表 达与信息发布方法 5)区域性城市交通基础信息示范系统。 城市*交通信息*(挖掘+预测+编码+共享+融合+获取) Information System AND (Transportation OR Traffic) AND (Urban OR Town) AND (Data Mining OR Data Discovery OR Encoding OR Sharing OR Data Fusion)
概念平行、 并列
OR 或+
土地管理与土地利用 A B
A OR B A+B
扩大检索范 围 提高查全率
提高查准率
某一主题去掉 一部分相关主 题
NOT非-
除光电测距以外的 A 电磁波测距 B
B NOT A B-A
示例1:
(城市 OR 都市 OR 城区) AND (TI=生活污染 OR 生活垃 圾 OR 生活污水 OR 电磁辐射污染)
布尔逻辑 (Boolean Logic)“与”(“AND”)、“或”(“OR”)、“非”(“NOT”)
A and B and C
A or B or C
(A or B)not C
检索要求
逻辑检索
课题
表达式
检索结果
概念相交、 限定
AND与*
计算机用于制图
A
B
A AND A*B
B 缩小检索范 围 提高查准率
献类型、技术含量、数据的存贮年限、更新频率、
检索费用以及使用方法等。
馆藏电子资源 免费网络资源
馆藏电子资源—武汉大学图书馆已购的数据库
中文、外文数据库 全文型与文摘型数据库 免费试用数据库 专题数据库 光盘及联机数据库 以上各种类型的数据库根据购买方式的不同 又可分为镜像数据库、国内访问权及国际访问权 数据库
第六章
检索策略的制定与优化
武汉大学图书馆信息科学分馆
计算机信息检索的具体步骤
分析检索课题,制定切实可行的检索策略(出发点和依据)
利用检索系统特定的指令正确实施检索 通过人-机对话的方式不断调整、修改、检索策略 根据查找的文献线索获取原始文献
检索策略的制定与优化
一、什么是检索策略
溯法的结合。采用这
种方法查找文献时,先利用
检索工具查出一批相关信息,然后利用这些信息所