检索策略的制定与优化
二、检索策略制定的原则
快,即从检索请求的提出到检索结果的提交要快速;
准,即检索结果要准确,避免检索出过多无关内容;
全,检索结果全面,满足用户的需求;
效益原则,即以最低的费用获取所佳的信息。
三、检索策略的实施技巧
信息需求是人们客观上或主观上对各种情报 信息的一种需求。这种需求是人们索取情报信息 的出发点,也是计算机信息检索时选择数据库、
确定检索策略以及评价检索效果的依据。
• 不同类型的课题,其信息需求的范围和程度也不 尽相同。 • 例如,申请发明、申报成果奖励、鉴定及立项类 的查新课题,往往需要全面地收集某一主题范围 的文献信息,这类课题具有普查、追溯的特点, 应着眼于查全;而对于科研、生产中为解决某一 特定问题的攻关课题,往往只要求检出的信息对 自己的研究有所帮助,而对查找的文献范围不需 要很广。因此,这类课题则要求查准。
溯法的结合。采用这
种方法查找文献时,先利用
检索工具查出一批相关信息,然后利用这些信息所
附的参考文献进行追溯检索,由此获得更多信息。
这种方法是目前比较实用的一种立体式检索方法。
6. 确定检索的信息源
在分析检索课题,明确检索要求的基础上,
必须综合考虑检索系统的特点、收录的学科范围、
各数据库的专业范围、主题内容、数据来源与文
例如要查找重点实验室龚健雅教授2000年以来发 表的学术论文引用和被引用情况
参考文献
通过比较早期的文献信息可以检索到近几年同行引 用的情况,获得最新研究状况。再以引用文献为被 引文献进一步检索,这样不断地追溯检索,扩大检 索范围,获取更多更新的文献信息。
被引文献
循环法: 循环法也称为分段法或综合法,是常用法和追
1.分析主题内容,确定检索词
正确的主题分析是制定检索策略的保证,它决定了检
索策略的质量和检索效果的好坏。因此,务必要掌握好所
检课题的内容实质,然后概括出能最恰当地代表主题概念 的检索词。
选择检索词时应考虑将课题内容分解或综合成某些
概念,提炼核心概念,发掘隐含概念,排除非核心与宽
泛概念,力求检索词能反映用户信息需求和检索主题内 容。 应遵循主题词(规范性的受控词)优先,关键词、 自由词配合使用的原则。
镜像数据库:数据资源在我馆,访问速度快且比较 全面、准确 国内访问权:数据资源在国内网络种,访问速度稍 慢,如镜像站点设在清华大学图书馆、上海交通 大学图书馆或北京大学图书馆等。 国际访问权:数据资源在国外网络种,用户终端需 具有国际访问权。 注意:由于版权问题,许多数据库只能为我校读者 提供访问服务,校外读者在使用这些数据库时, 会出现访问权限的控制问题。
《中图法》分类表
4. 分析检索年代以及文献类型
• 用户的检索目的和要求是多种多样的,是撰写学位论
文,还是申报科研课题,是技术革新还是成果鉴定,
目的不同,检索的策略和范围也不同。检索要求主要 反映在用户对命中文献的类型、语种及所需文献的年 代等不同。
5.选择检索方法
常用法:顺查法、倒查法及抽查法
如:遥感和地理信息系统用于监测热带雨林 关键词:热带雨林 地理信息系统(GIS) 遥感 监测 主题词:地理信息系统 遥感 环境遥感 森林遥感 环境监测 组配词:应用
下面以EBSCO全文数据库EI和CSA数据库为例比较主题词与关键词
图1
图2
图3
2. 正确运用各种算符,构建计算机检索式 逻辑运算符 AND OR NOT AND (中文用* + -表达) 截词算符(* ?!$等等) 位置算符(NEAR W/N PRE/N等等) 字段限定算符(TI KW SU AU AF JN等等) 短语算符 “ ” 括号算符 ( )
实例分析
例一 村镇信息快速采集与处理关键技术研究
主要研究基于低空遥感平台的村镇空间基础信息采集和处 理技术,建立基于无人驾驶飞艇和系留式气球的低空多传感器 集成空间信息快速采集平台,研发低空遥感地形测绘系统;研 究地面多基线摄影的信息采集与处理技术,开发村镇小范围地 形地物基础信息获取系统硬软件,实现村镇道路、住房、民俗 旅游景点、古建筑与文物等空间信息的快速采集与处理;研究 村镇遥感专题信息自动提取技术,实现不同影像的自动配准与 融合和村镇建筑物、水体、道路、农田等专题信息的快速提取。 (地面遥感+低空遥感)*空间信息 (飞艇+气球+轻型飞机+飞行器)*低空遥感*(数据采集+数据 处理)
网上免费资源的获取
访问数据库的镜像站点 进入清华大学图书馆、北京大学图书馆或上 海交大图书馆等镜像服务站点检索:如"EI、CSA、 Elsevier Science等数据库 CALIS网站—中国高等教育文献保障系统 ( China Academic library & Information System) /
抽查法
是针对某一学科的发展特点,在发表文献 用以解决要求快速检索的课题。由于学科发展
的高峰期,发表文献数量也较多,这种方法可
较多的一段时间内(几年或十几年)进行检索,
以在较短的时间内检索倒较多的文献,但前提
是必须实现了解该学科和课题研究发展的历史
背景。
参考文献法
利用文献后面附的参考文献查找到一批文献,又
追溯法:参考文献法和科学引文法两种
循环法:分段法或综合法
顺查法 是从用户要求查找的起始年代,或从课题分析 所得出的该课题研究的起始年代开始,顺着时间的
推移由远及近的查找文献的方法,运用这种方法查
找文献,查找的文献比较全面、系统、可靠,查全
率比较高,在一定程度上可以反映该课题研究发展
的全过程。不足之处是耗时费力,劳动强度大,效
利用所查到的这批文献后面的参考文献追溯检索的方
法。
使用这种方法检索文献时,最好先获取几篇与研 究课题有关的综述文献,因为综述文献所附参考文献 较多,可视作小型情报源。但用此种方法检索容易漏 检,所查文献很不全面,往前追溯的年代越远,所获
得的文献就越陈旧。
科学引文法 从被引用作者的文献查找引用作者的文 献的方法。这种方法可以通过先期的文献被 当前文献的引用,来说明文献之间的相关性 及先前文献对当前文献的影响力。我们可以 以某一特定论文的作者为线索,从被引用作 者追溯检索引用作者的文献,了解同行的研 究状况,达到扩大检索的目的。
示例2: 有关“企业知识产权研究”
检索式 (*表示AND,+表示OR,限定篇名字段) 1 企业知识产权 2 企业*知识产权 3 (企业+集团+公司)* 知识产权 4 (企业+集团+公司)* (知识产权+专利权 +商标权+著作权+名称权) 5 (企业+集团+公司)* (知识产权+专利权 +商标权+著作权+名称权)* 保护 137 (缩小范围效果最佳) 检索结果 (2004-2006) 191篇(准确度最高漏检大) 404 (漏检率较高 ) 466 520 (适合综述性文献) (查全率查准率较高)
四、如何制定检索策略
分析主题内容,确定正确的检索词(关键词或主题词) 正确选择各种算符,如逻辑算符,位置算符,截词符,字段限定符 等,编制合理的计算机检索式。 分析学科范畴,以便确定所要检索的学科领域,提高查全率。 确定检索年代、文献类型 选择检索方法
确定检索的信息源(包括中外文数据库和网络资源等)
• 检索结果表明:
检索词的选择、逻辑算符的使用、同义词近义词的
扩展、检索字段的选择等变化,对检索结果数量的 多少、检索的查全和查准有很大影响
3. 分析学科范畴
分析课题研究的学科范畴,目的是确定所要检索 的学科领域,提高查全率。 信息用户的文献需求一般分为四种类型
了解学科发展动态的要求 了解某一研究主题的片断性信息 了解某一研究主题的全面性信息 检索特定的文献信息
第六章
检索策略的制定与优化
武汉大学图书馆信息科学分馆
计算机信息检索的具体步骤
分析检索课题,制定切实可行的检索策略(出发点和依据)
利用检索系统特定的指令正确实施检索 通过人-机对话的方式不断调整、修改、检索策略 根据查找的文献线索获取原始文献
检索策略的制定与ห้องสมุดไป่ตู้化
一、什么是检索策略
灵活使用同义词和近义词。
如何正确使用关键词与主题词
例1:城市生活污染研究 • 关键词: • 城市(都市、城区) • 生活污染(生活污水、生活垃圾、电磁辐射污染等) 例2:有关室内装修污染方面的研究 • 关键词:室内、装修、污染 • 同义词或近义词: 室内(住宅、居室、房屋) 污染(放射性、化学、氡气、甲醛、苯等)
概念平行、 并列
OR 或+
土地管理与土地利用 A B
A OR B A+B
扩大检索范 围 提高查全率
提高查准率
某一主题去掉 一部分相关主 题
NOT非-
除光电测距以外的 A 电磁波测距 B
B NOT A B-A
示例1:
(城市 OR 都市 OR 城区) AND (TI=生活污染 OR 生活垃 圾 OR 生活污水 OR 电磁辐射污染)
献类型、技术含量、数据的存贮年限、更新频率、
检索费用以及使用方法等。
馆藏电子资源 免费网络资源
馆藏电子资源—武汉大学图书馆已购的数据库
中文、外文数据库 全文型与文摘型数据库 免费试用数据库 专题数据库 光盘及联机数据库 以上各种类型的数据库根据购买方式的不同 又可分为镜像数据库、国内访问权及国际访问权 数据库
率较低。
倒查法 它是一种逆时间顺序,由近及远的往前追溯查找 文献的方法。检索时,从当前开始,逐年向前,进行 查找,直到查到的结果满意为止。这种方法主要适用 于一些前人没有研究过的新课题;或者前人虽然已经 作过研究,但现在仍有研究价值;或者时科技工作者 在工作中碰到了问题需要解决,查找解决问题的办法。 运用倒查法查找文献,比顺查法节约时间,检索效率 较高。但对于有些课题,特别是带有周期性的或阶段 性研究的检索课题,如果未查到研究阶段,容易造成 漏检。