信息检索策略与实例分析
������检索策略:“基因工程” AND“植物”AND“淀 粉”AND“含量”
——检索结果为零
������ 分析:主题词过多
LOGO
������ 答案:首先抓住最能反映课题主题概念 的词
作为检索词,其他各词视检索结果决定取 舍,对
于本课题,只有2个主题概念最为关键---
������ “标引词”是用以描述文献内 容特征的词和词 组,由专业标引人员抽选出的,经 过规范处 理,可以避免漏检。 ������ “自由词”检索方便,但会导致 漏检,需要把 所有同义词考虑齐全,才能避免漏 检。
10.1.6 没有选择合适的检索途径
正确选择检索途径
检索字段:
“Title”or“Keywords”or“Abstract”
LOGO
先组合第一和第二 个检索框的检索词, 后再与第三个检索 框进行组合。
先组合第一和第二个 检索框的检索词,后 再与第三个检索框进 行组合。
LOGO
在Quick Search 检索中,注意三个 检索框的检索组合 顺序:先组合第一 检索框和第二检索 框的检索词,然后 再与第三检索框的 检索词。
在同义词或相关 词组合检索、并有 多个主题进行组配 检索时,尤其要注 意检索框的输入顺 序。
检索词过多
LOGO
多主题概念的选词以“简”为主
������ 一课题是由A、B、C、D、E多个主题组合而成。若 A、B、C、D、E其中之一的检索结果为零,则检索结 果A*B*C*D*E =0。
������解决办法:以必须使用的关键词为核心词
������例1:课题“利用基因工程的手段提高植物中淀粉的含 量”
第10章
信息检索策略与实例 分析
主要内容
❖10.1 漏检误检的原因分析及 对策
❖10.2 检索策略的调整 ❖10.3 信息检索综合利用案例
LOGO
10.1 漏检误检的原因 分析及对策
信息检索步骤
LOGO
分析课题 选择检索系统 制定检索策略
查找文献线 索
获取原始文献
������在此基础上去查询新的文献,站得就比较高,既能 见到树木又能见到森林。
LOGO
对新课题的了解越多,所走的弯路越少。 课题内涵的透彻分析 ������ 例1:检索“乙醇的分离”文献 检索策略1:“乙醇AND 分离”——漏检 检索策略2:“ 乙醇AND ( 分离OR 提纯OR 纯化)” ——更全
10.2.1 检索结果相关性差 ������ 解决方案:重新分析课题,找出隐含在课题题名 后面的相关检索词。 ������ 方法:先从检索结果中选出你认为相关性高的几 篇文献线索,得到它们的原文,然后研读,找出它们 所表达的关键词,然后再用这些关键词去检索。
10.2.2 检索结果太多
把增加的概念,用AND算符加入检索式中。
������ 浏览部分中间检索结果,从检出的记录中选
取新的检索词对中间结果进行限制。
LOGO
10.2.3 检索结果太少 ������ 原因1:选用了不规范的主题词或某些产品的 俗称、商品名作为检索词。例如:没有使用“表 面活性剂”而使用了商品名称“迪恩普”,都会 造成漏检。 ������ 原因2:同义词不全例如,查找“品牌”时, 没有考虑到“名牌”、“牌号”以及“商标”等 检索词。
LOGO
������ 原因1:主题、检索词、检索入口过于宽泛导 致误检,例如直接用“金属玻璃”、“燃料电 池”、“微波陶瓷”等宽泛的概念查文献,解决 方法是进一步了解课题背景,明确研究定位;
������ 原因2:主题词本身的多义性导致误检,例如, 使用邻苯二甲酸二壬酯的缩写“DNP”作为检索 词检索,结果找出的文献含有“DNP邻苯二甲酸 二壬酯”、“DNP动态核极化”、“DNP糖尿病 患者”、“DNP防老剂”和“DNP表面活性剂” 等多种内容;
LOGO
检索结果太多——细化检索,缩小检索范围
������ 提高检索词的专指度,选用下位词或专指性较强 的自由词检索。
������ 将检索词的检索范围限定在篇名、主题词、关键 词字段,或进行出版时间、语种、文献类型等的限 定。
������ 用NOT算符排除无关的术语和词组。
自由词:维生素C(vitaminC);
标引词:抗坏血酸(ASCORBIC ACID)
������ “超分子”
������ 自由词(直译):super molecular;
标引词:macro molecular
������ 例如:检索“六行程发动机”的资料, 把“六行程”作主题词时,就不能找到相 关资料,而用六冲程作为主题词就可以找 到。
采用的检索词如下: 铁路:Railway 轨道:Rail、Track 交通:Traffic、Traffical 列车:Train 振动:Vibration、Vibrations 动力:dynamic、dynamical
LOGO
检索式如下:
([Rail*]or[Train*]or[Traffic*]or[Track*])and([Vibrat*]or[d ynamic*])
LOGO
例2:“论企业生产线的优化” ������ 检索词:“企业生产线” 与“优 化”,检索到的文献很少 ������ 分析:概念定位太小,所谓企业生产 线的优 化,实际上是有关运用计算机系统管理 生产线的问题。 ������ 答案:“企业生产线OR 生产线” 与 “计算机系统”
“基因”AND “淀粉”。
������ “最专指面优先”原则(Most Specific Face
First)
LOGO
10.1.4 布尔逻辑运算符使用不当
逻辑检索式的正确使用: 课题:城际列车振动对周围环境的影响
对此课题进行分析,确定关键词为: “铁路”/“列车”/“轨道”/“交通”、“振 动”/“动力”。
查找和筛选文献线索---提高查全查准率 ������ 当经历了前面一系列检索得到结果时, 通过阅读文摘,往往会发现检索结果并不 尽如人意,或相关性较差,或检索结果太 多或太少,这时需要进一步调整检索策略 了。
LOGO
LOGO
LOGO
������ 不同数据库有各自的规则,姓名、分子式、 各种符号的写法,检索框的检索顺序均不尽相 同,如果不了解就会造成很大的漏检误检。如 逗号,括号,连字符“-”应该用半角(俗称英文 符号),若用了全角(俗称中文符号),就会 检索不到。 ������ 注意:PQDD是国外博硕士论文数据库,检 索词用“英文”,而非“中文”。
提示与技巧
������ 概念是太大还是太小要视检索结 果而定,不断调整的。
������ 概念太大可以利用逻辑运算加以 限制,比较容易。
������ 而概念太小要变大,需要较多的 专业知识。
������ 上下位概念的替换是调整检索策 略的一种好方法。
LOGO
LOGO
������ 原因4:词组没有用精确检索造成。利用双 引号“”实现对词组的精确检索。例检索solar energy这个主题,没有加双引号“”,则代表是普 通检索,只要检索字段中出现solar 和energy便符 合检索要求,不管这两个词出现的次序怎样;若 加双引号“”则表示solar必须在前,energy必须 紧跟其后才符合。
LOGO
������ 例2: 检索“垃圾处理方面”文献 “处理”一词隐含着“回收”、“再生” 等具体的处理方法。
LOGO
提示与技巧 ������ 检索词没有表达出课题的隐含概念, 是造成漏检的重要原因。 ������ 要透过表面的、显性的表达词,找出 隐含概念的表达词是需要相当专业知识的, 而有些专业知识又需要通过文献检索和阅 读后才能获得,这就是检索策略不能一蹴 而就的根本原因。
LOGO
10.2 检索策略的调整
LOGO
检索策略与文献检索和阅读的关系
LOGO
制定检索策略---查全查准的关键 ������ 好的检索策略不是一蹴而就的,而是“与 时俱进”的! ������ “变”是检索策略永恒的主题。它会随着 对课题理解的深入而改变,“检索→阅读→策 略修改→再检索……”,不断调整,不断完善。
文献阅读与分析评价
调整检索策略 调整课题方向
LOGO
10.1.1 课题分析不透
课题分析是一切后续检索的基础。
������ 分析课题首选手册、百科全书、专著等三次文献 作为分析手段。
������ 它们是该领域的学术专家和权威对以往研究的总 结,既有高度又有深度和广度,让人对该领域的研 究有一种全局的了解和把握,同时可以对背景知识 和相关名词术语作全面的了解。
LOGO
正确选择检索系统 ������ 检索工具种类繁多,各具特色,它们收录 的文献学科、类型、国别、语种范围均各 有侧重。应根据课题的特点选择检索工具。 ������ Ei偏重工程,不报道纯理论,会议论文收 录得多,是世界四大文献索引之一。 ������ SCI则收录涵盖所有学科、侧重基础理论 研究方面的文章,它的文献品位高,可信 度大,并可以对文章的水平、著者的学术 水平作出评价,寻找热点课题等等。
LOGO
������
原因3:检索词的截词过短造成。例如,使
用
“Cata*”检索“Catalyst,使用“Prep*”检索
“Preparation”,都会造成误检。(截词的原则是 截到
词根,如Catalyst——Catalys*;Preparation——
Prepar*)。
先组合“vibrat*”和“traffic*”进行检 索,然后与“rail*”进行检索,把同义 词“traffic*”和“rail*”的检索隔开了, 不符合检索策略。