3 检索策略与技巧
9
编制检索式,选择检索字段
检索式是用逻辑算符、位置算符、截词算 符等各种算符把检索词连接起来,正确地 表达检索课题的主题内容。 检索式制定质量的高低,直接影响着检索 结果。
10
检索结果的评价与检索策略的调整
在得到检索结果后,可能会出现以下两种 让人不太满意的情况: 检索结果过少,漏掉了相关文献 检索结果过多,很多文献不相关
综合法又称为循环法
• 是把上述两种方法加以综合运用的方法。
28
如何追溯
找到一篇“好”文章 期刊等级
• • • • 核心期刊/EI/SCI/ISTP CSSCI/CSCD 管理类重要期刊 主要作用不在于作为文献检索的工具,而是 作为科研评价的一种依据。
作者、机构 重视综述性文章
29
管理类重要期刊
正确的主题分析是制定检索策略的保证, 它决定了检索策略的质量和检索效果的好 坏。 因此,务必要掌握好所检课题的内容实质 ,然后概括出能最恰当地代表主题概念的 检索词。
4
分析检索课题,确定检索词(2)
确定检索词时注意事项
• • • • 先选用主题词 选用常用的专业术语 避免选用高频词或低频词 选用同义词与相关词
44
进入重庆维普
重庆维普
45
快速检索
46
传统检索
47
高级检索
48
分类检索
49
期刊导航
50
三大中文期刊全文数据库的比较
5
分析检索课题,确定检索词(3)
先选用主题词
• 当所选的数据库具有规范化词表时,应优先 选用该数据库词表中与检索课题相关的规范 化主题词,这样可以获得最佳的检索效果。 • 例:自由词Computer vision, Machine vision • 主题词Vision systems
6
分析检索课题,如何选择中文数据库
• 万方数据库简介 • 重庆维普简介 • CNKI/万方/维普之比较
36
万方数据资源系统
该系统由中国科技信息研究所、万方数据 集团公司联合开发,是网上以科技信息为 主,集经济、金融、社会、人文信息为一 体的大型综合性信息资源系统。 收录文献范围包括期刊、会议、文献、书 目、题录、报告、论文、标准专利、连续 出版物和工具书等。 收录范围最广
13
衡量检索效果的指标
检索出的相关文献量
查全率R=
(recall ratio)
数据库中的全部相关文献 检索出的相关文献量
x100%
查准率P=
(precision ratio)
检出的文献总量
x100%
最理想的检索结果是查全率和查准率都达到 100%。 R100%表示数据库中收录的全部相关文献都被 检索出来 P100%表示检索出来的文献全部都是相关文献 但事实上,检索中有许多因素使这个指标很难达 到。
25
第三组关键词
不相关结果太多, 要缩小
26
缩小
结果有些参考价值
27
三种检索方法
直接法
• 是指直接利用检索工具(系统)检索文献信息的 方法,这是文献检索中最常用的一种方法。
追溯法
• 是指利用已经掌握的文献末尾所列的参考文献, 进行逐一地追溯查找“引文”的一种最简便的扩 大信息来源的方法。 • 它还可以从查到的“引文”中再追溯查找“引文 ”,像滚雪球一样,依据文献间的引用关系,获 得越来越多的内容相关文献。
选用常用的专业术语
• 在数据库没有规范化词表或词表中没有可选 的词时,可以从一些已有的相关专业文献中 选择常用的专业术语作为检索词。
避免使用禁用词和高频词
• 检索时一般不选用禁用词; • 尽量少用或不用不能表达课题实质的高频词 ,如:“分析”、“研究”、“应用”、“ 方法”、“发展”、“设计”等词。
14
查全率R与查准率P之间的关系 R-P之间存在着互逆关系 A点
检索词数量多,泛指性强, 查全率较高但查准率却非常低
R A
B点
检索词专指性较强,查准率就高 查全率因此降低
C D B
C,D两点
两种极端的折衷。 查全率一般在60%--70% 查准率一般在40%--50%
0 P 查全率R与查准率P的关系曲线 无论怎样调整检索策略和改进系 统效率,都无法使P和R同时接近100%。
15
内容
检索策略的制定 实例演示 如何选择中文数据库
• 万方数据库简介 • 重庆维普简介 • CNKI/万方/维普之比较
16
实例演示(1)
问题
• 查找“基于Agent的金融市场仿真” 的资料
分析问题,找出关键词
• 方法:基于Agent的仿真
关键词1:仿真、模拟 关键词2:Agent、主体、代理人
• 研究对象:金融市场
同/近义词:证券市场、股票市场、外汇/期货……
• 同义:人工金融市场、计算实验金融 • 相关:金融市场复杂性
17
实例演示(2)
分析问题,找出关键词
• 第一组
关键词1:仿真、模拟 关键词2:Agent、主体、代理人 关键词3:证券市场、股票市场、外汇/期货……
• 第二组:人工金融市场、计算实验金融 • 第三组:金融市场复杂性
31
CSSCI
“中文社会科学引文索引”,英文全称为 “Chinese Social Sciences Citation Index”,缩写 为CSSCI
• 由南京大学与香港科技大学合作研制,用来检索中文 社会科学领域的论文收录和文献被引用情况。 • 数据库选用中国大陆出版的中文人文科学、社会科学 学术期刊,2006年收录493种社科类核心期刊(每年 收录的核心期刊数不同)。 • 所收的期刊是按严格的标准和国内知名专家的定性评 价相结合而产生出来的,可作为社会科学研究的评价 指标。 • 管理学类部分期刊
33
SCI/SSCI/A&HCI
美国费城科学情报研究所(The Institute for Scientific Information, 简称ISI) SCI ——科学引文索引 • Science Citation Index Expanded: 1945-收录近6381种期刊,约1700万条记录,每周更新。
37
进入万方数据库
万方数据库
38
万方主页
39
初级检索 期刊导航
40
41
42
43
重庆维普《中文科技期刊数据库》
重庆维普《中文科技期刊数据库》是由中 国科技信息研究所重庆分所下属的维普资 讯公司推出 它是目前国内收录期刊最多、容量最大的 综合性数据库。 收录1989~2003年出版的期刊9000余种, 其中含港台核心期刊200余种。学科范围覆 盖理、工、农、医以及社会科学各专业, 基本容纳国内出版的自然科学及社会科学 期刊。
行业性/实践性期刊?
30
CSCD
核心期刊/重要期刊/权威期刊 CSCD :Chinese Sciences Citation Database中国 科学引文数据库
• CSCD是由中科院文献信息中心和中国学术期刊电子 杂志社合办,清华同方光盘电子出版社出版的引文数 据库。 • 以1989-1999年国内出版的1064种中英文科技核心期刊 和优秀期刊作为来源期刊,分核心库和扩展库,内容 覆盖了数、理、化、天、地、生、农、林、医及工程 技术、环境科学、管理科学等领域。收录了56万篇论 文信息,以及181万条引文数据。 • 管理类重要期刊都是CSCD核心库期刊
选择数据库:CNKI期刊 编制检索式,选择检索字段
• 字段:篇名、关键词、摘要
逐步调整
18
太多不相关,换个关键词
19
不相关较多,缩小范围
20
增加同义词
不相关较多,要缩小范围
21
但结果太少了 三组关键词,比较准
22
增加同义词
23
增加同义词
结果不多 换个思路?
24
第二组关键词
相关性较高
7
分析检索课题,确定检索词(5)
选用同义词与相关词
• 同一概念的几种表达方式,如化学分析有chemical analysis,analytical chemistry,chemical determination,compositionmeasurement等。 • 同一名词的单数、复数、动词、动名词、过去分词形 式等,如生产有product,production,producing, produce,productive等,词根相同时,可用截词符 解决( product *)。 • 全称和简称在检索时也要考虑选用。如:WTO( World TradeOrganization) • 植物和动物名,其英文和拉丁名均要选用。
ISTP——科技会议录索引
• Index to Scientific & Technical Proceedings )
ISSHP——社会科学与人文科学会议录索引
• Index to Social Sciences & Humanities Proceedings
传统上三大检索
• SCI/EI/ISTP
2005年
SSCI ——社会科学引文索引 • Social Sciences Citation Index:1973-- 收1800多种
社科刊,每周更新2700条记录。
A&HCI
• Arts &Humanities Citation Index:1975-种艺术与人文类刊 收1100多
34
ISTP /ISSHP
3 检索策略与检索技巧
高宝俊 博士 副教授 武汉大学经济与管理学院 sinkgao@ 2016年6月
内容
检索策略的制定 实例演示 如何选择中文数据库
• 万方数据库简介 • 重庆维普简介 • CNKI/万方/维普之比较