文献检索的一般方法和步骤信息检索基本概念:根据特定课题需要,运用科学的方法,采用专门的工具,从大量信息、文献中迅速、准确、相对无遗漏地获取所需信息(文献)的过程即信息检索。
搜集资料的途径:1. 通过检索工具2. 通过互联网 3. 通过论文后的参考文献4. 通过跟踪相关领域的专家5. 利用数据库提供的功能跟踪某研究领域的最新成果一、信息检索的类型1.按检索对象内容划分(1)文献检索(Document Retrieval)检索以二次文献为存储对象的信息系统,如目录型、题录型、文摘型数据库以文献为对象的一种检索活动。
凡是查找某个题目的有关文献,以及回答这些文献的情况、出处、收藏地点等待,均属于文献检索的范畴。
(2)数据检索(Data Retrieval)以数值信息为检索对象,例如:物质临界值、公式、化学分子式等。
通过检索,用户可获得所需要的确切数据。
侧重于检索对象的量的方面。
(3)事实检索(Fact Retrieval)检索系统中存储的是从原始文献中抽取的各种事实,如:某事实发生的时间、地点或过程等。
用户通过检索可获得有关事物、事件的发生与发展情况及相关资料。
侧重于检索对象的质的方面。
(4)全文检索(Full-text Retrieval)从存储有大量原始文献全文的数据库中检索全文或某一章节(5)图像检索(Graphic Retrieval)以图像或图文信息为检索对象的检索方式(6)超文本检索(Hypertext Markup Retrieval)利用非线性信息组织方法建立的数据库检索相关信息的方式2、按照信息检索手段划分数(1)手工信息检索从内容单一、编排粗糙的文献检索刊物发展为形式多样、功能齐全、复盖所有知识门类的文献信息检索体系(2)计算机检索经历单机检索、光盘检索、国际联机检索、数据库的网络化检索等阶段二、信息检索的方法1.引文追溯法利用文献所附的参考文献进行追溯查找。
2.工具法(1)顺查法:以研究课题的起始年代为起点,由远及近,逐年查找,直至最近期为止。
(2)倒查法:针对研究课题,从最近期向早期回溯,直至查获适量切题文献信息为止。
3.循环法是工具法与引文追溯法相结合的一种检索方法。
三、信息检索的基本程序信息检索的程序是指根据课题的要求,选择相应的信息检索工具或系统,采用适当的途径和技术,查找所需文献的过程。
(一)分析与研究课题目的:科研立题、科研阶段性研究、科研成果鉴定、申请专利、撰写论文、综述、述评…检索课题的主题内容和研究要点文献类型、时间范围、语种、机构、作者’1)了解研究课题所属的专业、学科范围和检索范围及年限;2)了解检索目的和要求(包括显现的和潜在的);3)了解哪些是已知情报(包括已做过的检索),目的是寻找检索切入口,避免重复劳动。
(二)制定检索策略检索策略是指为实现检索目标而制定的全盘计划或方案,一般包括以下6个方面:1)确定回溯年限和查找范围。
从某年起或某个时间段,范围可以是国内或国外,也可以是指某个文种;2)选择检索手段。
检索手段包括:手工检索(效率最低)、联机检索(花费高昂)、光盘检索(检索范围受限)和网络检索(缺乏系统有序化)。
检索手段的选择,一方面取决于本人或本单位掌握的有关资源,同时受到课题目的和要求等课题因素的影响。
3)选择检索检索工具或数据库。
如上所述,每种检索手段都有自己的优势,亦有缺陷,当我们选择检索工具时,就要利用检索手段的优势而避其短,在分析课题的基础上,基于对检索工具的认知,选择最能帮助我们直接达到检索目标的检索工具(或数据库)。
手工检索——可选择的检索工具大体有:书目;印刷型索引(如《全国报刊索引》)、文摘、综述等;参考型工具书;专著;教科书等。
光盘检索——可利用的检索工具有:各种光盘版的文献数据库(如中国学术期刊全文数据库光盘版、人大复印资料全文数据库光盘版等)。
联机检索——可选择的检索工具有:各种联机文献数据库(如Dialog、ORBIT、ISA-IRS、MEDLINE联机文献检索系统等)网络检索——可选择的检索工具有:各图书馆的书目检索系统(如惠州学院图书馆馆藏检索系统)、数字图书馆书目检索系统(如超星数字图书馆馆藏检索)、期刊论文文摘或全文数据库(如中国期刊网)、学位论文文摘或全文数据库(如中国优秀博硕士论文数据库),等网上可靠的可利用的一切资源。
(三)选择检索方法检索方法分为常用法、追溯法及综合法。
倒查法——检索年代由近及远,这是最基本的检索方法;常用法顺查法——检索年代由远及近。
主要用于有确切起始年代的文献的查找。
抽查法——选择课题内容最活跃、成果最多的时期做重点查找。
追溯法:利用引文索引或综述、述评、专著等文后所附的参考书目信息,追溯查找原文,再由此大检索面的方法。
综合法:是常用法与追溯法结合起来使用的方法。
(三)确定检索途径¨大多数检索工具都能提供几种主要的检索途径,如分类、主题词、著者、机构、刊名、关键词、摘要等等。
可根据课题要求和已掌握的信息来决定选择何种检索途径,输入检索词。
¨检索词就是文献加工的标引词,也是我们在文献检索过程中所使用的“钥匙词”。
它必须在课题分析的基础上,提取出来,尽可能地全部拟出,首先选择与检索意图最为切合的词作为检索词,再根据检索结果需要进行检索调整时,再按照切合程度而修正检索词的选择。
1.以文献的外部特征为检索途径(1)题名途径(2)责任者途径(3)号码途径(4)机构途径2.以文献信息的内容特征为检索途径(1)分类检索途径(2)主题检索途径3.以文献的相互引证关系为检索途径(四)编制检索提问式1、单元词检索(概念检索) 检索标识是具体的检索词或词组,每个检索词表达一个概念2、布尔逻辑算符组配检索是将多个检索词进行逻辑组配形成的一种复合性检索要求。
(1)逻辑与用符号“ and” 或“*”表示,其逻辑表达式为:A and B 或 A * B其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。
(2)逻辑或用符号“or”或“+”表示,其逻辑表达式为: A or B 或 A + B其意义为检索记录中凡含有检索词A或检索词B,或同时含有检索词A和B的,均为命中文献。
(3)逻辑非用符号“not”或“-”表示,其逻辑表达式为:A not B 或 A - B其意义为:检索记录中含有检索词A,但不能含有检索词B的文献,才算命中文献。
3、位置逻辑算符它是用位置逻辑算符表示词与词之间的相互位置关系和前后次序。
(1)(W)——“With”的缩写,表示两个词之间不得有词或其他字母,可有一空格或标点符号或连字符“—”,词序不得颠倒。
(2)(NW)——是从“Words”算符引伸出来的,它表示各检索词之间允许插入最多几个词,词序不能颠倒。
(3)(S)——是“Sentence”的缩写,表示各检索词必须同时在一个句子中出现,词序可任意变化,且各词间可任意加词。
(4)(F)——是“Field”的缩写,表示各检索词必须同时出现在文献记录的某个或某些字段中。
(5)(C)——是“Combine”的缩写,表示各检索词必须同时出现在同一文献的记录中,不限定词序和字段,其作用同布尔逻辑算符“AND”。
4、截词和屏蔽(模糊检索)(1)截词主要是利用检索词的词干或不完整的词形进行检索。
A、后方截断Computer(计算机)Comput?Computer、Computers、Computerise 、Computerize等均为命中。
B、前方截断后方一致派生词的检索。
把截词符放在字根的左边,如?Conputer,那么在计算机检索时,索引词Microcomputer 均算命中。
C、两边截断(中间一致派生词的检索)D、有限截断就是检索词后加一个或一个以上的(最多不超过四个)“?”,空一格再加一个“?”。
E、屏蔽就是在一串字符中插入一个或一个以上的屏蔽符号“?” ,表示在该符号的相应位置上可转换数目相当的字符。
M?n相当于man、men5.字段限定检索全文、语种、时间(年代)、(五)原始文献的获取1)尽可能完整记录文献线索2)通过图书馆馆藏查找原文3)通过数据库获取全文4)透过馆际互借获取资料文献资料的鉴别是否与研究主题相关(通过文摘、关键词及文章长度等判断)是否学术性文章(通过刊登文章的刊物质量等判断)是不是够新颖(通过文献的出版时间或者文章所引用文献的时间来判断)资料权威性如何(通过考察作者所属机构和学术经历等来判断)信息检索效果的评价信息检索效果是指用户利用信息检索系统进行检索所产生的有效结果。
(一)信息检索效果的评价指标以一个检索提问去检索任何一个数据库都会出现4 个相关量:检出的相关信息量、未被检出的相关信息量、检出的非相关信息量、未检出的非相关信息量。
相关信息量无关信息量合计相关信息指标检出信息指标检出信息量 a b a+b未检出信息量 c d c+d合计a+c b+d a+b+c+d4.误检率(Noise Factor)误检率是衡量误检出非相关信息的程度指标。
N=(b/a+b)*100%理想的检出结果是查全率与查准率都趋近于1。
但在实际检索中,查全率与查准率之间存在互逆相关性。
如果追求过高的查全率,就可能降低查准率。
RP三、影响检索效率的主要因素1. 数据库的信息量与信息标引网罗度2. 检索词的专指度3. 检索者的水平4. 检索策略三、影响检索效率的主要因素1. 数据库的信息量与信息标引网罗度(客观因素)涉及数据库本身的质量:(1)数据库搜集的信息量的数量与质量(2)对每条信息揭示的深度与广度,著录标引的质量(字段的数量,主题词的信息标引网罗度)(3)检索途径及检索字段的数量2.检索词的专指度3.检索者的水平4.检索策略文献生产的积累性、广泛性和文献利用的专指性,是文献检索的社会需求。
为此,文献工作者便在搜集文献并使之有序化的同时,还编制各种检索工具或建立各种数据库等,这些都是使文献具有可检性以适应社会需求的业务基础工作。
一.文献检索及其原理何谓文献检索?文献检索是一个查找文献的过程。
《中华人民共和国国家标准情报与文献工作基本述语》(GB4884-85)对文献检索定义为:“从存贮的文献中找出特定文献的过程。
”联合国教科文组织《文献与情报工作辞典》(1976年版)则定义为:“从一个文献集合中查找专门文献的活动、方法与程序。
”两者表述方式虽有不同,但其内涵是一致的。
即文献检索是从众多的文献群中查找出符合特定需要的文献信息的全部活动过程。
从这个意义上讲,文献检索也就是信息检索(Information Retrieval)。
按其查找对象的不同可分为三种不同类型的检索:(一)书目检索,这是以检索工具(书目、索引、文摘、题录)为检索对象的一种检索。
凡是查找某一主题(时代、地区、著者、文种等)有关文献的检索过程,均为书目检索。