当前位置:文档之家› 文献检索 第三章

文献检索 第三章

不要因为追求检索的速度而忽视了这一环节。
网络信息检索的基本技巧之三 充分利用检索条件
在使用大型期刊文献数据库时,由于有完善的检索功 能,应充分应用布尔逻辑检索方法,选择利用各种检 索入口,设计合理完善的检索式。
有些信息检索系统,常常提供检索的表达条件或检索 限制,使用时只需从给定的条件中选择需要的项目即 可,如查找的年代、资料的类型、是否需要全文等。
截词检索(truncation)举例
如: comput* ,可以检索包含以下词汇的文献: Computable, computation, compute, computer, computers,、 computarize,computerization, computing, computor, computron 截断常使用截断符号,各检索系统所使用的截断 符号有所不同,常用的符号有 “?”,“$”,“#” 以及“ *” 。以下举例中用“?”来表示有限截断, 用“*”表示无限截断。
正确的选择数据资源。只有如此,才能 保证最终检索结果在一定程度上的查全 率、查准率。 正确地了解、认识、熟悉各类检索系统, 是恰当选用数据库的前提。
网络信息检索的基本技巧之二 利用系统检索提示
大多数计算机检索系统、网站都提供一些介绍 文件,如about us(关于我们)、Help(帮助) 和 FAQ(经常提问的问题)、 Search Tip(检 索提示)等,仔细阅读这些文件,对于了解系 统的设计、数据库覆盖的范围、检索的具体要 求都非常重要。
(3)检索限定范围
为了提高检索效率和满足特定需求,用户检索 时可以先设定检索范围。
用户常设的检索范围有: 学科范围 期刊范围 时间范围 语言范围 地域或国家范围
(4)全文阅读器/浏览器
全文阅读器是一种用于打开具有某些特定格式 的全文的一种浏览软件。由于有些数据库的全 文使用的是特定格式的文件,必须由相应的阅 读器进行阅读,所以,在使用相应的数据库时, 必须先下载相应的阅读器,才能阅读全文。如 Acrobat Reader (阅读PDF格式文件)、CAJ、 维普浏览器等。
正确选择各项内容,让计算机较好地理解用户的检索 意图是十分必要的。通过这些选项,计算机会更加精 确地把检索结果呈现出来。
网络信息检索的基本技巧之四 选择恰当、合适的查询词
检索词选择要全面,注意一个课题包含几个并列概念 一个概念的不同表达方法。
复杂概念最好分为两个或多个检索词,中间用逻辑算 符连接
截 词(truncation) 的 方 式
按截断的字符数量来分,可分为有限截断和无限截断 两种类型。有限截断是指有具体截去的字符数。 无限截断则不指明具体截去的字符数。 如: comput* ,可以检索包含以下词汇的文献: Computable, computation, compute, computer, computers,、 computarize,computerization, computing, computor comput?? 则表示有限后截断,截0—2个字符,可检索 出compute 、 computer 、 computers、computor
逻辑“或”(OR)
逻辑“或”是并列概念关系的一种组配,通常用运算符 为“OR”或“+”表示。
例如: AB=信息检索 OR AB=文献检索
逻辑“非”(NOT)
逻辑“非”组配是指不包含某种概念关系的一种组配。 它可以从原检索范围中排除一部分文献记录,逻辑 “非”的运算通常用“NOT”或“—”作为运算符。
(1)初级检索
初级检索 是面向一般读者提供的检索方式。利用初级 检索系统能进行快速方便查询,适用于不熟悉多条件 组合查询的普通用户。它为用户提供了详细的导航内 容,最大范围的选择空间。对于一些简单查询,建议 使用该检索系统。该查询的特点是方便快速,执行效 率较高,但查询结果有很大的冗余,会检索出一大批 检索者所不期望的结果。
前缀限制符有: AU= 限查特定作者 JN= 限查特定刊名 LA= 限查特定语种 PN= 限查特定专利号 PY= 限查特定年代
后缀限制符例如: /TI 限在题目中查 /AB 限在文摘中查 /DE 限在叙词标引中查
3.2.3 常用方法
(1)初级检索 (2)高级检索 (3)分类检索 (4)二次检索
获取网络信息资源的途径之一
网络地址
河北工业大学 图书馆 域名地址
获取网络信息资源的途径之二
搜索引擎
获取网络信息资源的途径之三
OA资源
获取网络信息资源的途径之四
学科导航
获取网络信息资源的途径之五
网络数据库
3.2 网络信息检索常用概念、 技术、方法与技巧
3.2.1 常用概念 3.2.2 常用技术 3.2.3 常用方法 3.2.4 常用技巧
3.2.2 常用技术
(1)字段限定检索 (2)布尔逻辑检索 (3)截词检索 (4)精确短语检索
(2) 布尔逻辑组配
布尔逻辑检索技术就是指利用布尔逻辑 算符(AND、OR、NOT)进行检索词语和代 码之间的逻辑组配运算,从而获得检索结果的 一种方法。
逻辑“与”(AND)
逻辑“与”组配是具有概念交叉关系和限定关系的一 种组配。通常用“AND” 或 “*” 作为算符表示。 例如: AB= 信息检索 AND AB=计算机
年代检索: 199?;
有限截断比较精确,只检索出用户需要的词汇,而无限截断使用时必 须注意词干不要太短,否则回检出许多无关的文献。应尽量选用不会引 起误检的截断词。
前截断
前截断也叫左截断。前截断的检索方法也叫“后方一 致”检索。前截断检索常用于复合词。
*magnetic:为无限截断的表达式,可检出下列词汇: magnetic、 electromagnetic、 electro-magnetic、 paramagnetic、 thermo-magnetic、 thermomagnetic。
中间截断
中间截断也叫中间屏蔽就是将提问字符串中间的字符用 符号代替,主要用于英式美式不同拼法的英文单词, 或单复数不同的单词。
如: man woman organization defense men women organisation defence
检索时为防止漏检可用中间屏蔽的检索方法: m?n wom?n organi?ation defen?e 当然使用中间屏蔽的方法也要注意是否可能误检其它词
但不能检索出magnetics、 magenetical
前截断与后截断也可以组合起来使用。 如: *chemi* 可以检出下列词汇
chemical、chemistry、chemist、eletrochemical、 electrochemistry、physicochemistry、 thermochemistry等。 前截断使用的系统比较少,在联机检索系统中, ORBIT系统允许使用前截断检索。
入检索词,因此也称为浏览检索。
查找有关“高等数学”方面 的论文。
得到检索结果
(4)二次检索
所谓二次检索就是在前次检索的基础上进行的 再次检索,因此也叫在检索结果中查找。
通过二次检索可以缩小检索范围,优化检索结 果。
网络信息检索的基本技巧之一 恰当选用数据资源
恰当选用数据资源(检索工具) 对于信息检索而言,重要的是在检索前
汇的文献。
取词根功能
词根检索
有些检索系统不支持使用截词符的截词检索技术, 系统默认的是词根检索,即输入一个词,系统会自 动检索出同一词根的一组词,例如输入gene,可以 检索出gene,genic,genome等。这是一种智能 检索方式,但要求系统内必须预先配置词根表。
IEE/IEEE全文数据库默认词根检索
目前大多数检索系统提供菜单式检索, 只需选择字段,不需要记住及输入字段 代码。
在命令式检索界面中,字 段限定检索需要检索命令 符,常用命令符有“=”、 “/”、“within”。
1. 字段限制检索(续)
DIALOG系统而言,基本索引字段使用后缀检索,辅助索引 字段则采用前缀方式的检索,前缀符用“=”,后缀符用 “/”。
3.2.1 常用概念
(1)两种检索界面 (2)检索字段 (3)检索限定范围 (4)全文阅读器/浏览器
菜单式检索界面
命令式检索界面
(2)检索字段
检索字段又称检索途径(或检索入口 ),是用户作为 检索依据的文献特征,包括文献的内容特征和外部特 征。这些特征在数据库中以字段的形式表现, 所以检索 入口也称检索字段。全文数据库中常用的检索途径有: 关键词、刊名、作者、题名、分类号、文摘、任意字 段。读者可根据所掌握的文献特征情况及检索目的选 择适当的检索入口。
(2)高级检索
包括布尔逻辑检索、字段限制检索等。利用高级检索 系统能进行快速有效的组合查询,优点是查询结果冗 余少,命中率高。缺点是必须掌握一定的检索技术。 对于命中率要求较高的查询,建议使用该检索系统。
Байду номын сангаас
(3)分类检索
分类检索也叫浏览检索。利用分类导航功能进 行某一类信息的查找。由于查找时通常不需输
有些数据库需要加入词根运算符如“$”才进行词根 检索 。
(4)精确短语检索
一般用“ ” 表示精确检索,可针对专业 短语进行检索。
例如: AB=“Microsoft Windows” “International Space Station”
(1)字段限制检索
数据库中每条记录都有许多字段,将 检索词限定在特定的字段中进行检索就 叫做字段限定检索。
某大三年级学生,想查一些关于时间的名人名言,他 的查询词是“大学三年级关于时间的名人名言”。
截 词(truncation) 的 方 式
按截断的位置区分,可以有后截断、前截 断以及中间截断。
相关主题