当前位置:文档之家› 第三章 文献检索技巧

第三章 文献检索技巧


示例课题:数字化图书馆的文献检索服务
1.分析课题: 数字化图书馆+文献检索 digital library and document retrieval
扩展:同义词
digital library virtual library electronic library document retrieval information retrieval bibliographic retrieval
其扩展为(nW),n=1~9,表示其两侧的检索词之间最多可插 入n个词,但位置不能颠倒。 例如:“light(4W)rail”表示light与rail之间最多可插入4个词, 但位置不能颠倒。
2.near:A(N)B 表示其两侧的检索词前后位置可以颠倒,在两词之间不允许插入 其他词,只可能有一个空格、标点或连接号。
intelligent (near/0) robot intelligent robot / robot intelligent
economic (near/2) recovery economic recovery / recovery of the economic / recovery from economic troubles
组织与存储
文献检索
检索
2.基本原理
检索过程实际上是比较、 匹配(match)的过程,检 索提问只要与数据库中的信息 特征标识及其逻辑组配关系相 一致,则“命中”,即找到了 符合要求的信息。
第二节 检索技术
(一)布尔逻辑算符
1.逻辑“与”(and或*):是指两个概念的交集。
A and B 或 A * B表示检出同时含有A、B两个检索词的记录。 逻辑“与”检索增强检索的专指性,缩小检索范围。
据库对应不同的位置算符,以SCI、EI为例,其位置算符是NEAR/x。
NEAR/x可查找由该运算符连接的检索词之间相隔指定数量的单词的记录。 用数字取代x可指定将检索词分开的最大单词数。
只使用NEAR而不使用/x,系统将查找检索词彼此相隔不到15个单词的记录。
NEAR连接的检索词可以颠倒顺序。 例如:
截词,是指在检索词的适当位置截断。截词检索就是用截
断的词的一个局部进行的检索,并认为凡满足这个词局部中的
所有字符(串)的文献,都为命中的文献。
截词检索是一种提高查全率,防止漏检的检索技术,尤其
在英文检索中被广泛使用。
常用的截词符号(即截词符,也称通配符)有: “* ” 表示截断无限个字符,即无限截断; “?”表示截断一个字符,即有限截断。
英文检索词的获取 收集中文文献中的英文关键词写法; CNKI翻译助手 /
试查相关英文数据库,扩展、变更检索词。
例: TiO2纳米复合材料的制备与合成的研究 TiO2 nanometer nanoparticle nanofilm composite composites prepare preparation synthesize synthesis
4.构建检索提问式
(1)使用逻辑“或”运算符将主题词与同义词进行组配,以提高查全率。 如,检索与“激光”有关的文献:激光 OR 镭射 OR 莱塞 (2)使用逻辑“与”运算符将不同概念进行组配,以提高检索结果的专指 性,继而提高查准率。 如,检索 “激光在生物学领域的应用”相关文献: (激光 OR 镭射 OR 莱塞)AND 生物学
(3)合理选择检索字段:一般情况下首先选择主题字段进行检索;需查非
常密切的相关文献时,部分检索词可选择在标题字段检索; (4)构建英文检索式时,正确使用截词符与位置算符,以达到最佳检索效 果。
5.调整检索策略
检索结果输出的篇数过多。
考虑缩小检索范围,提高查准率。调整方法如下: ①进一步限定主题概念,用AND连接一些相关检索项。 ②提高检索词的专指度,更多地采用下位词或下位类。
A not B 或 A-B 表示检出含有A词,但同时不含有B词的记录。 逻辑“非”可以缩小检索范围,增强检索的准确性。
此运算符用于排除那些含有某个特定检索词的记录,但如果使用不
当将会排除有用文献,从而导致漏检,应慎用。
III. Find A or B not C
使用逻辑算符时应注意的事项:
1.三种算符可同时在一个检索式中使用,也可单独使用。 2.逻辑算符的优先级为:NOT>AND>OR 3.在逻辑组配时,算符的两侧必须各留有一个空格。
※注意:
截词符要紧接在词干后面,截词符和词干之间不能有空格!! apple: ap*le ap_*_le ap?le ap_?_le
正确 错误
(三)位置算符
为了提高检索的广度和准确度,常常需要对检索词之间的
位置关系加以限定。位置算符可限定算符两边的检索词出现在 记录中的位置,用以检索出含有检索词且检索词之间的位置也
并列概念
2. 数据库的选择 (1)合适的主题范围 (2)合适的数据库类型、年度范围
学科:图书情报学 2000年后
EI,SCI等检索数据库
原检索式: digital library and document retrieval
并列概念 document retrieval / information retrieval / bibliographic retrieval 同义词 digital library / virtual library / electronic library
第三章 文献检索技巧
覃 雪 qinxue@
第一节
文献检索的基本概念
第二节
第三节
检索技术Biblioteka 文献检索流程第一节 文献检索的基本概念
1.定义
文献检索是指从众多的文献中通过检索工具或检索系统,迅速、 准确地查找出与用户提问有关的文献信息线索的行为、方法和过程。
组织与存储:是对数据进行标引的过程。 对信息进行著录、标引、整序,编制检 索工具和建立检索系统的过程。 检索:是指面向信息需求而进行高 度选择性的查找过程。
I. Find A and B and C
2.逻辑“或”(or或+):是指两个概念的并集。 A or B或 A+B表示检出所有含有A词或者B词的记录。 逻辑“或”检索扩大了检索范围,提高查全率。
此运算符适于连接有同义关系或相关关系的词。
II. Find A or B or C
3.逻辑“非”(not或—):表示从两个概念中除去交叉的部分。
单选择检索字段,也可输入检索字段符来限定检索字段。 例如:AU=Smith,表示要查找著者Smith发表的文献。
词组检索:使用
“ ” 双引号将检索词组锁定,进行精确查找。
匹配度选择:“精确匹配”与“模糊匹配”
第三节 文献检索流程
文献检索 分析检索课题 选择检索工具 确定检索词 构建检索提问式 上机检索并调整检索策略 输出检索结果
符合特定要求的记录。
control system control system 可检出 system control
control communication system
control(W)system 只可检出
control system
1.with:A(W)B
表示其两侧的检索词必须按前后顺序出现在记录中,不能颠倒, 且两词之间不允许插入其他词,只可能有一个空格、标点或连接号。
1.分析检索课题
分析检索课题,明确信息需求。
可以从以下几个方面进行:
(1)检索内容的确定:分析课题的主题内容、所属学科性质 (2)检索范围的确定:包括文献类型、时间范围、语种等。
(3)充分利用已有文献:可以利用相关文献后面所附的参考文
献进行“滚雪球式”的检索。
2.选择检索工具
应该从以下几个方面考虑:
(复合材料---纳米复合材料)
③使用字段限定,将检索词限定在某个或某些字段范围内。 (全文→文摘/关键词)
④用NOT运算符,排除一些无关的检索项。(慎用)
5.调整检索策略
检索结果输出的篇数过少,甚至为零。
考虑扩大检索范围,提高查全率。调整方法如下:
①选全同义词并用OR与原词连接后加入检索式。
②降低检索词的专指度,从词表或检出文献中选一些上位词或相关词。 ③减少AND运算,删去一些次要的概念组面。 ④进行截词检索。 ⑤取消某些过严的限制符,如字段限制符等。
英美拼法:behavi*r 检出 behaviour、 behavior 单复数形式: wom?n 检出 woman、 women 词根相同: comput* 检出 compute、computed、 computing、 computer、 computers、computerize…
按截词的位置分:
其扩展为(nN),表示其两侧的检索词之间最多可插入n个词, 位置可颠倒。 例如:“computer(N)network”,其检中记录可包含
“computer network”或“network computer”。
3.字段级位置算符
表示两侧的检索词必须出现在同一字段中,词序不限。
不同系统使用的符号各不相同。
syntheses
4.构建检索提问式
检索式
=
检索词
+
连接组配符号
逻辑运算符(logical operator)
优先算符(priority operator) 通配符(wildcard character)、截词算符 位置算符(proximity operator)
英文检索式
位置算符:限定检索词之间的位置关系,以提高检索的广度和准确度。每个数
(1)后截断。截去某个词的后部,前方一致。最常用。 如:child*能检出child,children,children’s
(2)前截断。截去某个词的前部,后方一致。 如:*computer能检出minicomputer,microcomputer
相关主题