当前位置:
文档之家› 三章、精准获取信息的方法——编写检索式
三章、精准获取信息的方法——编写检索式
注:英文数据库通常用字母,中文数据库要用符号。
二、位臵检索
二、位置检索(邻近检索)技术
表明两或多个检索词之间关系的符号。 适用于两个检索词以指定间隔距离或者指定的顺序出现的场 合。可以看成特殊功能的AND算符。AND算符不限制两个检索 词的位置和出现顺序。 例如:communication AND satellite 命中的文献可能有 communication satellite; satellite communication; communicaticn devices for satellites; communicaticn links without satellites; 位置算符可以改进AND算符的这种不足,它是特殊功能的AND 算符。按照两个检索词出现的顺序和距离,可以有多种位置 算符,而且对同一位置算符,检索系统不同,规定的位置算 符也不同。
2。转换选词法
2 转换选词法
检索词的确定必须经过对检索主题的正确分析得到。 选词过程中还经常会遇到不能直接查到所需文献的词,这 中间就需要有一个转变过程。 例如:检索《COBOL语言设计》课题,若不加分析就选用 “COBOL language design”,则必然碰壁。而通过正确分 析理解就会知道COBOL语言是一种用来编制计算机程序的语 言,所以应先确定检索词为“计算机程序语言(computer programming languages)”,然后再进一步与COBOL组配, 定能得到满意结果。
用“OR” 或“+”表示 示为:“A OR B”或“A+B”
例如:检索含有检索项A 或检索项B 的文献,可表
逻辑“非”
3 逻辑“非” 含义:排除含有某些词的记录的,即检出的记录 中只能含有NOT算符前的检索词,但不能同时含 有其后的词。
基本作用:用于从某一检索范围中排除不需要的 概念。这种组配可以缩小检索范围。
2)用布尔逻辑表达检索要求,除要掌握检索课题的相关因 素外,还应在布尔算符对检索结果的影响方面引起注意。 布尔算符使用正确但却不能达到应有检索效果的例子很多。 OR逻辑 有些检索词表达的概念,存在整体与部分的关系。在检索 中,这类关系如果处理不好,就不能得到满意的检索效果。 对此,一般原则是,如果检索词涉及到表达整体的概念, 就要针对具体情况分别列出每一个表达部分概念的检索词, 否则将出现漏检。 NOT逻辑 在检索逻辑中使用NOT,能排除含有由NOT指定的检索词的 文献,协助检索出更准确的文献。但是,使用NOT必须慎 重。因为, 如果两个关系紧密的检索词同在一个检索逻 辑中,对其中一个使用NOT逻辑会导致含另一个词的文献 也被排除。
“网络$”,代表“网络”、“网络软件”、“网络计算
机”、“网络操作系统”等词;
“electron$”,代表“electron”、
“electrons”、 “electronic”、 “electronics”等词。
3个符号比较
“?” 、 “#” 和 “$”的相同点与不同点:
(1)“?”与“#”均代表一个汉字、西文字符或其他字符; “#”与“$”均可以不代表任何汉字、西文字符或其他字
在检索实际中,检索提问涉及的概念往往不 止一个,而同一个概念又往往涉及多个同义 词或相关词。 为了正确地表达检索提问,系统中采用布尔 逻辑运算符将不同的检索词组配起来,使一 些具有简单概念的检索单元通过组配成为一 个具有复杂概念的检索式,用以表达用户的 信息检索要求。
逻辑“与”
1 逻辑“与”
6)“(s)”——同句检索
含义: “(s)”算符中的S含义为“Sentence”。 这个算符表示其两侧的检索词必须在同一自然句 子(子字段)中出现,两词的词序可以颠倒。 放宽了词位置检索的要求,使表达同一概念但不 满足词位置条件的文献也可以被检索出来,从而 提高了查全率。
以上介绍的各种位臵算符,按照限制程度的大小, (W)、(nW)最强,(N)、(nN)次之,(S)再次之。 当(nN)的n ≥10时,其作用已经相当于(S)。 S (speckle and nondestruc? (w) test?) /ab,ti,de
2)“(nw)” “(nW)”中的“W”的含义为“Word”,它允许两词间 插入最多为n个其他词,包括实词和系统禁用词, 词序不变。 例如: communication (2W) satellite 则会检出 communication satellite communication though satellite communication on the satellite
用“NOT”或“-”表示,但在检索时建议使用NOT, 以避免与词间的分隔符“-”混淆。
例如:在含有概念A 的文献集合中,排除同时含有
概念B 的文献,可表示为:“A NOT B”或
“A-B”。
运算优先级
4 运算优先级
运算优选级顺序为(),NOT,OR ,AND ; 可以用括号改变它们之间的运算顺序。通常在有 括号的情况下,括号内的逻辑运算先执行,有多 层括号时,先执行最内层的括号。
3)“(N)”
含义:“(N)”中的N含义为“Near”。表示其两侧 的检索词必须紧密相连,除开空格和标点符号外, 不得插入其他词或字母,两词的词序可以颠倒。
4)“(nN)”
含义:“(nN)”是“(N)”算符的变形,不同之处为 允许两词间插入最多为n个其他词,包括实词和系 统禁用词。 例如: COTTON (2N) PROCESSING 则命中:
布尔运算符实例
示例:使用布尔逻辑运算符
Intelligent robot and control(intelligent robot*control) 表明查询结果中必须同时包含intelligent robot和control Intelligent robot or control(intelligent robot+control) 表明查询结果中至少包含两个检索词中的任意一个,intelligent robot或 control Intelligent robot not control(intelligent robot-control) 表明检索结果包含intelligent robot,但同时必须去掉和control相关的内容
确定检索词的基本准则
必须能正确反映检索要求;
必须符合数据库的检索用词规则; 优先选用具有检索意义学科名词术语;
多选常用的基本词汇进行组配。•
主题词选择要领
选择主题词要领
属种关系又称上下位关 《词表》是文献检索 系,包括概念是属概念,被 进行文献的主 的重要辅助工具,使用 包括的概念是种概念。利用 题分析,包括审读 时要注意从多角度查词, 属概念扩大检索途径,可提 文献,划分主题类 要充分利用辅助表。当 高查全率,利用种概念缩小 型和分析主题结构, 查找范围,可提高查准率。 查不到与某个具体概念 选直接表达文献主 相关关系指属种关系以 相对应的专指叙词时, 题概念的词表中的 外的具有交叉、并列、对立 可以把该概念分解为几 正式专指叙词; 关系的概念,以及形式与内 个较一般的概念(外延 容、本质与现象、原因与结 相对宽的),然后再去 果等关系。善于利用这些关 查表。 系,有利于提高查全率。
Cotton processing; processing of cotton;
processing of Egyptian cotton
5)“(F)” ——同字段检索 含义:“(F)”算符中F的含义为“Field”。这 个算符表示其两侧的检索词必须在同一个词段中 出现,(例如;同在题目字段或文摘字段)词序不 限,中间可插任意检索词项。 例如: POLLUTION (F) CONTROL 可命中 Control and management of industrial pollution 同在题目中 (F)邻近算符与AND布尔逻辑主要区别在于:(F)使 两个检索项在同一字段,AND布尔逻辑中两个检索 词会发生在不同字段中。
“微#机”,表示“微机”、“微型机”等词; “missile#”,表示“missile”、 “colo#r”,表示“color”、
“miss配符$的运用
(3)“$”——代表检索词中的任意多个汉字、西文字符或其 他字符,也可不代表任何汉字、西文字符或其他字符。 例如:
符,检出的词均包括词干本身。
(2)不同点: 使用“?”,检出的词不包括词干本身; 使用“$”,可代表多个汉字、西文字符或其他字符 检出的词包括词干本身。
运算符检索技术
☆使用运算符的检索技术
1. 2.
布尔逻辑检索技术 位臵检索技术
3.
4. 5.
截词检索技术
字段限定检索技术
原文检索技术
布尔逻辑
一、布尔逻辑检索技术
1。直接选词法
把握概念的含义
要利用概念之间
的属种关系和相
关关系增加检索 线索
注意利用词表
1 直接选词法
当检索题目中使用的自由词与规范词相一致时,可 直接选取。 例如: “ 光 缆 (optical fiber)” 、 “ 计 算 机 辅 助 设 计 (computer aided design)”等,这些词属于范围大、 命中率高的选词,检索人员可直接进行检索。这种 方法的结果最为接近主题。
3.通配符的运用
3 通配符的运用
(1)“?”——代表检索词中的一个汉字、西文字符或其他 字符。 例如: “计算?”,表示“计算机”、“计算器”等词; “航?器”,表示“航空器”、“航天器”等词;
“int??net”,表示“internet”、 “intranet”等词。
通配符﹟的运用
(2)“#”——代表检索词中的一个汉字、西文字符或其他 字符,也可不代表任何汉字、西文字符或其他字符。 例如: