当前位置:
文档之家› 最新计算机文献检索是随着计算机的出现而发展起来的计算机
最新计算机文献检索是随着计算机的出现而发展起来的计算机
结果不匹配
息
数
从记录号倒排文档中调取记录号集合
据
篇数不合要求
库
的
记录号集合间的逻辑运算
检
重新调整检索策略
索
原
顺排文档中调取记录
理
示
输出命中记录
意
图
结束检索
记录内容不合要求
第三节 计算机检索技术
1、布尔逻辑检索功能 2、词间位置检索功能 3、截词检索功能 4、字段限定检索功能
❖布尔逻辑检索功能:用布尔逻辑算符来组配
计算机文献检索是随着计算机 的出现而发展起来的计算机
❖ 本章主要内容
第一 节 计Leabharlann 机检索概述 第二节 计算机检索原理 第三节 计算机检索技术 第四节 计算机检索步骤
数据库类型(按内容分型)
• 书目数据库(如图书馆书目数据库) • 数值数据库(如人口统计数据库) • 事实数据库(科研机构数据库) • 全文数据库中国学术期刊全文数据库、中文科技期刊全文数
据库等
• 软件数据库
❖ 数据库
➢ 数据库的定义美国著名信息检索专家Martha,E.Williams给 数
据库 的定义是“包含书目及与文献有关的数据的机读记录的 有组织 的集合。” 按内容性质分:
➢书目型数据库(Bibliographic Database)
如:国外三大农业数据库、馆藏书目数据库
➢全文型数据库(Full Text Database)
表示方法 apple? in ti machine in ab building in de au=liu bn=0-5635-0144-4 cc=921 cd=19960501 cl=hangzhou ct=robotics and au tomation cy=1996
dt=book la=english py>=1990 sn=1060=9857 so=power
W 算符是With的缩写,表示在此算符两侧的检索词必须按输入时的前后 顺序排列,不能颠倒。所连接的词之间除可以有一个空格、标点或连接号外不得 夹有任何其他单词或字母。
例: intelligent (W) robot? (Ei Compendex Plus)
Wn( 或nW) 表示在此算符两侧的检索词必须按输入时的前后顺序排列,
❖ 数据库的利用:计算机信息存储的逆过程。将课题的 主题概念按系统词表进行规范化处理,转换成系统语言, 形成检索提问特征标识,根据需要使用布尔逻辑运算符制 定检索策略,将检索提问式输入计算机,在数据库中查找 所需信息。
打开数据库
另选数据库
计
算
输入检索提问
机
(检索式)
重新输入检索标识
文
献
信
在索引词典文档中比较和匹配
不能颠倒。但允许在连接的两个词之间最多插入n个单元词。
例: intelligent w1 robot*
(OCLC FirstSearch)
2. N - Near
N算符是Near的缩写,表示此算符两侧的检索词必须紧密相连,所连接的 词之间不允许插入任何其他单词或字母。但词序可以颠倒。
简例:逻辑运算 NOT
查玉米方面的文献,但除甜玉米方面的文 献
A NOT B
A:玉米 B:甜玉米
❖ 词间位置检索功能
文献记录中词语的相对次序不同,所表达的意 思就可能不同。同样在检索式中,检索词的相 对次序不同,表达的检索意图也不一样,布尔 逻辑运算符有时难以表达某些检索课题的确切 提问要求,用词间位置算符来限定和组配检索 词,可弥补布尔逻辑算符只是定性规定检索词 的范围,而没有限定检索词位置关系,易造成 误检的不足。
检索式:determination with amino acids with wheat 词间位置算符在不同系统中的使用方法不同: L在Dialog 系统中主要位置算符及其使用方法 L在SPIRS系统中,位置算符只使用两个:
with 、near 那么,位置算符的应用,能缩小检索范围
提高查准率。
1.W - With
词间位置检索技术就是利用一些特定的位 置算符来表达检索词之间的位置关系,并 且可以不用叙词表而直接使用自由词进 行检索的方法。有的书上还把这种检索称 为原文检索。这种检索在利用TI和AB途径 检索时,对检索质量影响很大。
例:检索“小麦中氨基酸的测定” (determination of amino acids in wheat)
检索词以确定文献的命中与否。其算符的相互匹 配方式一共有8种。
逻辑与(逻辑乘) 逻辑或
异或关系
“逻辑非”的“逻辑或”关系 “逻辑或”的“逻辑非”
逻辑非 被标引在该词下的
主 要
是
三
种
简例:逻辑运算 AND
计算机在图书馆中的应用
计算机
图书馆
简例:逻辑运算 OR
• 微量元素与克山病的关系
A
B
C
A or B or C
如:中国学术期刊全文数据库、中文科技期刊全文数据库等。
➢ 数值型数据库(Numeric Database)
存贮有科学数据,统计资料等数据。
➢ 事实型数据库(Fact Database)
存贮有企业名录、百科全书、人名录等有利用价值的信息。
➢ 超文本型数据库(Hypertext Database)
➢ 数据库的结构 字段(Field)、记录( Record)和文档(File)
字段代码 TI AB DE AU BN CC CD CL CT CY DT LA PY SN SO
字段名 Title Abstract Descriptors Author ISBN CAL Classification(分类号) Conference Date Conference Location(会址) Conference Title Conference Year Document Type Language Publication Year ISSN Source Publication
第二节 计算机检索的基本原理
计算机信息检索是利用计算机对信息进行存储与检索 的过程,即数据库的建立与利用。 示意图
❖ 数据库的建立:按照既定的建库方针、目的、标准等 从信息源中选择所需文献,对需录入的文献进行加工,也 就是对文献的外表特征和内容特征进行分析和标引,形成 文献特征的标识,把这些标识输入计算机,计算机再按事 先设计好的规则自动把这些标识排序形成多种索引,建成 数据库,为信息检索提供有规可循的检索途径。