当前位置:文档之家› 药学信息资源检索:第三部分 检索技术和检索策略

药学信息资源检索:第三部分 检索技术和检索策略

了一个原始信息的外部特征和内部特征。 字段(field)是比记录更小的单位,是组成记录的数
据项目即外部特征和内部特征等。
数据库的类型
按照数据库所含信息的内容划分:
书目(文摘)数据库 指南(事实型)数据库 数值型数据库 全文数据库 超文本型数据库
书目(文摘)数据库
(Bibliographic Database)
存储的是二次文献,包括文献的外部特征、题 录、文摘和主题词等,检索结果是所需文献 的线索而非原文。
许多书目数据库是印刷型文献检索工具的机 读版,如MEDLINE、IPA等
指南(事实)数据库
(Fact Database)
存储的是用来描述人物、机构、事物等信息的 情况、过程、现象的事实数据。
如名人录、机构指南、大事记等,均可归入事实 数据库。
美国医生咨询数据库PDQ:能提供有关癌症治疗和 临床实验的相关病因、诊断标准、治疗方案以及 最新研究进展等信息。
数值数据库 (Numeric Database)
主要包含的是数字数据,如各种统计数据、 科学实验数据、科学测量数据等。
例如医学上使用的化学制剂、药物的各种理化 参数、人体生理上的各种数值,人口统计数据 都可收入数值数据库。
计算机信息检索基础
主要内容
第一部分 计算机检索概述 第二部分 数据库结构和类型 第三部分 检索技术和检索策略
第一部分 计算机检索概述
计算机检索的基本原理
计算机信息检索------是指利用 计算机对信息进行存储与检索。
计算机信息检索的特点 与手工信息检索相比, 机检具有如下的优点:
检索速度快 检索途径多 更新快 资源共享 检索更方便灵活 检索结果可以直接输出
检索终端
通信网
INTERNET
结果返回
服务器(数据库终端)
结果输出
第二部分 数据库结构和类型
数据库结构 数据库类型
数据库的结构
数据库通常由若干个文档组成,每个文 档又由若干个记录组成,每条记录则包 含若干字段。
文档(file)是数据库中一部分记录的有序集合。 记录(record)是数据库的信息单元,每条记录描述
通用的截词符有:?和*
?代表一个字符(属有限截断);*代表不定个
字符(属无限截断)
如:wom?n 可查到woman 和 women
prepar *,可查到prepare, prepartion,
prepared等所有以prepar开头的单词。
另:按截断的位置不同又分为左截断、右截断和中间 截断
如 * cancer (cancer anticancer)
超文本型数据库
存储声音、图象和文字等多种信息。 如美国的蛋白质结构数据库PDB,该数据
库可以检索和观看蛋白质大分子的三维结 构。
第三部分 检索技术与基本程序
P131
检索技术
检索策略
一、检索技术 P131
1.布尔逻辑检索 2.截词检索 3.位置运算检索 4.字段限定检索
不同的检索系统表示方法不尽相同,以美国 DIALOG检索系统(具有代表性)使用的为例 。
在一个检索式中如果含有两个以上的布 尔逻辑符要注意运算次序:
()>NOT>AND>OR
例如:
(1) Vitamin A OR Vitamin C AND 合成 (2)(Vitamin A OR Vitamin C )AND 合成
练习:
利用布尔逻辑检索技术,写出检索 (1)阿司匹林的合成文献以及有关报道
缺点:收费;有时间限制回溯性差,无法 查久远的文献。
计算机信息检索的发展阶段P125
脱机批处理检索阶段(1954-1964) 联机检索阶段(1965- ) 光盘检索阶段(1980- ) 网络化检索阶段(1995- )
计算机检索系统:检索者,检索终端(PC机,同时也是
输出端),网络(或通信电缆),数据库存储服务器
1.1、布尔逻辑检索
在检索过程中用于表达词于词之间 的逻辑关系的算符就称为布尔逻辑运 算符。
分为三种布尔逻辑运算符: 逻辑与、逻辑或、逻辑非
逻辑与:是一种概念交叉或概念限定关系的
组配。
用“AND(and)”或“*” 算符表示
A AND B:表示让系统检索同时包含检 索词A和检索词B的信息
例如:查有关“雷尼替丁的含量测定”的文献,检索式可写成: 雷尼替丁 AND 含量测定
其作用是扩大检索范围,提高查全率
逻辑非:是一种具有概念排除关系的组配
用NOT (not)或 -算符表示 A NOT B:表示检索含有检索词A而不含检索
词B的信息。即在含有A检索词的文献中去除 含有B检索词的文献。
例如:查找有关“非儿童白血病”的文 献,检索式可写成:
白血病 NOT 儿童
其作用是缩小检索范围,提高查准率。
wom?n
prepar *,
截词检索是一种模糊检索,可以作为扩 大检索范围的手段,能够帮助提高检索 的查全率。但一定要合理使用,否则会 造成误检。
1.3、位置检索
是进行全文检索时,对检索词词与词A (nW) B A、B两词相隔最多n词,且前后次 序不变符合检出要求;
美国国立医学图书馆编制的化学物质毒性数据 库RTECS,包含10万多种化学物质的急、慢性 毒理实验数据。
全文数据库(Full Text Database)
存储的是原始文献的全文。
全文检索可直接获取原始资料,而不是书目检 索时的线索,提高了用户的检索效率。
如:中国期刊全文数据库、万方数据库、维普 数据库等全文数据库
(23259) (619)
其作用是缩小检索范围,提高查(准52) 率。
逻辑或:是一种具有概念并列关系的组配
用OR(or)或 +算符表示 A OR B:表示让系统查找含有检索词A或B,或同 时包括检索词A和检索词B的信息。
如:查有关 “肿瘤”的文献,检索式可写 成:
cancer OR tumor OR neoplasm
它的不良反应文献的检索表达式; (2)非高效液相法进行阿司匹林含量测
定的研究文献的检索表达式。
1.2、截词检索
截词检索就是用截断的词的一个局部进行的检索, 并认为凡满足这个词局部中的所有字符(串)的文 献,都为命中的文献。
通常用于西文检索中。主要用于检索词的单复数、 词性的词尾变化、词根相同的一类词,以及同一词 的拼法变异等。
相关主题