当前位置:文档之家› 信息检索知识ppt课件

信息检索知识ppt课件

的检索工具,如书刊或数据库,从大量的文献 资料中找到所需文献的过程。 包括,书目检索、题录或索引检索、文摘检索、 全文检索。
2
二、检索原理与检索语言
1 、检索原理
是指通过一定的方法和手段,使信息存 储与检索两个过程所采用的特征和标识 达到一致,以便有效地获取和利用文献。 存储过程--对文献进行标引 检索过程--根据需求,确定提问式
3
2 、检索语言(检索标识,Retrieval Language)
检索语言是一种在文献存储和检索过 程中共同使用的语言。它的用途是描述文 献特征,表达情报提问,并使两者能相互 沟通。 可分为规范化语言(受控语言)和非规范 化语言(自然语言)。
4
规范化语言:是指对文献检索用语的概念加以人 工控制和规范,把检索语言中各种同义词、多 义词、近义词、同形异义词等进行规范化处理, 使每个检索词只能表达一个概念。
一、信息检索(Information Retrieval )
包括两个部分:
一是信息存储,即把大量分散的无序的信息
集中起来,经过加工,使之有序化、系统 化,成为有功能的检索工具或检索系统。
二是信息检索,利用已组织好的检索工具或
检索系统,按照课题的要求将所需信息查 找出来。
1
信息检索类型,分为:
数据检索(Data Retrieval)--特定的数据 事实检索(Fact Retrieval)--特定的事实 文献检索(Document Retrieval)--特定的文献 是根据课题的要求,采用科学的方法,利用专门
15
按职能划分目录种类: 出版发行目录 馆藏目录:按检索标目划分为
书名目录(Title Catalogue) 著者目录(Author Catalogue ) 分类目录(Classified Catalogue) 主题目录(Subject Catalogue )
联合目录 资料来源目录,如IM、CA、BA
如:drug near abuse检索出的是同一句话中
同时出现这两个词的记录。(也可说成是两个 词之间没有句号的文献)。
11
邻近度算符Near# 其中“#”代表一个常数,检索式“A near# B”
表示检索词A和检索词B之间有0~#个单词的文献 (A和B在同一记录、同一字段里)。在near后加 一个数字,指定两个词的邻近程度,且不论语 序。
如:information near2 retrieval表示检索词
information和retrieval同时出现在一个句子中, 且这两个检索词之间的单词数不超过两个的那些 文献为命中文献。
12
四、文献检索工具的含义和类型
1 、检索工具的定义与特点
定义:检索工具(Retrieval Device)是指用 于报道、存储和查找文献的工具。它具有 存储(编制过程)和检索(查找过程)两 大职能。
词B不仅要同时出现在一条记录中,还要同时 出现在一个字段里的文献才是命中文献.
如:“drug with abuse”检索出的是同一个
字段中同时出现这两个词的记录。
10
邻近度算符Near
检索式“A near B”表示检索词A和检索 词B不仅要同时出现在一条记录的同一字段里, 还必须在同一个子字段(一句话)里的文献才 是命中文献。
例:《IM》的Subject Index;《CA》的CS、 GS;《中目》的分类目次
非规范化语言:它对检索用语中的各种同义词、 多义词、近义词、同形异义词等不加处理,所 以也叫自然语言,如关键词。
例:《CA》Keyword Index
5
文献特征 文献标识
目录或索引
---------------------------------------------------------------------------------------------------
6
逻辑“非” NOT/检索式“A not B”表示包含检索词A同时不
包含检索词B的文献为命中文献。 如:查“动物的乙肝病毒(不要人的)”的文献
的检索式为hepatitis B virus(乙肝病毒) not human(人类)。
A NOT B
9
邻近度算符 With 检索式“A with B”表示检索词A和检索
分类索引(Classified Index) 主题索引(Subject Index) 关键词索引(Keyword Index)
分类主题索引(Classified and Subject Index)

其它专用索引 分子式索引,环系索引等
(Formula Index),(Index of Ring system)
17
文摘(Abstract,Excerpta,Digest)
含义: 文摘是指对文献内容选择重要部分以简练的形
式作为摘要,并按一定的原则和方法编排而 成的一种检索工具。 著录内容: 同⑵ + 文摘。 如,中国医学文摘,中国药学文摘, 中国生物学 文 摘,CA,BA,CBM,CMCC,MEDLINE/PubMed 等。
特点:(1)收摘一次文献、(2)著录文献特征、 (3)提供多种检索手段
13
2 检索工具的类型
*按摘录方式划分如下:
目录 题录或索引 文摘 全文
14
目录(Catalogue)

整出版物(如一本书或一种刊或一个会议录 的名称)作为著录的基本单位来报道和记录 文献。 著录内容: 文献名称、著者、出版项与馆藏信息等内容。
16
题录(Title)或索引(Index)
概念:
其一,是指检索工具,它揭示文献的外表特征和内容特 征,即著录文献是以一个完整出版物的某一部分(如 书的章节或刊中一篇论文题目)为著录单位。
其二,是指检索途径(附录式索引),如,分类索引、 主题索引、生物体索引、著者索引等。
著录内容:
论文题目、著者、文献出处(刊名、发表年月、卷、期、 页码)及文种等。如,《中目》、《IM》、《CNKI》 免费题录等。
检 外部特征 文献名称 文献名称索引(Title Index)引用期刊一览表等
著者名称 著者索引(Author Index)著者、专利权人索引
文献序号 序号索引(Number Index)专利号、报告号等

引用文献 引文索引(Citation Index)SCI
内部特征 分类号
主题词

关键词
分类主题
相关主题