当前位置:
文档之家› 计算机信息检索专业课件computer retrieval
计算机信息检索专业课件computer retrieval
2013-8-30
上海大学图书馆情报部
二. 文献信息数据库原理
基本字段名称: 文摘(Abstracts)
文章题目(Article Title) 作者关键词(Author Key Words)
2013-8-30
上海大学图书馆情报部
二. 文献信息数据库原理
辅助字段名称: 作者 (Authors) 作者机构 期刊名称(Journal Title) 国际标准连续出版物号(ISSN)等。
记录号
基本字段
顺排文档示意图
辅助字段
记录4
记录6
2013-8-30
上海大学图书馆情报部
倒排文档示意图
作者倒排文档: 作者姓名 记录号 陈春秀 1 陈东方 3 程文娟 3 黄茂 5 秦大河 6 秦翔 6 吴元康 2 肖中新 4 上海大学图书馆情报部 2013-8-30
数据库(文档) / \ 顺排文档 倒排文档(若干) / / | \ 记录的集合 主题词 作者 期刊名称等倒排文档… | 字段 给出特征标识 记录数 / \ 基本字段 辅助字段
2013-8-30 上海大学图书馆情报部
二. 文献信息数据库原理 —数据库类型
二次文献(定义同印刷型检索工具) 目录:一批相关文献信息的著录集合,它以报道文 献出版或收藏信息为主要功能的工具。 题录:将图书、报刊等文献中论文的篇目按照一定 的排检方法编排而成的,供人们查找篇目出 处的工具。 文摘:以精练的语言把文献信息的重要内容、学术 观点、数据及结构准确地摘录下来,并按一 定的著录规则与排列方式编排起来,供读者 查阅使用的一种检索工具。 p.27
2013-8-30
上海大学图书馆情报部
二. 文献信息数据库原理
记录—某一实体全部属性的描述,是文档的基本 单元。全文数据库:一条记录对应一篇全文 书目数据库:一条记录对应一条文摘或题录 字段—某一实体的具体属性的描述,是记录的基 本单元。与文献内容相关:基本字段 与文献内容无关:辅助字段 (p.21)
由“文档—记录—字段”三个层次构成
文档:一般地说,一个数据库至少包
括一个顺排文档和一个倒排文档。 顺排文档:记录(记录号大小排列)的 集合。 内容无序性,无法直接检索。 倒排文档:记录的特征标识(作者、期刊名称等) 排序,其后列出含有此标识的记录号 提高检索效率。
2013-8-30 上海大学图书馆情报部
一.信息检索概念
从狭义来讲,是指利用检索工具查找文献的 过程 从广义来讲,信息检索全程应包括信息存贮 与检索两方面的含义。 存贮(information storing)是将信息按 一定的方式有序的组织起来 检索 (information retrieval)是根据用户 特定的需求将相关信息准确的提取出来。
计算机信息检索原理
(教材p.19-48)
2013-8-30
上海大学图书馆情报部
本章要点:
文献检索的定义、原理 文献信息数据库原理 计算机检索的步骤: • 主要概念的提取方法; • 检索概念的扩展方法; • 截词、逻辑算符、位置算符、字段限定和优 先算符; 检索策略调整的基本方法;
2013-8-30
2013-8-30 上海大学图书馆情报部
目录型数据库
揭示文献 外部信息: 封面信息、 馆藏信息
2013-8-30
上海大学图书馆情报部
题录数据库
来源出处
2013-8-30
上海大学图书馆情报部
文摘型数据库
篇名
摘要
来源出处
2013-8-30
上海大学图书馆情报部
二. 文献信息数据库原理
数据库的构成
上海大学图书馆情报部
一.信息检索概念
信息检索(Information Retrivel)定义 从任何信息集合中查找所需信息的活 动、过程与方法。 What’s searching like? ―Finding a needle in a haystack ‖
2013-8-30
上海大学图书馆情报部
2013-8-30
联机检索(online search)(20世纪50年代) 脱机检索(offline search)(60年代末70年代初) 光盘检索(CD search)(80年代) 网络检索(Internet/Web search)(90年代) 全球数字图书馆系统(digital global system)(21 世纪)
2013-8-30 上海大学图书馆情报部
一.信息检索概念
p.19
2013-8-30 上海大学图书馆情报部
一.信息检索概念
一个匹配( Match)过程
2013-8-30
上海大学图书馆情报部
一.信息检索概念-类型
按检索方式分:
手工检索:以手工操作方式,利用检索工具书进行 检索。 机器检索:以机械、机电、或电子化的方式,利用 检索系统进行检索。主要指计算机信息检索。
2013-8-30 上海大学图书馆情报部
Questions
数据库、文档、记录、字段间的相互关系? 怎样区分基本字段、辅助字段,并举例说明。
2013-8-30 上海大学图书馆情报部
二. 文献信息数据库原理
类型: 信息内容 文字型(大多数) 数值型 多媒体
加工深度 一次文献 全文型(中刊网、Elsevier等) 二次文献 目录型 (iPac、期刊目录等) 题录型 (SKBK等) 文摘型(Compendex等) 三次文献 网络在线词典等工具书
上海大学图书馆情报部
二.文献信息数据库原理
数据库的定义和类型 数据库的构成 文献信息数据库的检索原理 p. 20-22
2013-8-30
上海大学图书馆情报部
二.文献信息数据库原理
数据库的定义:
至少由一种文档 (file)组成,能满 足特定目的或特定 功能数据处理系统 需要的数据集合。
p.20
2013-8-30
上海大学图书馆情报部
二. 文献信息数据库原理
p.19
2013-8-30 上海大学图书馆情报部
一.信息检索概念
一个匹配( Match)过程
Hale Waihona Puke 2013-8-30上海大学图书馆情报部
二. 文献信息数据库原理
机检原理: 输入检索提问标识 →倒排文档(与数据库标引标识进行比较匹配, 给出记录篇数) →顺排文档(根据记录号读取) →输出结果 。 (结果不理想时要进一步修改检索提问标识) p.21