4-信息检索基础
息按一定的方式组织和存贮起来,并根据信息用户的信 息需求查找所需信息的过程和技术,所以信息检索的全 称又叫“信息存贮与检索”(Information Storage and Retrieval)。信息检索又叫情报检索或文献检索, 文献信息检索是指从文献信息集合中查找所需文献或文 献中包含的信息内容的过程。
否 是否匹配
是
得到检索结果☺
检索过程
检索需求
检索者
主题分析
主题概念
用检索语言对 文献进行描述
检索表达式
(提问标识)
输出结果为零
4.1.2 信息检索系统
信息检索系统的构成 印刷型信息检索系统的类型 计算机信息检索系统
1、信息检索系统的构成
检索文档(file)。检索文档即标有检索标识的信 息集合(information set),如手工检索系统中的 书目、索引和文摘中由文献款目组成的记录、工具 书中的条目或短文组成的主体,计算机检索系统中 的数据库。
字段(field):字段是记录的基本单元,用 于描述事物的某一属性,字段与文献记录中的 著录项相对应。下成是常见的字段名称和代码 表。
目录的著录对象一般是整本书或整种刊物。 《全国总书目》揭示每年国内图书出版情况, 每个图书馆的OPAC(联机公共目录)揭示该馆的管藏 联合目录揭示许多家图书馆出版物收藏情况。
•目录著录格式示例
文献检索与信息素养教育/秦殿启编 著.——南京:南京大学出版社, 2008.8 258页;16厘米 ISBN 978-7-305-05393-1 I.文… II.秦… III.①情报检索 ② 信息学 IV.G252.7G201
信息检索原理
信息检索过程的实质是将检索提问 标识与存贮在检索工具(系统)中的标 引标识进行比较,两者一致或信息标引 的标识包含着检索提问标识的信息就是 检索命中的信息,这就是信息检索原理。
•检索原理图
文献存储过程
文献
主题分析 主题概念
情报工 作人员
用检索语言对 文献进行描述
文献标识
检索工具(系统)
第四章 信息检索基础
4.1 信息检索的原理、系统和效果评价 4.2 信息检索的基本步骤 4.3 检索语言、标引方法和实例 4.4 数据库检索技术
4.1 信息检索的原理、系统和效果评价
4.1.1 信息检索的原理 4.1.2信息检索的原理
信息检索 信息检索(Information Retrieval),是指将信
•文摘著录格式示例
0900371 具有输出时延的网络控制系统 故障检测 [刊,中]/张捷,薄煜明,胡 维礼//控制工程.——2009,(3).—— 254-256
考虑一类具有长时延的网络控制系统, 假定其传感器到控制器之间存在输出时 延,对其进行故障检测研究。……。参4
•文摘型检索工具的特点与作用
帮助读者克服语言上的障碍,因为在一种检索工具 中,无论原始文献是什么语种,其文摘都被译为统一 的一种语言(一般为英语).
3.计算机信息检索系统
(1)计算机信息检索系统构成 计算机信息检索系统由计算机检索终端、通
信设施、数据库、检索软件及其他应用软件四大 部分构成,其中数据库是检索系统的核心部分。 (2)数据库的定义和构成 定义:根据ISO/DIS 5127号标准,数据库 (database)的定义为:“至少由一种文档组成, 并能满足某一特定目的或某一特定数据处理系统需 要的一种数据集合。”通俗地说,数据库就是在计 算机存贮设备上按一定方式存贮的相互关联的数据 集合,是计算机技术与情报检索技术相结合的产 物,是计算机信息检索的基础。
(2)题录
• 题录的含义
题录是描述文献外部特征的文献条目。文献的 外部特征包括题名、著者、出处、卷期、页码、 时间、文献类型、语种等著录项目。
题录的著录对象一般是单篇文献。
•题录著录格式示例
09000458 统一用户数据库设计及其应 用/解冲锋(北京研究院网络业务部宽 带 业 务 研 究 ) . 何 潇 刘 波 // 信 息 网 络.——2009,(4).——40-42
对文摘的阅读,在一定程度上起到代替原文作 用.科技人员阅读了著录较为详细的文摘之后,大体 上就掌握了原文内容要点,不必再阅读原文了。这一 点,对于那些难索取到原文的“难得文献”尤为重要, 也大大节省了科技人员查找和阅读文献的时间
确定相关性,即帮助读者判断所检索到的文献是否 合乎需要,从而决定原始文献的取舍.
(3)文摘
• 文摘的定义
不仅描述文献的外表特征,而且还揭示文献的内容特征, 是带有摘要内容的、扩展了的题录,它比题录多出文摘正 文(摘要)等。我国国家标准GB 3468-1983; 《检索期刊 编辑总则》说明定义:“除题录部分外还对文献内容作实 质性描述的文献条目称之为文摘”。
文摘是文献原文浓缩后的产物,是忠实于原文内容的简要 记录单元。揭示文献的内容特征,在文摘的编写中不能加 入编写人员的主观见解和任何解释性说明,也不能对原文 作任何修改。
构成:数据库主要由“文档、记录、字段”三个 层次构成。
文档(file):文档,也称文件,在逻辑上是由 大量性质相同的记录组成的集合,它是数据库中 数据组织的基本形式,包括顺排文档和倒排文档。
下面是倒排文档的记录排列示意图:
标识词
记录号
管理
1,3
计算机
1
企业
1,2,3
网络
2,3
……
……
记录(record):记录由若干个字段组成,它是机 器可存取的基本单位,是顺序记录在磁带上供计算 机去读的格式化数据,用于数据资源的交换与共享。 在书目数据库中,一个记录相当于一条文摘或题录。 EBSCO期刊文献书目信息记录示例。
技术设备。技术设备指能贮存信息的技术设备,如 输入装置、储存器、输出装置、通信设备等。
语言工具。语言工具指检索语言、标引规则、输入 和输出标准等。
作用于系统的人。包括信息加工、标引人员、录入 人员、检索人员、系统管理维修人员等。
2、印刷型信息检索系统的类型
•目录的含义
目录是图书、期刊等出版物外表特征的揭示和报道。它 以完整的出版物(如一本书、一种期刊)作为著录的基本 单位,所以也可以说它是按某种顺序编排的文献清单。是 指导阅读和科学管理文献的重要手段。