当前位置:
文档之家› 电子信息检索第一章 信息检索概述
电子信息检索第一章 信息检索概述
超媒体检索 对超文本检索的补充,存储对象超出了文本范 畴,融入了静、动态图像(形)以及声音等 多媒体信息。
2020/5/21
3
三、信息检索研究的核心问题
检索语言兼容与整合的研究 数据库与文档的研究 有关检索系统的研究 检索策略的研究 网络搜索工具研究 检索服务的研究
2020/5/21
根据描述文献的特征,分为表达文献外表特 征的检索语言和表达文献内容特征的检索语 言。
2020/5/21
11
2020/5/21
12
3.分类语言
分类语言以学科体系为基础,将各种概念按 照学科性质进行分类和系统排列,并按分类 编排组织成一个完整的体系。
它按照知识门类的逻辑次序,运用概念划分 和归属的方法,由总到分,由一般到个别, 由抽象到具体,由低级到高级,由简单到复 杂这样层层划分,逐级展开,形成一个严格 有序的等级制体系。
对内容相同及相关的文献信息加以集中或揭 示其相关性,使大量分散的文献存贮系统化、 组织化,便于进行有规律的检索
便于将标引用语与检索用语进行相符性比较
2020/5/21
10
2.检索语言的类型
根据是否规范化,分为规范化的语言(人工 语言,如 主题词语言)和非规范化的语言 (自然语言)。
根据包括的专业范围,分为综合性和专用性 语言。
2020/5/21
13
(1)分类语言的特点
体系分类语言是以学科划分类目,符合 人们认识事物的规律和处理事物的习惯
体系分类语言强调知识的系统性,方便 人们按学科、专业系统检索有关文献资 料 ,能够达到族性检索,可以获得较高 的查全率
便于组织图书馆资料排架
2020/5/21
14
不足之处
检索者检索课题时首先必须了解课题的学科体系才能 顺利查找到相应的类目,如果不熟悉学科体系,会带 来一定的困难 。
体系分类语言采用尽量列举类目的方法,但是受到类 目数量的限制,缺乏专指性,查准率不高。
由于分类表的结构是固定的,不便于随时修订和增设 新的类目。
体系分类语言采用分类号作为检索标识,检索文献时, 需要将检索文献的主题内容转换成分类号,转换过程
中,容易产生误差,造成误检。
2020/5/21
15
体系分类语言广泛应用于图书、资料的分类、
2020/5/21
1
二、信息检索的类型
按存储和检索的内容分为:
文献检索(Document Retrieval ) 以文献(包括文摘、题录或全文)为检索对象,分为 手工式检索和计算机化的文献检索。
数据检索(Data Retrieval) 数据检索的对象是数值性数据,即具有数量性质并以 数值形式表示的量化信息。
定义:
检索语言,又称标引语言、索引语言、信息 检索语言等,是根据检索需要而编制的一种 人工语言。世界上的检索语言很多,如《中 国图书馆分类法》、《杜威十进位分类法》、 《中国科学院图书馆图书分类法》、 《INSPEC叙词表》等。
2020/5/21
9
1.检索语言的功能:
简单明了而又规范化地标引文献的主题内容 及其外表特征
2020/5/21
16
基本部类
基本大类
马克思主义、列宁主义
毛泽东思想、邓小平理论——A马克思主义、列宁主义、毛泽东思想、邓小平理论
4
四、信息检索的地位和作用
促进信息资源的开发和利用 协助管理者做出正确的决策 便于继承和借鉴前人的成果,避免重复
研究或走弯路 节省研究人员查找文献的时间
2020/5/21
5
第二节 信息检索的原理
一、信息检索的原理
就是检索提问标识与存储在检索工具中 的标引标识进行比较,两者一致或者信 息标引的标识包含着检索提问标识,则 具有该标识的信息就从检索工具输出, 输出的信息就是检索命中的信息。 简单的讲,就是匹配。
事实检索(Fact Retrieval) 事实检索的对象是已经存在的各种事实的有关资料 。
文献检索是一种相关性检索,数据检索是一种确定性 检索。
2020/5/21
2
按系统中信息的组织方式分为:
全文检索 指检索系统中存储的是整篇文章乃至整本书。
超文本检索 从信息在系统中的组织方式不同而言,提供浏 览式查询。பைடு நூலகம்
各检索系统的检索原理基本相同。
2020/5/21
6
信息检索的全过程包括存储和检索两个过程。
存储过程就是按照主题词表或分类表及使用原则对原始信息进 行处理,形成信息特征标识,为检索提供经过整序的信息集合 的过程。具体来说,信息的存储包括对信息的著录、标引以及 编排正文和所附索引等。
所谓信息的著录是按照一定的规则对信息的外表特征和内容特 征加以简单明确的表述。信息外表特征包括信息的著者、题名、 来源、卷期、页次、年月、号码、文种等。信息内容特征包括 主题词、关键词和文摘。
第一章 信息检索概述
第一节 信息检索的定义
一、信息检索的定义
信息检索(information retrieval)是指将信息按一 定的方式组织和存储起来,并根据信息用户的需要找 出有关的信息的过程和技术。全称叫信息存储与检索 (information storage and retrieval)。狭义的信息检 索则仅指该过程的后半部分,即从信息集合中找出所 需要的信息的过程,相当于人们所说的信息查询 (information search)。
信息的标引就是就信息的内容按一定的分类表或主题词表给出 分类号或主题词。
检索过程则是按照同样的主题词表或分类表及组配原则分析课 题,形成检索提问标识,根据存储所提供的检索途径,从信息 集合中查获与检索提问标识相符的信息特征标识的过程。
2020/5/21
7
信息存储与检索原理
2020/5/21
8
二、检索语言
排架和检索,如在我国应用较广的《中国图
书馆图书分类法》(简称中图法)、《中国科学 院图书馆图书分类法》(简称科图法)、《人民 大学图书馆图书分类法》(简称人大法)以及国 外 的 《 杜 威 十 进 分 类 法 》(Dewey Decimal Classification , 简 称 杜 威 法 , DDC 或 DC) 、 《美国国会图书馆图书分类法》(Library Qf Congress Classification,简称国会法或LC分 类法)都属于这一类。