信息检索基础知识
TP 自动化技术、计算技术
3 计算技术、计算机
31
计算机软件
316
操作系统
.1
分时操作系统
.2
实时操作系统
.7
Windows操作系统
39
计算机的应用
… F25 物资经济 F250 物资经济理论 F252 物资流通
… F5 交通运输经济 F50 交通运输经济理论
… F53 铁路运输经济 F54 陆路、公路运输经济
匹配有其匹配标准,这里涉及到两者一致性、 相关度等问题,按一定的标准筛选出符合要求的 信息。
精选ppt
3
信息检索一般过程
信息源
信息分析、 著录、标引
信息的表示
用户
检索语言
用户需求分析
数据库 匹配过程
输出检索结果 精选ppt
检索表达式
4
信息检索的过程往往需要一个评价反馈途径,多次比较匹配, 以获得最终的检索结果。其图示如下:
9
责任者 及其单位
中图分类号 文献标示码
关键词
正文
精选ppt
题名 摘要
10
分类语言
也属于主题语言。分类语言是按学科范畴划分而构成的一 种语言体系,它集中反映学科的系统性、反映它们的相关、 从属、派生等关系,从总体到局部分层、分面展开,形成 分类体系。由类目号码及名称作为检索语言,构成分类类 目表,如前述图书分类表、专利分类表用的都是分类语言 。
13
……
主题语言
包括:关键词语言、单元词语言、标题词语言、叙词语言等,它们有不同 的主题词表。主题词表达概念本身,在主题词表中通过参照系统来指示词 汇之间的关系。如”交通运输”、“国际物流”。主题语言分为规范主题语
言与非规范主题语言。
规范主题语言:规范主题语言是以自然语言为基础,经过标准化、规范化处
非规范主题语言:它是相对于规范主题语言而言的,以自然语言的语词作检
索标识,其所用词汇未经过规范化处理。非规范主题语言包括关键词语言和
纯自然语言。
※ 关键词语言
直接从文献信息的标题、摘要或内容本身抽取出来的用于揭示信息主题内容 的自由词。
※ 纯自然语言
指完全使用自然语言,即对一条完整的信息中任何词汇都可以进行检索。它 采用全文匹配法检索,主要运用于计算机全文数据库和网络信息检索中。使 用纯自然语言中检索中最大的问题是误检率极高。
精选ppt
2
检索的基本原理
信息检索基本原理的核心是用户信息需求与文 献信息集合的比较和选择, 是两者匹配(match)的 过程。 一方面是用户的信息需求, 一方面是组织有序的 文献信息集合,检索就是从用户特定的信息需求 出发,对特定的信息集合采用一定的方法、技术 手段,根据一定的线索与规则从中找出(search, locate, hit) 相关的信息。
精选ppt
15
★关键词的提炼
1、反映信息概念的准确性(作为检索词应当科学,表达的意思要准确,普遍使用,同时 应该简明、精练,尽可能简短明了,易输易检,词汇不宜过长)
理的词语,具有概念性、规范性、组配性、语义性和动态性。规范主题语言包括 单元词语言、标题词语言和叙词语言。
*单元词语言
是一种最基本的、不能再分的单位词语,亦称元词,它从文献内容中抽出, 再经规范,能表达一个独立的概念。比如“天气雷达”不是单元词,只有“天气” 和“雷达”才是单元词,在英语中,单元词经常是一个单词。如《WPI----规范化 主题词表》
具体体现为用分类号和类名来表达信息的主题概 念,如F25 物资经济
*中国图书馆图书分类法(5部类,22大类)
*美国国会图书馆分类法
* 杜威十进位分类法
* IPC国际专利分类法精选ppt
11
中图法大类表
精选ppt
12
《中图法》体系细分如下所示:
F 经济
T 工业技术
F0 经济学 F1世界各国经济概况、经济史、经济地理
第二章 信息检索基础知识
一 信息检索 二 信息检索语言、途径 三 信息检索技术 四 检索步骤
精选ppt
1
一、信息检索
信息检索:是指将信息
(主要指文献信息)按一定 的方式组织和存储起来,并 根据用户的需要找出相关信 息的过程。
信息检索
存储 检索
存检储索::是是对指信面息向进信行息著需录求、 标而引进、行整高序度,选编择制性检的索查工找 具过和程建。立检索系统的过程。
作用:1)、保证不同标引人员表征文献信息的一致性。
2)、使内容相同及相关的文献集中化。
ቤተ መጻሕፍቲ ባይዱ
3)、保证检索提问与文献信息标引的一致性。
4)、保证检索者按不同需求检索文献信息时,
都能获得最高的精选查ppt 全率和查准率。
7
2、检索语言的类型
检 索
表述文献外部 特征的语言
题名 责任者 机构 号码
语
言
分类法
的
391 391.7 391.72 391.73
信息处理(信息加工) 机器辅助技术 CAD CAM
F55 水陆运输经济 F56 航空运输经济 F57 城市运输经济
… F74 国际贸易
……
F740 国际贸易理论与方法
……
U 交通运输
U16 特种货物运输
U169 集装箱运输
精选pUp1t 69.6 集装箱运输管理
精选ppt
5
二 信息检索语言、途径
1、检索语言的含义及作用 2、检索语言的类型 3、检索途径
精选ppt
6
1、检索语言的含义及作用
检索语言:用于描述信息系统中信息的内容特征及外部特征和表达
用户信息提问的一种专门语言。它要求文献的标引者和检索者共同遵守。 按其使用的场合不同,检索语言常使用不同的名称,在存储的过程中用 来标引文献,称为标引语言,用以编制索引就称为索引语言,用来检索 文献则称为检索语言。是根据检索需要而创造的一种人工语言。
表述文献内部
类
特征的语言
主题法
型
单元词语言 标题词语言 叙词语言 关键词语言 纯自然语言
精选ppt
8
信息特征与标识对应关系
特征 外表特征
主题特征 内容特征 分类特征
标识 标题、作者、 主题词、 文摘、说明、 分类号 作者工作单位 关键词 全文
对应 精确对应
模糊对应 模糊(精确) 模糊对应 对应
精选ppt
*标题词语言
是从文献的题目和内容中抽出来,经过规范化处理的主题语言。美国工程信息公
司出版的《工程标题词表》(简称SHE)是典型的标题词语言,但该公司1993年以后
改用《工程索引叙词表》(Ei Thesaurns精)选。ppt
14
* 叙词语言
是以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻辑组 配的一种主语语言。如《汉语主题词表》、《INSPEC叙词表》(《科学文 摘》)、《工程索引叙词表》等。