当前位置:
文档之家› 第2章信息检索原理与技术[1]
第2章信息检索原理与技术[1]
小结:
书目信息检索是利用各种目录、题录 和文摘工具获取有关信息的线索。 例如:
• 各种图书目录、期刊目录 • 国内外著名的题录和文摘有《全国
报刊索引》、《工程索引》(EI)、 《科学引文索引》(SCI)等。
第2章信息检索原理与技术[1]
全文信息检索是利用各种全文系统获 取有关的全文信息。
例如:中国科技期刊全文数据库 数据和事实检索是利用各种参考工具
数据信息检索
以具有数量性质并以数值形式表示的 数据为检索对象,是一种确定性检索。 检索的结果是经过测试和评价过的各种 数据,可用于比较分析和定量分析。它 一般以数据大全、手册、年鉴等为检索 工具。
第2章信息检索原理与技术[1]
示例
2008年申请中国发明专利和 获得授权发明专利的国家有哪些?
检索工具 中国统计年鉴
Ú 式1:(相变材料or 相变纤维)and (原位微胶囊化 or 微胶囊化) and 制 备
Ú 式2:phase change material and microencapsulation
Ú 式3:phase change fibers and microencapsulation
Ú 式4:phase change material and preparation Ú 式5:phase change fibers and preparation
第2章信息检索原理与技术[1]
检索语言的类型
分类语言 主题语言
体系分类语言 组配分类语言 混合分类语言 标题词语言 关键词语言 叙词语言 单元词语言
第2章信息检索原理与技术[1]
体系分类语言
Ú 体系分类语言是按学科逻辑分类的
原理,运用概念划分的方法,按知
识门类从总到分,从上到下,层层
划分,逐级展开组成分类表,并以
TL 原子能技术 TM 电工技术 TN 无线电电子学、电信技术 TP 自动化技术、计算机技术 TQ 化学工业 TS 轻工业、手工业 TU 建筑科学 TV 水利工程
第2章信息检索原理与技术[1]
关键词语言
关键词语言是一种主题语言(采 用表达某一事物或概念的名词术语 标引、存储和检索的一种语言)。 它是直接从原文的标题、摘要、全 文中,研究课题中抽选出来的具有 实质意义的、未经规范化处理的自 然语言词汇作为存储和检索依据的 一种检索语言。
以标题、作者、原文来源、摘要及收藏地点为检 索对象,是一种相关性检索。特点:检索结果不直接 解答课题用户提出的技术问题,只提供与之相关的线 索。一般以目录、索引、文摘数据库为检索工具。
例如:查找有关“城市生态环境及 可持续发展”方面的国内外信息有那
些?
检索工具: 中文科技期刊数据库、万方数据资源系统、 EI等。
分类表来标引、存储信息和检索信
息。特点是体现学科的系统性,反
映事物的平行、隶属和派生关系,
有利于从学科的角度进行族性检索,
达到较高的查全率。
第2章信息检索原理与技术[1]
《中图法》第四版分类体系组成及结构
第2章信息检索原理与技术[1]
《中图法》T 工业技术及环境科学 大类简表(二级类目表)
TB 一般工业技术 TD 矿业工程 TE 石油、天然气工业 TF 冶金工业 TG 金属学与金属工艺 TH 机械、仪表工业 TJ 武器工业 TK 能源与动力工程
第2章信息检索原理与技术[1]
2.制定检索策略
(1)选择检索词:
相变材料—phase change material 相变纤维—phase change fibers 微胶囊化—microencapsulation 制备—preparation
第2章信息检索原理与技术[1]
(2)使用相关检索技术构造提问式
第2章信息检索原理与技术[1]
式6:phase change material* and microencapsulation
第2章信息检索原理与技术[1]
2.4.1 布尔检索
布尔检索技术使用的逻辑算符及含义
(1)逻辑与 (2)逻辑或 (3)逻辑非
第2章信息检索原理与技术[1]
逻辑与
1. 概念:逻辑与是一种具有概念交叉 或概念限定关系的组配。
2. 算符:“ * ” 或 “ AND ” 3. 特点:增强专指度,提高查准率。
第2章信息检索原理与技术[1]
2.1.1 信息检索的含义
信息检索通常是指从任何方式 组成的信息集合中,查找特定用户 在特定时间和条件下所需信息的方 法与过程。因此,完整的信息检索 应包括以下两个方面:
1. 信息标引和存储过程 2. 信息的检索过程
第2章信息检索原理与技术[1]
2.1.2 信息检索的实质
将描述特定用户所需信息的提问 特征,与信息存储的检索标识进行 异同的比较,从中找出与提问特征 一致或基本一致的信息。提问特征 是指从欲检索课题中选择出能代表 信息需求的主题词、关键词或分类 号等。
第2章信息检索原理与技术[1]
示例一
区域发展中的生态环境特征研究 提问特征(关键词) 1.区域发展 生态环境 2.区域 生态 环境
第2章信息检索原理与技 术[1]
2020/11/25
第2章信息检索原理与技术[1]
2.1 信息检索概述 2.2 信息检索原理 2.3 信息检索方法 2.4 信息检索技术
第2章信息检索原理与技术[1]
2.1 信息检索概述
2.1.1信息检索的含义 2.1.2信息检索的实质 2.1.3信息检索的类型和特点
查全率 查准率
第2章信息检索原理与技信息检索系统是拥有一定 的存储、检索技术装备、存 储有各种信息,并能为用户 检索所需信息的服务工作系 统。目前常用的是手工检索 系统和计算机检索系统。
第2章信息检索原理与技术[1]
2.2.3 信息检索语言
检索语言又称标引语言, 是系统存储和检索时共同 使用的一种约定语言,以 达到信息存储和检索的一 致性,提高检索效率。
第2章信息检索原理与技术[1]
黑龙江省计算机软件工程技术研究中心 江苏省计算机软件工程研究中心 中山大学计算机软件研究所 云南省计算机软件技术开发研究中心 计算机软件国家工程研究中心 武汉大学计算机软件工程研究所 贵州大学计算机软件与理论研究所 浙江大学计算机软件研究所
第2章信息检索原理与技术[1]
例如:air NEAR pollution air SAME pollution
第2章信息检索原理与技术[1]
2.4.3 截词检索
截词检索是防止漏检,提高查全率的一种 常用检索技术,大多数数据库都提供了截词检 索的功能。用*或?表示。
截词是在检索词的适当位置进行截断,节 省输入的字符,达到较高的查全率,常用的有 后截词方式。
相关概念分别在一条记录中出现或同时 在一条记录中出现。
第2章信息检索原理与技术[1]
逻辑非
1. 概念:逻辑非是一种具有概念排除 关系的组配。
2. 算符: “ - ” 或 “ NOT ” 3. 特点:提高查准率,影响查全率。 4. 举例: 制药废水 NOT 放射废水,
表示检索出的记录中要排除含有 “放射废水 ”的记录。
书获取有关的确定性数据或事实信息。 例如:各种百科全书、年鉴、手册等。
第2章信息检索原理与技术[1]
2.2 信息检索原理
2.2.1 信息检索效率 2.2.2 信息检索系统 2.2.3 信息检索语言
第2章信息检索原理与技术[1]
2.2.1 信息检索效率
信息检索效率是评价一个检 索系统性能优劣的质量标准,它 贯穿于信息的存储和检索的全过 程。其评价指标主要是:
一、检索目的和要求: 目的:科技立项 要求:国内外有无 1.相变储能纤维制备的研究报道; 2.已采用的制备方法有哪些?
第2章信息检索原理与技术[1]
二、主题分析
第一层面:相变储能纤维—相变材料 第二层面:制备—微胶囊化
第2章信息检索原理与技术[1]
2.3.2 制定检索策略
检索策略是为了达到检索 目标而制定的具体检索方案。 包括选择检索系统、确定检 索途径或检索词、拟定检索 程序。按检索手段分为手工 检索策略和上机检索策略。
第2章信息检索原理与技术[1]
2.4.2 词位检索
词位检索具有限定检索词词 间位置关系的功能,可弥补布尔 逻辑算符只是定性规定检索词的 范围,达到提高检准率的效果。
第2章信息检索原理与技术[1]
邻近检索
用于网络数据库,常用的位置逻辑算 符有: 同句、同段、NERA 、SAME。
NERA表示两词之间不得多于9个词, 词前后位置任意,SAME要求检索词在同 一个句子中,这里所指的同一个句子是 两个句号之间的字符串,检索词在句子 中的顺序任意。
第2章信息检索原理与技术[1]
示例二
食品中常见病原菌快速检测
提问特征(关键词)
食品、食物 病原菌 检测
第2章信息检索原理与技术[1]
2.1.3 信息检索的类型和特点
1. 书目信息检索 2. 全文信息检索 3. 数据信息检索 4. 事实信息检索 5. 小结
第2章信息检索原理与技术[1]
书目信息检索
限制检索在光盘数据库中一般用 前、后缀表示,在网络数据库中一 般使用下拉菜单进行选择限制。
第2章信息检索原理与技术[1]
2.4.5信息检索方法及技术应用实例
检索课题:相变储能纤维的制备
1.信息需求分析 (1)明确检索目的与要求
1)检索目的:学位论文开题查新 2)检索要求:国内外相变储能纤维的制备 的相关信息。 (2)进行主题分析,确定主题范围。根据检索 目的与要求,该课题涉及的主题范围重点为: 相变储能纤维、制备。
4.举例: “遥感技术” AND “监测”,
表示两个概念应同时包含在一条记录中。
第2章信息检索原理与技术[1]
逻辑或