当前位置:
文档之家› 演示文稿信息检索概述武大黄如花
演示文稿信息检索概述武大黄如花
3 信息检索的原理
4 信息检索语言
《中图法》等级分明的科学系统
O
一级类目
数、理、化
O1 O3 O4 O6 O7 …… 二级类目
数学 力学 物理 化学 晶体
O11 O12
O13 ……
三级类目
古典数学 初等数学 高等数学
O121 O122
O123 O124
四级类目
算术 初等代数 初等几何 三角
• 国内外常用的叙词表:
• 根据检索手段的不同 • Manual retrieval • Disc retrieval • Online retrieval • Web-based retrieval
• 根据检索对象形式 • document retrieval • data retrieval • fact retrieval
• UNESCO 与IFLA信息素质教育的中长期合作项目
• UNESCO :An Analysis of Information Literacy Education Worldwide
• UNESCO全球信息素质教育资源指南 /
• OECD (经济合作组织)2000年起组织Programme for International Student Assessment( PISA)项目
信息检索概述武大黄如花ppt课件
Outline • 信息检索的基本概念 • 信息检索的历史 • 信息检索模型 • 信息检索系统的结构与评价
第一节 信息检索的基本概念
•
More refined and abstract
Wisdom
Knowledge Information
Data
Information Hierarchy
式的编制 • 前者选择数据库资源,后者实现检索目标 • 一般也直接将检索式视为搜索策略
• 信息素质的含义
• 信息素养(information literacy)又称信息素质,由美国信息产业协会主 席保罗·车可斯基(Paul Zurkowski)在1974年首先提出
• 他定义为:“利用大量信息工具及主要信息源使问题得到解答的技术和 技能。”
• PISA蕴含的意义
• 在这个迅速变化的时代,学生不可能在学校里学到将来所需的每一种知 识和技能,必须在具备阅读、数学、科学等方面基础的前提下,努力培 养自己的学习能力。学会如何学习(learn how to learn),将比学会事 实(learn to know)更为重要。
2 信息检索的种类
resources on the Internet(网络资源) • online resources(联机资源)
信息源
记录型
实物型
智力型
零次
载体形式
式
印刷型 缩微型 声像型 电子型
图书
一次信息
期
刊
处理级别
二次信息 三次信息
报 专利文献
纸
会议文献
科技报告
学位论文
编辑出版形式
标准文献 技术档案
产品资料
• 后来又将其解释为“人们在解答问题时利用信息的技术和技能”。
• Librarians’ Information Literacy Annual Conference (LILAC ),2005,国际会议
• 国际图联(International Federation of Library Associations and Institutions ,IFLA)发布《信息素质评价指南》,促进发展中国家信息 素质教育
1 信息检索的含义
• 广义的信息检索
• information storage • information retrieval
• 狭义的信息检索
• information retrieval
信息检索的常用术语
• 检索词:用户输入的字、词、字符或短语 • 检索式:检索提问表达式 • 检索策略:是对查询的全面策划,在操作上主要指数据库的选择和检索
第三节 信息检索的模型
• 浏览型模型检索型模型
• 集合论模型 • 代数论模型 • 概率论模型
第四节 信息检索系统的结构与评价
• 信息检索系统的含义 • 信息检索系统的类型 • 信息检索系统的物理结构 • 信息检索系统的逻辑结构
评价信息检索系统效果的指标
• 我国的《汉语主题词表》 • 美国国会图书馆主题词表(LCSH) • 英国《科学文摘》使用的《INSPEC叙词表》 • 美国《工程索引》使用的《COMPENDEX叙词表》
第二节 信息检索的历史
• 手工检索(1876-1945) • 机械信息检索 (1945—1954) • 脱机批处理检索(1954-1965) • 国际联机检索 (1965-) • 光盘检索(1980-) • 网络检索(1991--) • 后四者统称为计算机信息检索 • 多种方法并存,网络检索最有发展前景
• 查全率(Recall Factor,R) • 查准率(Precision Factor, P) • 漏检率(Omission Factor) • 误检率(Noise Factor) • 新颖率 • 检索速度
重要指标
• 查全率是系统在进行某一检索时,检 • 查准率是系统在进行某一检索时,检
出的相关信息量与系统信息库中相关 出的相关信息量与检出的信息总量的
信息资源的有关概念
• 文献(literature,document) • 信息资源(information resource)
• electronic resources(电子资源) • virtual resources(虚拟资源) • digital resources(数字资源 ) • networked resources, WWW resources, web-based resources,
的信息总量的比率。
比率
查全率:R =
被检出相关文献量 相关文献总量
被检出相关文献量 查准率:P =
被检出文献总量
未检出相关文献量 漏检率:M =
相关文献总量
被检出非相关文献量 误检率:N =
被检出文献总量
提高检索效果的措施
• 选择质量较高的检索系统
• 提高检索者的检索水平