当前位置:文档之家› 第二讲_计算机信息检索基础知识

第二讲_计算机信息检索基础知识

• 数据库(文档)
由若干数量的记录构成的数据的集合。大型的 数据库检索系统中称为文档。
可检索字段
中国期刊网字段示例
命中记录列表
详 细 记 录
四 计算机检索技术
1 布尔逻辑运算符 2 截词算符 3 字段限制
4 范围限制 5.短语检索 6.括号检索
1、布尔逻辑运算符
①逻辑与: “*”或“and” ②逻辑或: “+”或“or” ③逻辑非: “-”或“not”
第二讲 计算机信息检索基础知识
主要内容
计算机检索的概念 数据库及其类型 数据库的结构 计算机检索技术 计算机检索的步骤、方法、途径
一 计算机信息检索的定义
指利用计算机存储和检索信息。
具体地说,就是指人们在计算机或计算 机检索网络的终端机上,使用特定的检 索指令、检索词和检索策略,从计算机 检索系统的数据库中检索出所需的信息 的过程。
“吸烟与心脏病的关系”
(smok* OR tobacco) AND (cardiopathy OR heart disease OR heart trouble OR heart attack)
4 进行检索
可利用数据库提供的不同级别 的检索界 面进行检索
--初级检索 --高级检索
5 分析检索结果 调整检索策略
检索点 即检索途径或检索入口、检 索字段。检索点正确与否,决定着 检索结果的数量与质量。
确定检索词
如:“吸烟与心脏病的关系” 可以表达为 connection between somking and heart disease 通过分析发现,其中,只有somking和heart disease两个概念词,而“connection between” 则不属于概念词。
检全率递增
题名 关键词( 文摘 )
检准率递增
全文
命中31篇 命中80篇
命中44篇 命中410篇
4 范围限制
指对检索词的范围(如时间、国别、语 种、信息类型等)进行约束或压缩的方 法,它大多通过检索系统的限制指令或 菜单选择来实现。
工程索引检索界面
5.短语检索
用“”表示,检索出与“”内容完 全相同的短语,提高检索的精度和 准确度。
1) 根据词表或数据库中的索引选词
2) 从专业词典、百科全书等参考工具中 选词
3) 利用中文全文数据库选择英文检索词
编制检索式
使用逻辑算符(AND, OR, NOT) 、截词、 位置算符, 限制检索条件至作者, 刊物 或年代 .
调整其他设定
选定检索结果的显示方式– 日期, 相关度等排序

Knowledge、CSAIDS、EBSCOHost、ProQuestordjne等多个著名 检索平台综合分析布尔逻辑、位置逻辑、模糊检索技术、网络叙 词表构建技术在网络数据库的应用,研究表明信息检索技术已深 深植入网络信息资源管理之中,深入剖析信息检索技术,可以清 晰揭示提问表达式的构建机理,掌握网络数据库的原理及使用方 法,为网络信息资源评价和建设提供依据。
数值型数据库 提供各类数值型数据
图象数据库 以图形、图象为记录单位
返回
返回
返回
返回
返回
数据库类型—按收录专业范围划分
综合性数据库
收录多个学科或专业的信息资料。如中国期刊网
专业性数据库
收录单一学科或专业的信息资料。
专题性数据库
收录某一特定专题的信息资料
综合型数据库
返回
举例:
【题 名】信息检索技术在网络数据库中的应用研究 【作 者】邹小筑[1] 缪红梅[2] 【机 构】[1]南京大学信息管理系,南京210093 [2]南京航空航天
大学,南京210016 【刊 名】图书情报工作.2007,51(2).-104-106,131 【ISSN号】0252-3116 【关键词】信息检索技术 网络数据库 检索平台 【文 摘】以信息检索技术为脉络,结合Ei Village2、ISI Web of
dam* dam dams
wom?n woman women
3、字段限制
指将检索词限定在特定的字段中进行。 • 同样的检索词,选择在不同字段中进行检索,
得到的结果是不同的。
• 检索系统通常都会设置默认的检索字段,如 “所有字段”。如果想指定在特定的字段中 查找检索词,就需要调整检索字段,进行字 段限制。
概念1:somking 概念2:heart disease
针对每一个概念,选择与之相 关的同义词或相关词
与somking相关的词有: smoker,smokers,tobacco等;
heart disease的同义词有cardiopathy,heart trouble, heart attack.
2.选择信息资源
是否与检索课题相关的资源都要检索 选择哪些学科的信息资源 选择哪些语种的信息资源 信息资源覆盖的年限是否符合需求 信息资源的特点及其针对性如何
3、构造检索式 选择检索点
检索式 是表达用户检索提问的逻辑 表达式,由基于检索概念产生的检 索词和各种组配算符构成。
作用:
缩小检索范围, 提高检准率
②“或”算符 or OR +
“或”算符可描述概念间的并列关系和相关 关系,用来组配同义词或相关词等。
含义:检出文献中包含有被其连接的任 意一个词或词组。
作用:扩大检索范围,提高查全率。 例如:自行车 + 脚踏车
CAD or computer aided design
缺省字段 为“篇名”
缺省字段为 “关键词”
缺省字段为 “All fields”
如果从文献的内容特征出发查找文献, 可选的检索字段有“篇(题)名 title”、 “关键词 keyword”、“文摘 abstract” 以及“全文 fulltext”。
一般,如果使用相同的检索词分别在这 几个字段中检索,那么检到的文献数会 依次递增,而命中的准确率则依次递减。
专业数据库 :
返回
专题数据库
三 数据库的结构—字段、记录和
文档
• 字段:文献著录的基本单元,反映文献
外部特征和内容特征的每一项目,在数 据库中就称为字段。
如:关键词KW、题名TI、文摘AB、作者AU、 刊名JN、出版时间PY、语种LA等
• 记录
由若干不同字段组成的文献单元,一条记录在 数据库中代表一篇文献。
同义词及相关词 增加被检索的数据库 – 确定其他数据库是否
覆盖你所要的主题
满意
是否已全部获取所需?
打印、电邮 或 存档
需否获取与题录相关的全文 ?
查找图书馆馆馆藏书目系统(OPAC),确定是否有纸本馆藏 查找图书馆订购的全文数据库 通过搜索引擎查找互联网开放获取(Open Access)的免费全文信息 通过馆际互借/文献传递从其他图书馆获取文献原文
课堂练习:
例1:课题名称:汽车导航系统的研究 例2. 课题名称:手持式心电图机 例3. 课题名称: 酸奶机
给出以上课题的检索词和检索式
例1:课题名称:汽车导航系统
的研究
关键词1. 汽车 机动车
关键词2. 导航系统 全球定位系统 GPS
关键词3. 研究 设计
调查
检索式的构造:
①“与”算符 and AND *
“与”算符用于描述概念间的交叉关系和限 定关系。
含义:检出文献中必须同时包含被其连 接的所有词或词组。
作用:缩小检索范围,提高查准率。 例如: 儿童 * 心理学
computer AND virus
与运算示意图
A
B
computer
virus
A and B 计算机 *病毒
1. 分析课题的内容
⑴明确检索目的
• 需要关于某一课题的系统详尽的信息 • 需要关于某一课题的最新信息 • 了解一些片断信息,解决一些具体问题
⑵明确课题的主题或主要内 容
要形成若干个既代表信息需求又有检索意义 的主题概念,包括所涉及的主题概念有几个, 哪些是主要的,哪些是次要的,概念之间关 系如何等
⑶课题涉及的学科范围:搞清楚课题所 涉及的学科领域、是否跨学科研究
⑷所需信息的数量、语种、年代范围、 类型等具体化指标
例:检索课题--不锈钢焊接
检索目的
查找范围
了解最新的技术 利用期刊、会议录类的
动态
数据库查找
了解焊缝强度的 利用技术标准类的数据 测试方法和有关 库查找 规格
申请专利
利用专利类数据库查找
知识回顾 Knowledge
(汽车+机动车)*(导航系统+全球定位 系统+GPS)*(研究+调查+设计)
例2. 课题名称:手持式心电图机
关键词1:手持 便携 微型 小型 袖珍 迷 你
关键词2:心电图机 检索式
(手持+便携+微型+小型+袖珍+迷你) *心电 图机
例3. 课题名称: 酸奶机
关键词1:酸奶 酸乳 发酵乳 关键词2:机 罐 装置 设备 检索式 (酸奶+酸乳+发酵乳) * (机+罐+装置+设备)
“international space station”
6.括号检索
用于改变运算的先后顺序,括号内的运 算优先进行。
(university or college) and education
五 计算机检索步骤、方法、途径
大体可分为五个步骤: 1.分析课题的内容; 2.选择信息资源; 3.构造检索式,选择检索途径; 4.上机检索; 5.分析检索结果,调整检索策略。
或运算示意图
B
A
pipe
相关主题