当前位置:文档之家› 计算机文献检索-7

计算机文献检索-7

第四章 计算机文献检索
• 学习目的: • 了解计算机文献检索原理、系统构成及检 索方法。 • 了解检索步骤,掌握检索式的编写及检索 效果的评价。 • 了解原文获取的各种途径。
计算机文献检索原理、系统构成、发展历程 概述 数据库的定义及类型、记录格式、文档结构 检索方法
•计算机 文献检索
检索步骤
查全率与差准率
3、数据库的结构
• • • • • ⑴记录格式 ⑵记录的字段类型 ⑶文档结构 ①顺排文档 ②倒排文档
四、检索方法
• 1、检索方法 • 常用法:顺查法、倒查法和抽查法。 • 追溯法:利用原始文献后面所附的参考文献,追 踪查找参考文献的原文。 • 综合法:将上述两种方法结合起来使用。 • 2、检索途径:指查找文献的途径,也称为检索点, 它可以分为从文献内容特征入手和从文献外部特 征入手的两大类。 • 3、常用检索算符 • 逻辑算符: • 位置算符: • 截词符: • 通配符:
衡量检索效果的 两个常用指标 提高检索效果的措施 检索指标的应用实例 获取原文的途径 获取原文 查找馆藏的常见问题 文献类型的识别
一、概述
• • • • • • 1.计算机文献检索原理 ①文献存储 ②文献检索 2.计算机检索系统构成 ①检索终端 ②检索中心由主机、机读数据库等构成。
3.计算机检索发展历程
二、查找馆藏的常见问题
• 刊名不确切 • 刊名缩写的处理
三、文献类别识别
作业
• 1、查找各专项竞技特征的英文文献,写出 检索步骤,要求选取两种英文翻译的方法 对检索词进行英文翻译。 • 2、查找目录型、事实型及数值型数据库, 列出检索结果。
• 2、收集检索词
• ⑴ 从检索结果中选词 • ⑵从综述文章中选词 • ⑶从主题词表中选词 • ⑷如何从中文概念入手查找相 关的英文词汇
⑷如何从中文概念入手查找相关的 英文词汇
查找途径 金山词霸 特 点 查找步骤
提供词汇的一般 解释 CNKI《期刊库》 国内学者的用语 Ei 国外学者的用语 相关的英文词
• ?代表一个字母;*代表两个或两个以上字母
• ①词的单复数,如book?,wom?n • ②年代,如199?(90年代) • ③作者,如用Eric* 可检出所有姓Eric 的作者。 • ④同根词,如用technic* 可检出 technical,technicality,technician等。
4、两个著名的国际联机检索
• Dialog 系统 • STN系统
二、文献标引与检索语言
• • • • • • • 1、主题语言 关键词法 标题法 单元词法 叙词语言和词表 ①字顺表 ②等级表
2、信息检索语言
检索语言是文献信息资源系统(数据库、网络信息等)中标 识和检索文献信息的计算机识别语言。
组织方式 不同 揭示事物 的角度不 同 集中与分 散的角度 不同
把一个学科的文献集中起来,但把同一 主题的文献分散在不同的学科类目中;
把同一主题的文献集中起来,但 却把同一学科的文献分散在不同 的主题词下。
以体育类的文献为例,在“体育类”这一主题词下,集中了体育的全部文献, 但在分类法中,体育类的文献,有可能集中在各个项目中,如篮球、足球、
优先处理算符“()”
• 优先处理算符“()”为运算的最高优先级,布尔逻 辑算符运算顺序为: • 逻辑“非”(NOT) 逻辑“与”(And)
• 如需优先,需加优先处理算符“()”
逻辑“或”(Or )
2、截词检索
• 主要用于检索词的单复数、词性的词尾变化、 词根相同的一类词,以及同一词的拼法变异 等。 • 通用的截词符有:?、$和*
三、数据库
• 1、数据库的定义
• 2、数据库的类型 • 3、数据库的结构
1、数据库的定义
• 数据库是指在计算机存储设备上合理存放 的相互关联的数据的集合。它可以形象的 比作存放数据的“仓库”。 • 特点:①最新冗余;②数据独立;③数据 统一管理,包括数据的添加、删除、修改 和检索等;④数据共享。
• 辅助检索字段(反映文献外部特征):描
述与主题内容无关的字段,叫做辅助索引字段。 作者(AU)、文献出处(SO)、出版年代 (PY)、语种(LA)等属于辅助索引字段,与 基本索引字段配合使用,起限定检索范围的作用。
2、分类与主题词法的比较
分类法 检索标识 不同
分类号。人为给定的代码由字母和数字构 成。
• 辅助索引字段限制检索。指表达文献外 部特征字段的检索,如:作者(AUauthor)、期刊名(JN-journal name)、 出版年(PY-publication)、语种(LAlanguage)、文献类型(DT-document type)等 • 限制是调整检索式的一种手段,目的是 提高检索的查准率,过滤不需要的文献, 缩小检索范围。
2、数据库的类型
• 书目型:包括文献篇名、作者、文献出处、文摘 以及对文献内容特征进行揭示的规范词和分类号 等。书目型数据库实际上就是机读版的目录、索 引、文摘,它是二次文献数据库用于提供原始文 献的线索。 • 事实型:这类数据库存储的内容来源于百科全书、 名录、词典、手册和年鉴等参考工具书 • 数值型:是科学技术常数、统计数据等。 • 全文型:存入了原始文献的正文,通过这类数据 库可以直接获得全文。
检索步骤
• • • • • 一、分析检索课题 二、选择数据库 三、选择检索词 四、检索式的编制和调整 五、一个完整的检索实例
一、分析检索课题
• 通过对检索课题的分析,弄清:①检索课题 的类型;②检索课题内容涉及的主要学科范 围;③需要的文献类型及文献数量(语种、出 版年代、地区范围等);④检索课题涉及的概 念。从课题中提取相关概念,它们是选择检 索词的依据,如果还有其他已知信息(人名、 机构、文献号码,专利号、标准号、报告号)
• 缩小检索:增加限定词、选择主题 词中的上位词、增加限定条件
五、பைடு நூலகம்个完整的检索实例
衡量检索效果的两个常用指标
• 一、查全率与查准率 • 二、实例——检索指标的运用
4、检索效果
• 查全率(R)= 检出相关文献量 文献库中相关文献总量 • 查准率(P)= 检出相关文献量 检出文献总量
获取原文
• • • • • 一、获取原文的途径 本馆获取原文 网上查找原文 馆际互借——提供必要的文章信息 联机订购原文
普查型
如专利审查科 技立项科技成 果鉴定撰写综 述 跟踪国内外最 新的研究动态
检索型
二、选择数据库
三、选择检索词
• 1、确定主要概念内容和所涉及的概念。 • 在多数情况下,课题名称一般都能反映检 例 5:课题“唐山综合防灾的研究” 索的主题;也有一些情况,相关概念不能 例 6 :课题“河豚毒素的液相色谱分析” 例 4 :课题“灌溉用的橡塑多孔管” 检索式 1:主题字段=唐山*综合防灾*研究,命中7条 直接从课题名称中得出,这时必须对课题 检索式 :主题字段 = 河豚毒素 *液相色谱 *分析 ,命中5条 检索式1 1 :主题字段 = 灌溉 * 橡塑 * 多孔管 , 命中 0 条 2 城市 (地震+洪水+火灾)*(决策 检索式 2 :主题字段 = 河豚毒素 *液相色谱 ,命中 37条 内容进行全面透彻的分析,从中提炼出能 检索式 2 :主题字段 = 灌溉 * (橡胶 + 塑料) * 多孔管 ,命中13条 支持系统+专家系统),命中37条 5够反映课题内容的主要概念。 • ⑴找出隐含概念: • ⑵泛指概念具体化: • ⑶排除重复概念:
课题类型及特点
课题类型 要解决的 检索要求 文献收集 检索思路 问题 重点
公关型 解决生产技术 难题 以查准为重点, 专利期刊和会 保证检出的文 议同类产品的 献都是相关文 说明书及标准 献 等 以查全为重点。 期刊及会议文 尽可能将相关 章专利科技成 文献查出来 果公报,各类 综合性文章也 是收集的重点 对查全没有要 求,但信息要 相关、要新 期刊及会议论 文
题 名
著 序 者 号
引 文
分 类 检 索
主 题 检 索
从文献外部特征 进行检索
关 键 词 检 索
从文献内部内容 进行检索
• 基本检索字段(反映文献内容特征):在
数据库中把描述文章主题性质,反映文章内容的 字段称为基本索引字段。文献的标题(TI)、文 摘(AB)、主题词(DE)及关键词(KY)等属 于基本检索字段。
• 3、限制检索
• 泛指检索系统中提供的缩小或约束检索 结果的检索方法。也称“字段限制” • 字段限制可针对特定年代、特定类别、 特定检索点等做限制。
• 基本索引字段限制检索 。 通常包 括:题名(TI-title)、关键词 (ID-identifier或keyword)、主题 词(DE-descriptor)、文摘(ABabstract)、分类号(CCclassification code)、全文(full text)等。
计算机情报检索出现于20世纪50年代。其大致的发展阶段及特点见表4-1-1。
时间 1954-1964 1965-1972 19731990-
名称 脱机检索 联机检索 国际联机检索 客户/服务器模 式
特点
专业检索人员定期批量 处理用户的情报要求 多个检索终端通过通讯 与检索系统中央计算机 连接 用户终端通过国际卫星 通讯网直接从世界各地 的计算机情报检索系统 中检索 客户/服务器模式成为计 算机检索的主要模式
主题词法
有意义的词组,可直接用于检 索
如:查找”体育教育专业实习”方面的文献 分类法:首先要找到所属的分类号G807.4,才能找到相关文献 主题词法:只需要找到“体育教育”及“实习”进行检索,就能找到相关文 献 按学科等级体系组织文献,其体系固定, 按主题词字顺序编排文献,不受 难以增补新概念 体系约束,增删新词方便,能及 时反馈学科的发展 从学科体系出发,揭示事物属于什么学 科,有利于族性检索。 着眼于特定事物,揭示与之相关 的问题,有利于特性检索。
相关主题