当前位置:
文档之家› 文献信息检索技术精品PPT课件
文献信息检索技术精品PPT课件
生物学文献检索
—文献信息检索技术
检索的概念
信息检索是指将信息按一定方式组织和储存起 来,并针对信息用户的特定需求查找出所需信 息内容的过程。
文献检索(Retrieval):就是通过一种科学的 方法 和途径,在一定的文献信息集合中迅速、 全面、准确的获取自己所需要的那部分信息。
数据库:由计算机进行处理的一定数量同 类信息的有序集合,是用来存储和查找文 献的信息的电子化检索工具。
文摘(Abstract,Excerpta,Digest)
根据摘要详简程度,文摘可分为: 指示性文摘(简介,Indicative Abstract)
是以最简短的语言,概略指示原文的研究 对象、内容范围、研究目的及方法,一般 在50-150个字。 报道性文摘(Informative Abstract)内容详 细,反映文献的中心内容、观点、数据及 结论,一般在200~300,500,1000字左 右。
信息检索示意图:
信息检索的实质
信息检索的实质是信息用户的需求和一定的信 息集合的比较和选择的过程,即匹配的过程。也 既是用户需求的主题概念和提问表达式同一定信 息系统的系统语言相适应的过程,如果两者相适 应取得一致,则所需信息被检中,否则,检索失 败。 文献检索重要的一种信息检索。
信息检索的类型
概念检索:就是查找特定概念的含义、作用、原理或使用范 围等解释性内容或说明。最常见的概念检索是查找各种参考 工具书,例如字词典、百科全书、名录、手册、指南等参考 工具书。
信息检索类型图:
信息 检索
文献检索 检索性工具书 间接答案(文献线索)
数据检索 事实检索
概念检索
参考性工具书 直接答案(数据、事实)
检索系统的构成
手工检索系统 计算机(网络)检索系统
篇名字段 文摘字段 基本索引字段 叙词字段 自由标引字段 辅助索引字段
检索系统的构成
记录 有多个字段组成记录,使数据库的信息单元
文档 数据库中一部分记录的集合,也使数据库的结 构。一个数据库至少包括一个顺排文档和一个 倒排文档。
检索语言
信息检索的意义
▪ 信息与现代科技的发展
现代科技发展特点:高速化、综合化、专业化。 ➢ 信息量急剧增长。 ➢ 信息的使用寿命缩短。
▪ 信息检索意义
➢ 充分利用信息资源,避免重复劳动。 ➢ 为人们更新知识、实现终身学习提供门径。
检索系统的著录
检索系统是有序的信息集合。每个信息都 需要经过加工,把信息的特征著录即描述下 来,成为一个条目,亦称记录。将一个个记 录按一定序列编排起来便组成一个可供检索 的系统。
顺排档:数据库中的记录往往是按时间顺序线 性排列的,每条记录依次编有顺序号,这种文 档称为顺排文档。
例排档:是将顺排文档记录中的可检字段抽出, 按字顺排列而成的字典文档称倒排文档。
顺排文档
倒排文档(主题)
001 汽车尾气中的 铅对环境的污染 主题词:汽车 、尾气、 铅、环境污染
002 汽车的维修 主题词:汽车、维修
003 汽车与运输 主题词:汽车、运输
004 汽车噪音对环境的污染 主题词 :汽车、 噪音、环境污染
环境污染 汽车
环境污染
汽车
铅 维修 尾气 运输 噪音
001 004
001 001 004 004 001 002 001 003 002 004 003 001 004 002 001 003 004
全文(Full-text)
全文检索是指以文献所含的全部信息作为检索 内容的文献检索。
中文:CNKI数据库、万方数据库、维普数据库 外文:Sciencedirect数据库
wiley数据库 blackwell数据库 EBSCO数据库、Ovid系统 Springer电子全文期刊 Nature电子全文期刊
文摘(Abstract,Excerpta,Digest)
含义: 文摘是指对文献内容选择重要部分以简练的 形式作为摘要,并按一定的原则和方法编排 而成的一种检索工具。
著录内容: 同⑵ + 文摘。 如,中国医学文摘,中国药学文摘, 中国生物学
文摘,CA,BA,CBM,CMCC,MEDLINE/PubMed 等。
*按著录方式划分如下: 目录 题录或索引 文摘 全文
目录(Catalogue)
含义: 目录是对文献的外表特征的著录。它通常以完
整出版物(如一本书或一种刊或一个会议录 的名称)作为著录的基本单位来报道和记录 文献。 著录内容: 文献名称、著者、出版项与馆藏信息等内容。
目录(Catalogue)
按职能划分目录种类: 出版发行目录 馆藏目录:按检索标目划分为 书名目录(Title Catalogue) 著者目录(Author Cataloue) 主题目录(Subject Catalogue ) 联合目录 资料来源目录,如IM、CA、BA
数据库、文档、记录、字段之间的关系
文档1 (顺排档) 记录1
数据库
文档2 (倒排档、 记录2
索引)
字段1 字段2
…
…
字段n
… 记录n
子字段1 子字段2
…
子字段n
文档n (倒排档)
Internet用户的增长(1994-2003)
万人
3500 3000 2500 2000 1500 1000
文献检索(书目信息检索):即检索结果是关于某主题知识的文 献线索,它是通过二次文献,包括传统的以纸张为存储介质的现 代计算机检索系统,找出所需的一次文献或三次文献。
数据检索:就是满足数据需求的检索过程,如数理化等科学 数据,经济数据,历史数据,地理数据等。
事实检索:就是对特定的事件或事实的检索。事实内容包括 大量的科学事件和社会事件。例如:我国建成最早的高速公 路是哪条?何时建设?
题录(Title)或索引(Index)
概念: 其一,是指检索工具,它揭示文献的外表特征和内
容特征,即著录文献是以一个完整出版物的某一 部分(如书的章节或刊中一篇论文题目)为著录 单位。 其二,是指检索途径(附录式索引),如,分类索 引、主题索引、生物体索引、著者索引等。 著录内容: 论文题目、著者、文献出处(刊名、发表年月、卷、 期、页码)及文种等。如,《中目》、《IM》、 《CNKI》免费题录等。