当前位置:文档之家› 2 信息检索与原文获取

2 信息检索与原文获取


第2章 信息检索与原文获取 2012年9月17日
本章前言
• 信息检索,是指依据一定的方法,从已经组织好的有关 大量文献信息集合中,查找出用户所需要的特定相关信息 的过程。 • 检索手段的发展与演变:
1)18世纪中期:国外最早创办的检索刊物《各学院优秀
外科论著汇编》;
2)20世纪:目录、索引和文摘等传统手工检索工具逐渐
• 检索,是根据特定的需求,运用某种检索工具,按照一定的
方法,从信息源中查询所需信息的过程。
• 文献检索,doucuments Retriebal,是获取有关的图书、报
刊、缩微资料和数据库文献的过程。
• 信息检索: 1950年,卡尔文· 莫尔斯的论文中最早提及该词;
从1960年左右开始,被美国图书情报界作为专业术语广泛使用; 全称 “信息存储与检索”(Information Storage and Retriebal);本质上,是一种有目的、组织化的信息存取活动, 其中包括了“存”和 “取”两个环节。
读秀学术搜索是超星数字图书馆的产品之一。它将知识点 搜索和电子图书有机结合,能提供深入目录和全文的知识点检 索,并能使用图书馆的文献传递来获取相关知识。
4、Web of Knowledge
• BIOSIS Preview
• INSPEC • CCC(Current Contents Connect,期刊题录快讯 ) • Derwent Innovations Index(DII) • MEDLINE
• 分类检索语言
1、《中图法》: 2、《科图法》 :全称 《中国科学院图书馆图书分类法》,是 根据中科院图书馆及所属各研究单位图书馆藏书范围和不同专 业的特点而编制的一部体系分类法。
2.1.4 信息检索途径
信息检索途径,是信息检索系统和检索工具所提供的检索入口。 常用的信息检索途径有:分类、主题词/关键词、题名、著者、 代码、任意词、出处等途径。 • 1、分类途径: • 2、主题词/关键词途径
• 字顺法 (1)形序法,又分部首法、笔画法、笔形法
(2)音序法,中文书按汉语拼音字母法
(3)号码法,现在很少用 • 类序法 (1)分类法:学科、四部分类 (2)主题法:关键词、主题词 • 自然顺序法 (1)时序法; (2)地序法
工具书的类型
检索性工具书 参考性工具书
2、检 索 性 工 具 书
概念:积累、报道、查找文献线索的书刊。
• 实质:人们的信息提问与文献的检索标志相比较后决定取舍的过程。信息提
问与检索标志一致,就算是“命中”了文献,即查找到了所需文献信息。
• 作用:
1、描述文献特征:可以表示文献内容、数据或其他信息形式; 2、表达检索提问:用专用概念表示用户的信息提问; 3、使标引者和检索者互相沟通?能够指示计算机执行查询与检索。
全面理解信息检索概念:
• 广义上, 根据信息资源的外部特征和内容特征,经过选择、 分类、浓缩、标引等加工处理,使其系统化、有序化,并按 一定要求建成具有检索功能的工具或检索系统,供人们检索 和利用。而检索是指借助编制好的检索工具或检索系统,查 找出满足用户要求的特定信息。 • 狭义上,信息检索只涉及后一阶段,即指依据一定的方法和 策略,从已经组织好的大量信息集合中,迅速准确地查找获
在实际检索过程中,要根据课题需要和实际情况,先选择专 业的检索工具,再选用相应的检索途径。对清楚知道文献全 名的,可采用题名途径检索。 – 对清楚知道文献的学科属性时,可选用分类途径。 – 对清楚知道ISBN中代表区域语言和出版社数字或者书名 数字的,可采用ISBN途径检索或出版社途径。 – 对清楚知道文献内容特征的,可采用主题词途径。主题词 途径以规范化词语作为检索标识。 – 对清楚知道文献责任者的,可采用责任者途径。
2、按信息的载体: 1)手写文献:纸张发明以前的古代文献,这是最早的文献载体形式。如甲骨文献、 金石文献、书写在竹片或木片上的简策文献,记录于丝织品上的缣帛文献,以及 外国 古代的泥版书、纸莎草书、蜡板书、羊皮书等 2)印刷文献 3)缩微文献 4)音视频文献 5)数字文献 3、按信息加工形式: 一次文献:如学术专著、报刊论文、文学作品、会议文献、学位论文、可研报告等。 二次文献:如书目、索引、文摘。 三次文献:如综述类专题述评、动态综述、进展报告等,参考工具类如百科全书、 年鉴、手册等。
INSPEC Thesaurus 等。
3、代码检索语言:针对事物的某一方面特征,用某种代码系统来
加以标引、排列。如化合物的分子式、结构式索引系统等。
2.1.3.3 常用信息检索语言
• 主题检索语言
1、标题词语言(标题词法)
2、关键词语言(关键词法) 3、单元词语言(单元词法)
4、叙词语言(叙词法)
取所需信息的过程。
2.1.2 信息检索类型
• 1、按处理信息手段可分为:
(1)手工检索:用于印刷型的检索刊或工具书
(2)计算机检索:20世纪50年代,联机-光盘-网络

2、按检索对象可分为:
(1)文献检索:以文献或文献线索为查找对象。
工具:书目、题录、索引、文摘、全文数据库。
(2)数值检索:以特定的数值或数据(各种数据、公式、图表,以及化学分 子式等)为检索对象。 工具:数值或统计类数据库。 (3)事实数据:以特定事实为检索对象。 工具:参考型数据库如字/词典、百科全书、年鉴、名录等。
总之,只有视条件的可能和课题的需要选用相应的检索方法, 才能迅速地获得相关的文献,完成课题检索的任务。
2.2 信息检索工具
• 2.2.1 工具书
• 2.2.2 综合信息检索系统
• 2.2.3 引文索引检索工具
• 2.2.4 专类信息检索工具
• 2.2.5 特种文献检索工具
2.2.1 工具书
• 1、工具书概述
人文社科信息源
• 人文社科文献信息源:
1、印刷型(书、古籍) 2、数字型信息源:
• 人文社科相关信息源
1、人物信息源 2、实物信息源
1)网络信息资源: 数据库、数字出版物、学术网站、组织机
构、研究机构等信息资源 2)数据库资源(自建、商业)(图书馆界): a、文献型数据库:
3、实情信息源
4、机构信息源 5、动态信息源
形成;
3)当今时代:计算机、光学缩微技术和网络通信技术三
位一体。

• 2.1 信息检索知识
2.1.1 信息检索概念 2.1.3 信息检索语言 2.1.5 信息检索方法

2.1.2 信息检索类型 2.1.4 信息检索途径
• 2.2 信息检索系统
2.2.1 工具书 2.2.2 综合类信息检索系统 2.2.3 引文索引检索工具 2.2.4 专类信息检索工具 2.2.5 特种文献信息检索工具
2.1.3 信息检索语言
• 2.1.3.1 信息检索语言含义及作用
• 2.1.3.2 信息检索语言类型 • 2.1.3.3 常用信息检索语言
2.1.3.1 信息检索语言含义及作用
• 信息检索语言含义:
标引标志:信息存储时,其内外特征要按照一定的语言加以描述,构成检索 系统中的标引标志;
检索标志:而检索时,信息提问也按照同样的语言来表达,构成检索标志。 信息检索语言:在文献信息的存储和检索过程中共同使用的语言。亦称情报 检索语言、索引语言或标引语言,是一种专用于信息检索系统的人工语言。
• 3、题名途径:也称书名途径、篇名途径。
• 4、著者途径:也称责任者(个人或单位著者)途径,能满足一 定的族性检索要求。 • 5、代码途径:用文献专用代号(ISBN、ISSN以及专利号、合同 号)查找。
• 6、出处途径:输入原文献的刊载处(报刊名、出版单位名)可检索到该刊
载处出版、发表的有关文献。
目录型:目据库,如辞书、词典、百科全书等 事实型:人物信息、产品信息库、机构名录、基金指南库 数值型:统计数据库、管理数据库(分布商业经济领域) c、多媒体数据库:如超星学术视频、库克
人文社科信息源结构
1、按信息出版形式: 图书、期刊、报纸、学术会议文献、学位论文、政府出版物、档案文献等。
2.1.3.2 信息检索语言类型
按信息检索语言的构成原理,可分为三大类型: 1、分类检索语言:用分类号表达各种概念并按学科性质进行分类和 系统排列,又分为体系分类法和分面分类法。 2、主题检索语言:用主题词来表达各种概念并按其相关关系按字
顺排列。如《汉语主题词表》、Subject Headings for Engineering 、
• 2、检索性工具书 • 3、参考性工具书
1 、工具书概述
何谓工具书
汇集某一学科或多学科的文献信息资料,按照 特定的体例和排检方法编排,专供人们查阅、引证 或解决疑难问题的一种专门文献。
一般为二次文献或三次文献
工具书的编排结构
• • • • • • 前言 凡例 目录 正文 辅助索引 附录
工具书的编排方法
• 1、中国知识资源总库
• 2、万方数据资源系统
• 3、读秀学术搜索 • 4、Web of Knowledge • 5、Scopus • 6、Dialog • 7、ProQuest
1、中国知识资源总库
• 中国知识资源总库和中国知网(CNKI)是中国知识基础 设施(National Knowledge Infrastructure,CNKI) 多 年建设的成果,文献总量万篇。文献类型包括:学术期 刊、博士学位论文、优秀硕士学位论文、工具书、 重要 会议论文、年鉴、 专著、报纸、专利、标准、科技成果、 知识元、哈佛商业评论数据库、古籍等;还可与德国 Springer公司期刊库等外文资源统一检索。
2、万方数据资源系统
HTTP://
覆盖全国的以科技信息为主体,集经济、金融、社会、人 文、文化教育于一体的综合性信息服务体系。
科技成果类数据库
相关主题