当前位置:文档之家› 专业文献检索第三章课件

专业文献检索第三章课件

第三章文献信息检索基本原理及方法
3.1.1 文献信息检索的基本含义
一、文献信息检索的基本含义
检索”即“查找”之意。

信息检索,是将信息按照一定的方式组织、存储起来,并针对用户的需要查找所需信息的过程。

因此信息检索包含了信息的存储和检索两个不可分的部分。

我们通常所说的信息检索是指狭义的信息检索,即从检索工具和检索系统中查找所需信息的过程及其所采取的一系列方法和策略。

3.1.2 文献信息检索的类型
按检索手段:(1)手工检索:依靠手工操作来完成检索过程,所用文献一般是以纸张为载体。

(2机械检索:主要是指利用计算机进行文献信息检索,也称作计算机信息检索,所用的文献多以非纸张为载体,
手工检索和计算机检索的关系:手检是基础,机检是发展方向。

信息检索发展历史:信息检索作为一门技能,其历史可以追溯到图书目录和文摘、索引产生的时代。

19世纪30年代——手工检索逐渐成熟,以印刷型文献为检索对象。

最近50年——计算机信息检索。

手工检索阶段:公元前26年,我国第一步综合性的书目检索工具《七略》问世,它是以当时诸子百家的学术分类思想为基础,以汉代天禄阁的藏书为对象,按“部次甲乙”来组织文献典籍,这也是世界上第一部书本式的文献检索工具。

近现代,利用图书馆馆藏书目工具为读者提供查找图书、期刊或事实信息。

如卡片目录。

还有各种书本式的目录、文摘、索引等检索工具。

手工检索阶段的主要特点是:
⏹遵循既定的标引规则来著录各项的内容;
⏹以印刷型文献(如图书、期刊、会议、专利、标准、学位论文等)为主要检索对象;
⏹以各类文摘、题录和目录性工具书为主要的检索工具;
⏹检索方法简单、灵活;
⏹检索策略便于修改,检索过程可及时发现问题,及时修改和补充;
⏹检索效率比较低,费时费力,且查全率较低;
⏹进行复杂问题的多途径检索时,需要反复查找许多检索工具;
⏹用户主要是专业技术研究人员。

3.1.2 文献信息检索的类型
按检索要求划分:
相关性检索——是系统不直接回答用户所提出的技术问题本身,而是只提供与之相关的文献供用户参考。

确定性检索——是以数据或事实为检索对象,系统要直接问答用户提出的技术问题,即直接提供用户需要的确切的数据或事实。

文献信息检索的类型
根据检索对象划分
●书目检索:是以文献线索为检索对象的文献检索,即检索检索系统存储的是以二次文献为对象(目录、索引、文摘)
的信息,他们是文献信息的外部特征与内容特征的描述集合体,信息用户通过检索,获取的是原文的“替代物”。

用户通过检索获得的是与检索课题有关的一系列文献线索,然后再通过阅读决定取舍。

●全文检索:是以文献所含的全部信息作为检索内容的文献检索,即检索系统提供的是整篇文章或整部图书的全部内
容,检索时可以查找到原文以及有关的句、段、接、章等文字,并可进行各种频率统计和内容分析。

全文检索主要
是用自然语言表达检索课题。

较适用于某些参考价值大的典据性文献。

全文检索是当前计算机检索的发展方向之一。

数据信息检索:数据信息是指检索系统中存储的是数值型数据,如科学技术常数、各种统计数据等,信息用户可用通过检索获得的经过核实、整理的数值信息再做定量分析。

事实信息检索:又称事项检索。

是指系以事实为检索内容的情报检索,其检索对象包括事实、概念、思想、知识、人物的基本信息等内容,事实检索也是一种确定性检索,,用户获得的是有关某一事物的具体答案。

3.2 文献信息检索原理
文献信息检索的基本原理:就是用户根据课题需要,将代表需要查找的检索提问标识与文献库中所存储的文献特征标识进行比较,当文献库中所存储的文献特征标识与检索提问标识相一致,或文献特征标识包含了检索提问标识时,那么具有这些特征的标识就被检出,即是命中的结果。

信息存储与检索原理流程图
)
检索语言的定义:检索语言是从自然语言精选出来的一整套词汇、符号,用以对文献内容和信息特征进行概括和规范。


检索语言须具备三个基本要素:
1. 有一套专用字符来构建词汇;
2. 有一定数量的基本词汇用来表达基本概念;
3. 有一套专用语法规则,用严格的句法手段和词法对词汇进行控制,以准确表达各种各样的概念。

一种较好的检索语言应具有对多种检索要求的广泛适应性,保证有较高的查全率和查准率;具有对多种学科和多种信息类型的适应性;具有与其他检索语言的兼容性和国际通用性。

检索语言的分类划分
匹配
输出
分类语言:是指以数字、字母或数字与字母结合作为基本字符,以基本类目为基本词汇,以类目的从属关系来表达概念
间相互关系的一类检索语言。

分类原理:分类是对知识概念的划分。

分类语言是用分类号来表达学科体系的各种概念,将各种知识要领按学科性质进
行分类和系统排列。

即以学科分类为基础,按照概念划分的原理,将知识分门别类地按一定的逻辑次序,从总到分,从具
体到一般,从简单到复杂、进行层层划分,层层隶属,形成一个严格有序、层次分明的知识门类体系,以便从知识分类的角度按学科、分专业地集中信息,揭示各类信息在内容上的联系与区别,提供从 学科分类角度检索信息的途径。

检索语言
主题语言:是一种描述概念性语言,它用语词直接表达文献的主题,这些语词就是表达主题概念的标识。

将这些作标识的语词按字顺序排列并使用参照系统来间接表达各种概念之
又称标题词语言,是最早使用的一种主题词语言,以标题词作为表达文献内容和检索依据、完全先组式规范化的检索语言。

标题词主标题词和副标题词。

利用标题词语言编制的检索工具质量较好,组配固定,不易混乱,有较好通用性、直接性和专指性。

可通过“见”和“参见”扩大检索范围,提高查全率。

缺点是系统性差,内容相关的分散在多处,灵活性差,不能任意组配检索。

检索语言分类
按规范化程度划分:规范化语言(受控语言)和非规范化语言(自然语言)
规范化语言(人工语言):是人为地对标引词和检索词的词义进行控制和规范,使每一个词只能表达一个概念。

如:分类语言、标题词语言、叙词语言。

非规范化语言(自然语言):在信息检索系统中使用直接从原始信息中抽取出来的未经规范化处理、用以揭示信息主题概念的自由词,如:关键词语言。

按组配方式划分:先组式语言和后组式语言
◆先组式语言:指描述文献主题概念的标识在检索之前就已经事先固定好了的标识系统。

如:分类语言、标题词语言。

◆后组式的检索语言:指描述文献的标识在检索之前未固定组配,而是在检索时根据检索的实际需要,按照组培规则
临时进行组配的标识系统,如叙词语言、关键词语言。

检索语言的功能:
☐保证标引的一致性
☐保证检索提问和文献标引的一致性
☐保证检索结果和检索要求的一致性
☐对内容相同或相关的信息,加以集中或揭示,表述其相关性。

☐便于对大量信息加以系统化或组织的有序化,并力争从多方面揭示文献信息。

检索原理、方法、途径和步骤
关键词
单元词
标题词
叙词
自然语言




检索途径:文献信息检索有两类不同的检索途径。

根据文献的特征检索文献信息是最简捷的途径。

其特征有两个,一是根据文献的外部特征,二是按照文献的内部特征。

分类途径:分类途径是以课题的学科属性为出发点,按学科分类体系来查找文献信息,以分类作为检索点,利用学科分类表、分类目录、分类索引等按学科体系编排的检索工具来查找有关某一学科或相关学科领域的文献信息。

主题途径:以课题的主题内容为出发点,按主题词、关键词、叙词、标题词等来查找文献。

以主题作为检索点,利用主题词表、主题目录、主题索引等按主题词的字顺编排的检索工具来查找有关某一主题或某一事物的文献信息,能满足特性检索需求。

适合查找比较具体的课题。

关键词途径:是按照文献题目或内容中具有实际意义并能表述文献的主要内容、起关键作用的词或词组按照关键词的字顺在检索系统中使用的检索途径。

题名途径:可查找图书、期刊、单篇文献。

检索工具中的书名索引、会议名称索引、书目索引、刊名索引等都提供了从题名进行文献检索的途径。

著者途径:包含个人责任者、团体责任者、专利发明人、专利权人、合同户、学术会议主办单位等。

利用责任者检
索文献,主要利用的是作者索引、作者目录、个人作者索引、团体作者索引、专利权人索引等。

序号途径:据文献信息出版时所编的号码顺序来检索文献信息的途径。

特定编号如:技术标准的标准号、专利说明
书的专利号、科技报告的报告好、合同号、任务号、馆藏单位编的馆藏号、索取号、排架号等。

分子式途径:以化学物质的分子式作为检索标识来检索文献信息的一种检索途径。

使用的检索工具是“分子式索引”。

如美国的《化学文摘》。

引文途径:是从作者途径去检索引用该作者著作的有关文献,它不仅反映了某个作者历年来发表了哪些文献,而且
也反映了该作者的每篇文献又被哪些作者引用,从而又发表了哪些文献。

如《SCI》
其他途径:索引途径还有很多,如生物分类索引、属类索引、环系索引、题中人名索引等。

读者可根据待检课题的
特点和选用的检索工具灵活掌握使用。

检索步骤:课题分析,选择检索工具,确定检索途径,选择检索方法,实施检索操作,获取原始文献。

相关主题