当前位置:文档之家› 第一章 文献信息检索概论

第一章 文献信息检索概论



2、文献检索的原理
文献检索原理是:将检索提问标识与存贮 在检索工具中的标引标识相比较,两者一 致或信息标识包含着检索提问标识,则含 有该标识的信息就从检索工具中输出;
对信息的著录是按一定规则对信息的外表 特征和内容特征加以简单明确的表述,信 息的标引是对其内容按一定的分类表或主 题词表给出分类号或主题词;


按文献加工程度分:有一次文献、二次文 献、三次文献。
一次文献:以作者本人取得的成果为基本素 材面创作的论文、报告等,经公开发表或 出版的各种文献。习惯上称为原始文献。
• 如期刊论文、科技报告、会议论文、专利 说明书、学位论文、技术标准等。 • 特点:具有新颖性、创造性(是人类创造 性劳动成果)和先进性(内容上是新成果, 新发明); • 缺点:数量大,分布散,难以查找。
检 索 结 果
反 馈

3、文献源类型
按文献载体分:有纸介型文献、缩微型文 献、机读型文献、声像型文献

纸介型文献:是以纸张为载体。它又可分 为手抄型和印刷型两种。
其优点是传递知识方便灵活、广泛,保存 时间相对较长;缺点是存储密度小,体积 庞大。




缩微型文献:以感光材料为载体,通过光 学摄影方式将文献的影像固化在感光材料 上形成的一类文献。 如缩微胶卷、缩微平片等。
记录符号

文字已不再是表达思想的唯一手段,图形、 声频、视频等同样成为表达思想、传递感 情的重要手段。总的说来,文献中的符号 系统指图画、文字、公式、图表、编码、 声像和电磁信息等。
记录手段

按记录方法分可有手工记录、机械记录、光记录、 电记录、声记录和磁记录。其中最常见的是印刷。 随着科技的发展,文字记录可以转变为数据记录, 并用电子方法存贮到磁介质上去。此外,还有光 学字符识别(Optical Character Recognition,简 称OCR)技术就代表了这种崭新的技术,它通过 光学方法对字符、标记表示的书面数据进行自动 识别,转换成机器可以处理的信息,这样就实现 了纸质文献信息向电子信息的转换,而且可以通 过不同接口装置向不同设备输入数据,这些设备 进而与通信网络相连,实现远距离数据传送。

3、文献
一般定义为文献是记录有知识的一切载体。

文献的基本构成要素
第一,知识内容 第二,记录载体 第三,记录符号 第四,记录手段
记录载体

随着生产力的发展,存贮和表达人们思想的物质 载体不同了,从金石、竹简、羊皮、丝帛、纸张 发展到用感光介质和磁性介质。从非人工材质的 泥版、岩石、石板、兽骨、木板、竹片、 兽皮、 树叶、桦树皮等到各种人工材质,如无机材质 (陶、砖瓦、瓷,玻璃等)、金属材质(青铜、 铁、铝、金银等)、高分子材质(帛、纸、胶片、 醋酸纤维等)、复合材质(磁带、光盘等)。纸 质文献已经多得不便于快速传输信息、高效查阅 和高密度存贮了,于是其他介质的文献应运而生, 这些文献主要包括:纸质文献具有价格低廉、质 地柔软、易于书写、携带和收藏等其它一些载体 所无法比拟的性能而成为文献家族的主干。

4、文献检索工具
是以存贮和检索文献线索或报道、积累和 查找文献线索的工具。是通过手工检索和 计算机检索来运用的。

手工检索:主要有目录、题录、文摘、索 引等工具书。
计算机检索:一般通过搜索引擎,数据库 或直接深入到上述各种工具中。

机检与手检的异同
项目 总体特征 手检 机检 手翻、眼看、大脑判 策略、查寻、机 断 器匹配

6、文献检索途径`
文献具有内容特征和外表特征。从而也构 成了文献信息检索的两大基本途径,内容 途径和外表特征检索。
内容特征检索,又分为主题途径和分类途 径。 主题途径:是根据文献所论述的主题,利 用主题语言编制的主题索引而进行的信息 检索。主题索引大多按字母排列方式,因 此,检索也要用相应的方式。

4、三者间的联系
知识来源于信息,是理性化、优化和系统 化了的信息;文献是知识的载体。
事 物 运 动 信 息 知 记录在载体上 文 献 识
产生
人脑有序化
知识与文献的关系: 客观知识=文献(除去载体) 信息与知识的关系
知识
信息
二:文献检索

1、概念
文献检索——是从文献集合中,迅速、准 确地查找出所需文献或文献中包含的信息 内容的过程。
• 如词典、手册、指南、年鉴、百科全书、 大全、综述、工具书目录、书目之书目、 专题述评、进展报告等。 • 特点:综合性、 价值性、 针对性

按文献的出版形式分:有图书、期刊论文、 会议文献、科技报告、专利文献、学位论 文、标准文献、政府出版物、产品样本、 科技档案等。
/ch-gongbao/

题名途径:篇名索引、书名索引、刊名索 引等。题名索引通常按字顺排检方式,因 此,检索也应该采取相应的途径。

序号途径:

许多文献除普通的外表特征外,还具有序 号特征,如,专利文献有专利号、标准文 献有标准号、馆藏文献有索书号。序号索 引一般按照文献序号的大小顺序排列。

7、文献检索的重要作用



电子型文献,原称机读型文献:它通过计算机对 电子格式的信息进行存取和处理。即采用高技术 手段,将信息存储在磁盘、磁带或光盘等一些媒 体中,形成多种类型的电子出版物。
它具有信息存储密度高,存取速度快的特点,并 且具有电子加工、出版和传递功能。 如光盘(CD ROM)的信息存储量可达IG以上。 电子出版物包括电子图书、电子期刊、电子新闻、 光盘数据库产品或软盘、磁带等产品,以及电传 视讯、电传文本和电子邮件等。
检索过程则是按同样的主题词表或分类表 及组配原则分析课题,形成检索提问标识, 根据检索工具所提供的检索途径,从信息 集合中查找与检索提问标识相符的信息特 征标识的过程。(如下图)
文 献 源
文献 的 选 分析 文 献 择与 特征 收集
检索工具
标 识 语 言 标识 数据库 输出
匹配
用 户 信 分析 息 检索 需 提问 求 标识 检索提 问式
这类文献特点是体积小、信息密度高、轻 便,易于传递,保存容易。但使用必须借 助于放大设备。


声像型文献:,也称视听型文献,是指通过特定 设备,使用声、光、磁、电等技术将信息转换为 声音、图像、影视和动画等形式,给人以直观、 形象感受的知识载体。 如唱片、录音(像)带、影视片等,还有近年推 出的高密度存储的唱盘和视盘。 声像型提供的形象、声音逼真,宜于记载难以用 文字表达和描绘的形象资料和声频资料,如用以 记载科技研究过程和科技会议发言等。通过这类 资料的播放,可收到如见其形、如闻其声的真切 效果。
促进信息资源的开发和利用 协助管理者作出正确的决策 便于继承和借鉴前人的成果,避免重复研 究或走弯路 节省研究人员查找文献的时间




分类途径:是根据文献所论述的主题内容, 利用分类语言的学科专业体系进行的检索。 大多数检索工具都采用分类语言作为正文 编排体系的依据,分类目次通常是按照学 科专业角度的层层逻辑划分建立分类类目 体系。检索时要选择合适的分类类目。

外表特征检索,分为著者、书名、序号等 途径。

著者途径:检索中,著者是一个广义的概 念,是对文献内容负有责任的作者、编者、 译者等,可以是个人、团体、机构、组织, 甚至还包括著者的单位。通过著者途径进 行检索,主要可利用著者索引。所有著者 索引都采用字顺排列方式。
第一章 文献检索概论
本章主要内容 一:基本概念 信息、知识、文献 二:文献检索 概念、原理、文献源类型、检索工具、检索 语言、检索途径
一:基本概念

1、信息
信息是指应用文字、数据或信号等形式通 过一定的传递和处理,来表现各种相互联 系的客观事物在运动变化中所具有特征性 的内容的总称。

2、知识
知识是人们通过实践对客观事物及其运动 过程和规律的认识。
标引及索引 检索点较少 特点 检索时间
检索要求
检索点较多 较快
较慢
专业知识、外语知识、专业知识、外语 检索工具知识 知识、机检系统 知识 查全查准率 查准率较高 查全率较高 综合效率 较低 较高

5、文献检索语言
是为沟通文献信息用户和文献信息之间的语言, 理论上讲,是用于文献标引和检索提问的约定 语言。 按照表达文献主题概念的语词形式,有分类语 言和主题语言,其中主题语言又分为叙词(如 主题词)和关键词。 按照规范化程度,有自然语言和规范人工语言。

二次文献: 报道和查找一次文献的检索工 具书、书刊。
• 它是按照一定的目的对一定范围或学科领 域的一次文献进行鉴别、筛选、分析、归 纳、加工整理重组,使之有序化后出版的 文献。如各种索引、题录、文摘。形式上 有卡片式,期刊式,书本式。 • 特点:汇集性、工具性、系统性

三次文献:根据二次文献提供的线索,选 用大量一次文献,根据一定的需要和目的 进行筛选、分析、综合和浓缩而再出版的 文献。
相关主题