第一讲信息检索基础知识1.信息、知识、情报、文献的概念以及四者之间的关系?信息是事物的运动状态和方式。
知识是关于事实和思想的有组织有系统的陈述。
情报是作为交流对象的有用知识,是在特定时间、特定状态下对特定的人提供的有用知识,是激活了、活化了的知识,其基本属性是知识性、传递性和效用性。
文献是指“记录有知识的一切载体”,它是存储在一定物质载体上的关于知识信息的记录。
四者的关系:信息包含知识、知识包含情报和文献、情报和文献是交叉关系。
2.什么是信息资源?什么是信息源?信息资源是经过人类筛选、组织、加工,并可以存取和能够满足人类需求的各种信息的集合。
信息源是人们获取信息的来源。
3.什么是信息素质?信息素质教育的目标是什么?信息素质由哪些方面构成?各方面的具体含义是什么?信息素质是指利用已掌握的信息工具的知识与技能,对需求的信息进行检索、加工并且有效地利用这些获取的信息解决实际问题的能力。
让用户学会学习,获得终身学习的能力是信息素质教育的目标。
信息素质由:信息需求、信息意识、信息知识、信息道德、信息能力五个方面构成。
(1)信息需求是指人们在一个阶段的目标、任务位置中产生的信息需要行为。
(2)信息意识是人们对信息的敏锐意识(由信息需求激发出来,包括人们对信息的感受力,持久的注意力和对信息价值的洞察力,判断力) (3)信息知识是人们有关信息的特点与类型,信息交流和传播的基本规律与方式,信息的功用及效应,信息检索的方法和技能等方面的知识。
(4)信息道德是人们在收集信息,获取信息和使用信息时必须遵守的伦理道德规范。
(5)信息能力是人们在探求与个人兴趣有关的信息活动中,能够精确地、批判性地评价信息,对信息进行创造性表达和知识创新,最佳地收集、分析和使用信息,从而完成解决实际问题和探求知识的能力。
4.信息能力按应用途径及方式可分为哪些方面的内容?信息能力按应用途径及方式可分为如下八个方面:运用信息工具的能力;获取信息的能力;处理信息的能力;创新信息的能力;表达信息的能力;发挥信息作用的能力;信息协作意识与能力;信息免疫能力。
5.按文献的物理形态和加工方式可分别将文献分为哪几种类型?按文献的物理形态和加工方式区分,文献可分为:手写型、印刷型、缩微型、声像型、数字型。
6.按文献的加工深度可将文献分为哪几种类型?它们之间的关系是什么?按加工深度的不同,可将文献分为:零次文献、一次文献、二次文献、三次文献。
它们之间的关系:零次文献是一次文献的素材,一次文献是二次、三次文献的来源和基础,二次、三次文献是对一次文献进行组织、加工、综合后形成的,它们编写目的明确,专指性强。
7.按文献的内容特点和出版方式可将文献分为哪几种类型?按内容特点和出版方式区可分为:图书、期刊、报纸、会议文献、学位论文、政府出版物、标准文献、科技报告、专利文献、产品样本、其他零散资料。
其中,会议文献、学位论文、政府出版物、标准文献、科技报告、专利文献、产品样本又称为特种文献。
8.什么是二次文献?二次文献的主要作用是什么?二次文献有哪些类型?二次文献是信息部门将那些分散的、无组织的一次文献,用一定的方法经过加工整理、归纳、简化,把文献的外表特征和内容特征著录下来,使之成为有组织、有系统的检索工具。
二次文献主要作用是存储和报道一次文献线索、提供查找的途径。
二次文献类型包括书目、题录、文摘、索引等。
9.什么是三次文献?它可分为哪几类?三次文献是在二次文献的基础上选用一次文献、零次文献的内容进行分折、概括、综合研究和评价而编写出来的文献。
三次文献可分为:综述研究类:如动态综述、学科总结、专题述评、进展报告等。
参考工具类:如年鉴、手册、大全、词典、百科全书等。
10.简述国际标准书号的含义,并举一个例子说明之。
国际标准书号(International Standard Book Number)简称ISBN,国际标准书号号码由13位数字组成,并以四个连接号或四个空格加以分割,每组数字都有固定的含义。
第一组:978或979。
第二组:国家、语言或区位代码第三组:出版社代码由各国家或地区的国际标准书号分配中心分给各个出版社。
第四组:该出版物代码,由出版社具体给出。
第五组:校验码只有一位,从0到9。
例如:有一本书,其书号为:ISBN 978-7-03-026769-6ISBN代表:国际标准书号,7代表国家、语言或区位代码,03代表出版社代码,026769代表该出版物代码,6代表校验码。
11.简述国际标准刊号的含义,并举一个例子说明之。
国际标准刊号(International Standard Serial Number)简称:ISSN,由8位数字分两段组成,前7位是期刊代号,末位是校验号。
如有一期刊,其刊号为:ISSN 1003-3513。
ISSN代表:国际标准刊号,1003-351代表:期刊代号,最后一位“3”代表:校验号。
12.简述国内统一刊号的含义,并举一个例子说明之。
国内统一刊号是指我国报刊的代号,是报刊管理部门为了便于报刊统计、管理而按一定规则进行编排的号码总称。
国内统一刊号由地区号、报刊登记号和《中图法》分类号组成。
如有一期刊,其国内统一刊号是CN11-2856/G2 。
CN代表:中国国别代码,11代表:地区号,2856代表:报刊登记号,G2代表:《中图法》分类号。
13.简述中国标准刊号的含义,并举一个例子说明之。
中国标准刊号(简称CSSN)经国家质量技术监督局正式批准发布,从1989年7月1日开始实施. 由国际标准刊号(ISSN)和国内统一刊号(CN)两部分组成.如有一期刊,其中国标准刊号为:ISSN1002-557X CN11-1725/C在ISSN1002-557X中,ISSN代表:国际标准刊号,1002-557代表:期刊代号,最后一位“X”代表:校验号。
在CN11-1725/C中,CN代表:中国国别代码,11代表:地区号,1725代表:报刊登记号,C 代表:《中图法》分类号。
14.什么是核心期刊?核心期刊是指刊载论文数量多、品质高,而且能反应出该学科最新研究成果及发展趋势,受到读者重视之学术期刊。
15.请写出在参考文献标识中纸质型文献所有单字母所标识的文献类型,电子型文献所有双字母所标识的文献类型,所有非纸张型载体电子文献,在参考文献标识中标明的载体类型。
1.纸张类型文献以单字母标识:M——专著(含古籍中的史、志论著)C——论文集N——报纸文章J——期刊文章D——学位论文R——研究报告S——标准P——专利A——专著、论文集中的析出文献Z——其他未说明的文献类型2.电子文献类型以双字母作为标识:DB——数据库 CP——计算机程序 EB——电子公告 MT——磁带DK——磁盘 CD——光盘 OL——联机网络3.非纸张型载体电子文献,在参考文献标识中同时标明其载体类型:DB/OL——联机网上的数据库 DB/MT——磁带数据库M/CD——光盘图书 CP/DK——磁盘软件 J/OL——网上期刊EB/OL——网上电子公告第二讲信息检索理论基础主题词又称叙词,在标引和检索中用以表达文献主题的规范化的词或词组。
《汉语主题词表》是我国第一部大型的综合性的叙词表,由中国科技信息研究所和北京图书馆负责主持,1975年开始编制,1980年正式出版。
分为社会科学、自然科学和附表3卷,共10个分册,共收叙词 11万条。
该词表主要供电子计算机系统存储和检索文献用,亦可用来组织卡片式主题目录和书本式主题索引。
索引是揭示文献内容出处,提供文献查考线索的工具书。
SCI(科学引文索引)、EI(工程索引 )、ISTP(科技会议录索引)是世界著名的三大科技文献检索系统,是国际公认的进行科学统计与科学评价的主要检索工具,其中以SCI最为重要。
标引,顾名思义,标是标记,引是指引,就是通过标记指引人们方便、快捷地找到所需要的信息。
检索是指从文献资料、网络信息等信息集合中查找到自己需要的信息或资料的过程。
检索标识即检索词,是指能表达检索课题主题概念和信息需求的名词术语、分类号、名称及代码等的总称,包括主题词、关键词、名称、分类号、分子式、专利号及各种号码等。
数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。
联机检索指用户借助通讯线路,通过终端设备同检索系统联机所进行的文献与数据检索。
服务器,从广义上讲,服务器是指网络中能对其它机器提供某些服务的计算机系统(如果一个PC对外提供ftp服务,也可以叫服务器)。
从狭义上讲,服务器是专指某些高性能计算机,能通过网络,对外提供服务。
相对于普通PC来说,稳定性、安全性、性能等方面都要求更高,因此在CPU、芯片组、内存、磁盘系统、网络等硬件和普通PC 有所不同。
多媒体,从广义上讲,多媒体指的是能传播文字、声音、图形、图象、动画和电视等多种类型信息的手段、方式或载体。
包括电影、电视、CD-ROM、VCD、DVD、电脑、网络等。
从狭义上讲,多媒体指融合两种以上“传播手段、方式或载体”的、人机交互式信息交流和传播的媒体,或者说是指在计算机控制下把文字、声音、图形、影像、动画和电视等多种类型的信息,混合在一起交流传播的手段、方式或载体。
如多媒体电脑、因特网等。
1.什么是信息检索?狭义的信息检索(Information Retrieval)是指依据一定的方法,从已经组织好的大量有关信息集合中,查找并获取特定的相关信息的过程。
广义的信息检索包括信息的存储和检索两个过程(Information Storage and Retrieval)。
信息的存储是将大量无序的信息集中起来,根据信息源的外部特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的数据库或检索系统,供人们检索和利用。
而检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。
2.信息检索的类型(按不同标准划分)有哪些?按检索方式分:(1)手工检索(2)计算机检索(3)综合检索按检索内容或检索目标分:(1)文献型信息检索(2)事实型信息检索(3)数据型信息检索按系统中信息的组织方式分:(1)全文检索(2)超文本检索(3)超媒体检索3.信息检索的途径(按不同标准划分)有哪些?按内容特征途径分:(1)主题途径(2)分类途径(3)代码途径按外表特征途径分:(1)题名途径(2)著者途径(3)机构途径(4)编号途径(5)其他途径4.检索语言(按不同标准划分)有哪些?按检索词的规范化程度,检索语言可分为自然语言(也称非受控语言)和人工语言(也称受控语言)两种。
其中人工语言可分为:(1)分类语言(2)主题语言(3)代码语言分类语言又可分为:(1)主题分类语言(2)学科分类语言(3)图书分类语言(4)专利分类表主题语言又可分为:①关键词语言②标题词语言③单元词语言④叙词语言按组配方式划分,检索语言可分为:(1)先组式语言(2)后组式语言4.检索系统(按不同标准划分)有哪些?检索系统的类型:按文献信息事业来划分可分为:(1)图书馆系统(2)情报信息系统(3)档案馆系统按检索的工具和方式来划分可分为:(1)手工检索系统(2)机械检索系统(3)计算机检索系统其中,计算机检索系统一般又可分为光盘检索系统、脱机检索系统、联机检索系统、网络检索系统。