当前位置:文档之家› 《信息组织》马张华考前复习要点

《信息组织》马张华考前复习要点

《信息组织》复习要点第一章导言第一节信息组织的必要性1.信息组织:根据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、标引、处理,使其有序化并以适当方式加以提供的活动。

2.信息资源:通常指一切以记录形式存在的信息载体,只是比较而言,更侧重于对新型媒体形式的强调。

(可以是图书、期刊、报纸、论文,也可以是网络上的电子资源)3.信息检索:根据检索需要,从检索系统中检出相应信息资源的过程。

4. 信息组织与信息检索有什么关系?(1)信息组织是信息检索的基础和前提,只有对信息资源进行处理和有序化信息系统之后,才能准确有效查找相关信息资源;(2)信息检索则是信息组织出发点与归宿,用户的检索需要是组织信息的主要依据。

第二节信息组织的形式和检索途径1.文献组织的基本排列方式:一般有两种基本排列方式,其一为:(固定排列法)和(按一定意义的次序排列。

)(固定排列法,如档案、博物馆的收藏、光盘、录音带、缩微品。

按一定意义的次序排列包括按题名字顺排序,按责任者排序等,如图书、期刊等, )2. 按照检索工具的对象和特点,可以分为(文献目录)、(索引)、(机读数据库)、(网络搜索引擎)四种类型。

3. 按照标识特征,检索工具可以分哪两种基本类型?(1)以信息资源的外部特征(形式特征)为检索依据,提供以信息资源形式特征为标识检索途径。

常见的信息资源形式特征有责任者名(即作者和与资源形成相关的人或机构,如译者、改编者、修订者等)、题名、机构名、标准书号、专利号、文献登录号(或顺序号)等。

(2)以信息资源的主题内容特征为检索依据,提供从资源内容进行检索的途径,主要有(分类法)、(主题法)。

4.按照系统中所用的标识是否进行控制,检索工具可以分为(受控检索系统)与(自然语言检索系统)。

5.按照系统中标识组配的特点,检索系统可以分为(先组式和后组式两种)。

6.检索工具还可以按照采用的形式,分为卡片式、书本式、缩微式、电子方式等。

第三节信息组织的处理方式和研究内容1.信息处理的基本做法:(领会)①对信息资源特征进行描述。

包括:著录或编写题录,通过记录信息资源外部特征,供用户识别或确认该资源。

②对信息资源的内容进行浓缩。

包括编写内容提要或文摘,使用户能迅速了解其内容和特点,供检索查找时选择、判断。

③提供检索点。

主要是确定检索特征及可检信息,以便据此对信息资源进行有序化组织。

如题名、责任者、分类号、主题词或关键词等2.信息组织活动的内容:(了解)信息组织活动包括两个基本方面:(1)信息组织的操作。

指根据信息资源的内容和特征,对信息资源进行描述、标引、并将其组织进相应系统的过程。

(2)信息资源的组织规范。

这是根据信息组织的需要,按照信息资源的特点预先确定的规则和方法系统,是进行信息组织操作的依据。

3.检索语言:一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,也称情报检索语言。

4.知识组织系统:知识组织系统通常指经过组织的知识结构表达的工具,它试图包含组织信息和促进知识管理的各种类型的词表,其范围从传统的地名表、同义表,到新型的知识组织工具。

第二章信息组织原理第一节对信息组织的要求1. 检全率:是指一次检索中检出的与提问相关的信息资源数量占系统中所有与提问相关的信息资源数量的比例,检全率=检出的相关信息资源量/系统中相关信息资源总量子数×100%2.检准率;是指检出的相关信息资源的数量,占检出的全部信息资源数量的比例。

检准率=检出的相关信息资源数/检出的信息资源总数×100%3. 简述对信息组织的要求。

(领会)(1)检全率。

略(2)检准率。

略(3)检索速度和系统的及时性。

检索速度是指用户从实施检索到得到结果化费的时间,它是衡量系统检索速度与使用效果的重要参数。

它与系统响应检索的能力、检全率、检准率、资源组织的全理性等因素有关。

系统的及时性是指检索工具处理信息和提供信息所用时间较短,能快速纳入、处理和提供信息。

(4)系统易用性。

是指标引人员使用检索系统描述、标引资源是否方便和易用;用户使用系统的简易性、方便性与获取信息的容易程度。

系统易用性是系统性能的主要因素,决定系统设计改进和发展方向。

(5)检索的成本效益。

是指检索系统的成本和效益之比。

检索成本包括系统设备费、标引处理费、检索运行费;检索效益指检索系统创造经济效益和社会效益。

好的检索系统是低成本高效益的系统。

第二节信息组织中的控制与规范信息组织规范控制的方法通常包括对信息组织对象的描述控制、信息组织和检索过程中的词汇控制、句法控制等内容。

1、描述控制包括:①描述项目的控制;②描述文字的控制;③描述级别的控制;④描述格式控制。

(了解)2、词汇控制指根据信息资源标引和检索的需要,对自然语言中的词汇进行选择规范并提示其相关性的过程。

包括:①同义控制。

②词义控制。

③词间关系控制。

同义控制:是对字面形式不同而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达。

包括对同义词、准同义词及部分专指词与泛指词进行的控制。

同义控制常用的方法是在几个词中选取一个作为规范词,在规范词和非规范词之间建立用代参照,便于用户从非规范词找到规范词。

同义控制的作用是可以克服一义多词的自然语言现象,把相同内容或特征的信息资源集中在一起。

如:自行车代脚踏车单车词义控制:是对同形异义词和语义含糊的词进行控制,使词义明确,一个词语只表示一个概念,以控制一词多义现象。

词义控制常用的方法是在词后加限义词,在词下增加含义注释和范围注释。

疲劳(生理);疲劳(心理)词间关系控制:是揭示词汇之间的等级、等同、相关关系,使之成为语义相关的系统。

在主题法中词间关系控制采用设置参照、倒置标题、主标题-副标题以及编制词汇索引系统,如词族索引、范畴索引、轮排索引等。

分类语言主要通过类目体系显示词语间的从属、并列、相关关系,用类目参照显示语词概念的横向联系。

3、句法控制检索系统的句法控制一般是在一定组配方式的基础上,采用相应的句法措施实现的。

常见的方法包括确定引用次序、使用辅助符号以及轮排等。

(了解)引用次序亦称组配次序,指复合主题标引和检索时,各个主题因素的组合次序。

引用次序在分类法中,指类目划分标准使用次序或不同分面被引用的先后次序;在主题法中指字顺标题检索系统中主标题与各级子标题使用的次序。

4.相关因素控制的主要内容(领会)常用的相关控制包括引用关系、链接关系和用户需求等。

①引用关系:这是科学文献中通过相互引用建立的一种关系,通过它,可以根据相互引证关系,提示文献之间内容上的联系。

②链接关系:是基于超文本链接技术建立的对象之间的联系。

③用户需求:信息组织是为用户服务的,因此用户的检索需求是信息组织的目标和判断信息组织使用效果的重要指标。

第三节规范控制的依据1.概念之间的关系类型。

①同一关系:“自行车”与“脚踏车”、“电子计算机”与“电脑”。

②包含关系:“哺乳动物”与“熊猫”、“图书馆”与“公共图书馆”。

③交叉关系:“妇女”与“科学家”、“中等教育”与“业余教育”。

④矛盾关系: “核国家”与“非核国家”。

两者之和等于上位概念“国家”。

“脊椎动物”与“无脊椎动物”⑤反对关系: 中医学与西医学。

两者之和小于上位概念“医学”。

“无产阶级”与“资产阶级”、“有机肥料”与“无机肥料”⑥并列关系:“人造棉”与“锦纶”、“维纶”、“腈纶”2.阐述文献保证原则和用户保证原则。

文献保证原则:亦称文献根据,指信息资源组织应根据信息资源类型、数量等因素进行相应控制。

信息检索系统处理的对象是各种类型信息资源,因此要有效进行信息描述及主题内容的组织和提示,离不开对信息资源的内容、特征以及分布状况等的了解。

信息资源的数量、特点,往往是影响检索语言详略程序、确定类目或标识设置的重要依据。

用户保证原则:指根据用户需要进行描述控制和词汇控制。

检索系统是为用户服务的,各种控制和组织措施如不符合用户的检索要求和使用习惯,必然会影响其使用效果。

因此对信息检索系统在进行规范控制时,应当有意识地从用户的使用需要出发。

第三章信息描述第一节信息描述的含义1.信息描述的信含义:亦称信息资源描述,是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。

2.元数据:是关于数据的数据,或关于数据的结构化的数据。

其作用主要包括:①识别:确认并对要进行组织的信息资源进行个别化描述,使用户能识别该组织的资源对象。

②定位:提供信息资源位置的信息,以便供用户访问时使用。

③检索,通过在描述数据中提供检索点,方便用户对资源的检索和利用。

④选择,通过记录信息资源的各种特征,如主题、作者等,供用户对信息资源的使用价值进行判断,并作出选择。

3.信息描述的主要标准:①ISBD是《国际标准书目著录》的英文缩写,由国际图联(IFLA)1969年制定的供各类信息资源描述用的国际标准。

②《文献著录总则》我国于1983年7月发表的全国文献著录总则。

③《都柏林核心集》(Dublin Core, 简称DC),1995年3月在美国小镇都柏林创建的元数据描述方法,是对网络资源描述最著名、最有代表性的标准。

第二节信息资源描述项目、标识和描述级次1.信息描述项目:亦称著录项目,是用以揭示文献内容和特征的记录事项。

2.基本描述项目的内容:我国国家标准《文献著录总则》规定基本描述项目分为9个大项目,依次为:题名和责任者项目;版本项;文献特殊细节项;出版发行项;载体形式项;丛编项;附注项;文献标准编号及有关记载项;提要项。

《都柏林核心集》分15个大项:题名;创作者;主题;描述;出版者;参与者;日期;资源类型;格式;资源标识;来源;语言;关联;覆盖范围;权限管理。

3.掌握文献著录格式,描述各项目内容:如下图:图:文献著录格式4.著录详略级次(参见P41图3-3,图3-4,图3-5)简要级次:仅记录主要项目的级次,一般为小型文献单位;基本级次:记录主要项目的同时,记录部分选择项目。

最常见详细级次:记录主要项目和全部选择项目上。

适合国家书或集中编目使用。

5. 描述信息源:又称著录信息源、著录根据,指进行信息资源描述时描述信息的来源和出处。

第三节检索点和规范文档1.检索点是指检索信息资源使用的题名、责任者、分类号、主题词等供检索使用的各种数据。

2.标目的含义及作用。

标目即手检系统中的检索点,是记录中用来作为排检依据的资特征。

标目有两个作用:①作为排检的依据,确定一款目在检索系统中的位置,供检索查找。

②决定款目的性质,供组织相应检索工具使用。

3.参照法的含义和类型。

参照法是指引用户从检索工具中的一个标目或款目去查找另一个标目或款目的方法,其作用是指引检索系统中检索对象之间的联系,说明检索系统的编制和使用方法。

相关主题