当前位置:文档之家› 信息组织总结

信息组织总结

信息组织总结1、信息组织是为了把无序的信息整理归纳成为有序的信息资源的活动;信息的表示通常差不多上数据,然而只有通过了处理的数据才能成为信息。

2、信息组织活动实际上是对信息资源的处理,通常是以信息检索为基础的,因此建立检索的规范和操纵语言是信息组织的关键手段。

从那个意义上说,信息检索是信息组织的目的和归属。

3、信息组织的形式(检索方式)有二种,其一是“固定排列法”;其二是“分类排列法”。

常用的是分类法,本课要紧介绍分类法。

4、信息组织的研究有三个层面的内容:理论层面、规范层面和方法层面。

理论层面研究信息组织的差不多规律,为规范层面和方法层面提供理论依据,指导信息组织的操作和实施。

规范层面提供信息组织应该遵循的共同规范(描述规范和检索语言)。

方法层面是实现信息组织的具体技术(操作方法、标引规则和描述规则)5、信息组织是信息检索的基础和前提,信息检索是信息组织的目的和归宿。

第一章习题:1、信息的定义是通过处理的、可供公享的数据;数据的定义是通过有意义的组合来反映客观事实特点的、能够识别、也能够传输进行通信的非随机符号。

它们之间的联系是通过处理的数据确实是信息、无序数据不是信息。

2、信息组织的意义在于为了检索方便对信息资源进行的有序化组织的活动;信息组织的要紧工作过程是建立信息资源收藏系统和检索工具。

3、信息组织有四种分类,它们是文献名目、索引、机读数据库和网络引擎。

4、信息组织和信息检索的关系是检索是信息组织的目的和归宿、组织是检索的基础和前提。

检索语言的意义是信息资源主题概念关系的词汇和规则所组成的人工语言系统。

第二章1、为了有效的检索和利用信息组织,关于大型检索系统需要考虑“检全率”;而关于中、小型检索系统,检全率能够忽略,重点是“检准率”。

检全率和检准率二者是反比例关系。

2、检索速度和系统及时性是涉及信息资源组织时刻和检索时刻的二个指标。

另外、一个好的检索系统还要考虑“易用性”和“成本效益”。

3、要使信息组织符合实际使用的需要,是通过各种规范操纵的方法实现,包括:一是对信息组织对象的描述操纵;二是对检索过程中的词汇操纵和句法操纵。

4、为有效地组织信息,必须对描述记录的内容、描述方式进行必要的操纵,包括四个方面:⑴描述项目操纵(依照资源的特点选择有价值的描述项目)⑵描述文字操纵(以便准确、统一地进行各种特点的记录)⑶描述级别操纵(依照系统的特点和需要,制定描述项目的详略程度)⑷描述格式的操纵(项目的次序、标识、表达形式的规范)。

5、具体的操纵规范有“词汇操纵”和“句法操纵”;“词汇操纵”是对自然语言中的词汇进行选择、规范并揭示其相关性,有“同义操纵”和“词义操纵”。

“句法操纵”是依照资源标引和检索的需要,通过组词造句的规则对检索系统的语词组合方式作出规定。

常用的方法有:引用次序(复合主题标引和检索时,各个主题因素的组合次序)、使用辅助符合(是进行句法操纵的重要手段,包括关系符号、逻辑组配符号、联系符号和职能符号)6、规范操纵的依据是“以概念逻辑为工具,以知识分类为基础,依照信息资源特点和设备条件状况进行的。

第二章习题:1、谈谈你对检全率和检准率的概念的明白得,同时说明它们之间的关系。

【答】检全率和检准率是衡量信息检索系统的有效性的二个重要指标。

检全率是检出的相关信息资源量占系统资源总量的百分比;检准率是指检出的有效资源数量占检出的相关资源量的百分比。

它们的关系是反比例的,实际检索系统是依照检索系统的特点和用户的需求确定这二个参数的;具体说:关于中、小型检索系统要求有比较高的检全率,而对信息数量大的数据库或搜索引擎,则要求有比较好的检准率。

2、什么缘故要进行词汇操纵?词汇操纵包括哪些内容?【答】信息资源组织的有序化的依据基础是自然语言,然而自然语言的特点与描述、标引的要求存在差异,比如自然语言存在一词多义、一义多词,语词和概念不是一一对应,因此必须依照检索系统的需要,对词汇进行必要的选择和处理(即操纵)3、句法操纵有什么作用?常见到方法有哪些?【答】词汇操纵有利于以统一、规范的方式揭示信息资源的主题或特点,然而仅有词汇是不够的,还必须有词汇的组合方法,才能够对复杂的主题的组织与揭示形成相应的语词组配(句法操纵)。

句法操纵的常见方法有三种(1)引用次序法(组配次序),要紧用于分类资源组织法中。

(2)辅助符号法(组配符号),是重要的句法手段,具体有关系符号、联系符号、职能符号和逻辑组配符号。

(3)轮排法,是通过对语句中语词位置的变动解决检索系统总量增加时,句法形式多样化、引用次序法中各种复杂主题只有一个检索入口,阻碍查找和使用。

第三章1、在信息资源组织的实践中,网络信息资源的描述数据是“元数据”。

信息描述的目的确实是以元数据为中介,对信息资源进行各种操作。

作用有:识别(进行个别化描述,使用户能够识别资源对象)、定位(提供信息资源位置)、检索(通过描述数据中的检索点,提供各种差不多的检索途径)和选择(记录资源的各种特点,供用户对其使用价值进行判定,决定取舍)。

2、检索点是指检索信息资源所使用的题名、责任号、分类号、主题词等各种供检索使用的数据。

题名检索点是从题名角度查找资源。

选择方法有:正题名直截了当作标目;付题名和附注项中的合辑题名作标目。

要注意的是:并列题名不选作标目,题名检索点一样不能超过二个。

第三章习题:1、简述“元数据”在信息描述中的作用?【答】在信息资源组织的实践中,网络信息资源的描述数据是“元数据”。

信息描述的目的确实是以元数据为中介,对信息资源进行各种操作。

作用有:识别(进行个别化描述,使用户能够识别资源对象)、定位(提供信息资源位置)、检索(通过描述数据中的检索点,提供各种差不多的检索途径)和选择(记录资源的各种特点,供用户对其使用价值进行判定,决定取舍)2、检索点的意义是什么?题名检索点的选择方法是什么?【答】检索点是指检索信息资源所使用的题名、责任号、分类号、主题词等各种供检索使用的数据。

题名检索点是从题名角度查找资源。

选择方法有:正题名直截了当作标目;付题名和附注项中的合辑题名作标目。

要注意的是:并列题名不选作标目,题名检索点一样不能超过二个。

第四章1、信息描述的实际意义是什么?简述信息描述工作的差不多程序,并扼要说明各步的工作内容。

2、Connexion编目平台有什么优越性?说明利用Cnnexion系统查重的操作方法?3、《都柏林核心集》方式北大图书馆的描述记录如下图示,试说明前面四行的意义。

第五章1、信息资源分类的特点是四个,从属于二个方面:⑴按照学科特点、内容特点分类;⑵以一定的标记符号、从字顺角度提供类目索引。

2、分类法的类型有聚类和分类二种;其编制方式有三种⑴等级列举式;⑵分面组配式⑶列举组配式。

3、说明下面各表的分类编辑方式:⑴P80物理学分类表;⑵P86生物科学分类表;⑶P91生物科学分类表。

⑷P91工程技术分类表。

第五章习题:1、准确、一致地组织和揭示信息资源的依据或者工具是信息资源分类法、也称为文献分类法、分类语言;是依照类目之间的关系组成的,并配有一定标记符号的类分信息工具;按编制方式能够分为等级列举式、发分面组配式和列举组配式三种类型。

2、类目表的结构成分有主表、复分表、标记符号、说明与注释和类目索引。

其中“复分表”的使用的重要注意事项是复分表不能单独使用和确定使用后不能随意变动。

3、说明标记技术中的八分法的具体做法,同时将下面的文献用八分法进行类目号码配置。

(44分)(物理学,中学物理;一般物理;力学、电学、热学、光学、原子物理、电磁学、人体仿真学。

)【答】八分法(又称为扩九法),做法是:在层累数字标记的情形下,当同位类超过10个,不足18个时,前九位用0-8表示,8后面的标记用二位数字表示一次划分。

O40 物理学O41 中学物理学O42 一般物理O43 力学O44 热学O45 电学O46 光学O47 原子物理学O48 电磁学O491 人体仿真学第六章习题1、世界三大分类法是⑴DDC (杜威十进分类法);⑵UDC(国际十进分类法);⑶LCC (美国国会图书馆图书分类法);(能够写代号)其中⑴的特点:主表是关于已知主题的详细列举,差不多上是以学科为中心展开的。

2、试分析下表的结构,回答下列问题:⑴什么缘故那个表属于“十进分类”体系?⑵它的第一级类目有几个大类?总类的用途是什么?⑶举例说明那个类目表的层层展开特点;试将“法律”展开为九个三级类(宪法、刑法、诉讼法、行政法、民法、经济法、环境爱护法、选举法、物权法)2、试分析下表的结构,回答下列问题:⑴什么缘故那个表属于“十进分类”体系?答:DDC的主表是对已知主题的详细列举,其第一级类目把所有学科门类分为9个大类,再把不行归类的门类列入一个总类,一共是十个大类,故称为“十进分类”体系。

(2)它的第一级类目有几个大类?总类的用途是什么?答:第一级类目有“总类、哲学、宗教、社会科学、语言学….等”十个大类;总类的用途是:为其他不能够进入其他9个大类的学科门类留下一个归类口。

第七章小结1、在一样分类规则中有三种分类规定:(1)单主题信息资源分类标引。

(2)多主题信息资源分类标引。

前者分有二种情形,如《人口统计学》归入“人口学”下的专类,标引是G921,属于简单单主题信息分类资源,《中国茶道文化》应归“中国文化史”K203属于方面单主题,后者包括并列关系,从属关系,联结主题等。

2、《运算机应用基础》应归入运算机应用。

3、对文献进行分类组织,又称排架。

能够将文献组织成一个按内容之间的关系排列的系统。

同类书要求取号简易、号码简短。

4、分类索引号又称分类排架号,分类索引书号的记录形式通常是2-3行书写。

5、鲁迅《准风月谈》的号码是“辅助符号\数学”的组合,其中辅助符号是1。

6、王力《古代汉语》第一册和第二册的区分是依靠辅助符号结合相应的数字区分。

第一册:H109.2 W253第二册:H109.2 W253:27、(1)、F129.9表示中国经济地理,则浙江经济地理“F129.955”(2)、法语词典:H32法语+6词典=H326(3)、物理学文摘:专题书目类号Z89+物理学O4=Z89:O4(4)、阿富汗哲学:亚洲3+西亚7=阿富汗372+哲学B=B372(5)、轻工业企业组织与治理:轻工业F407.8+组织治理F406=F407.8068、老舍的《骆驼祥子》应该归入现代中长篇小说。

第八章小结1、主题法是分类法以外另一种从角度标引和检索信息资源的方法。

特点:(1)直截了当一语词作为检索标识(2)以字顺作为要紧检索途径(3)以特定的事物、问题、对象即主题为中心集中信息资源2、主题法类型:标题法、元词法、叙词法、关键词法3、“物理文献索引”能够分解为物理、文献和检索三个元词,假如用叙词表示是物理文献检索。

相关主题