当前位置:文档之家› 第三章 信息分布

第三章 信息分布

第三章信息分布1、信息产生与分布中的“马太效应”:在社会信息流的产生、传递和利用过程中,我们发现信息及相关因素常常表现出明显的核心趋势和集中取向。

(马太效应真实概括了人类社会生活中的惯性,描述了优势和劣势的积累过程:一经存在有优势,这种优势局面就会不断增加,反正若处于劣势,则这种不利条件也会继续加剧。

)2、马太效应A积极意义:(1)在实际的信息管理工作中,它可以帮助我们突出重点、摒弃平均,为信息源的选择、获取、评价和利用提供依据,为降低信息管理成本,提高信息利用效益提供指导和方法。

(2)在理论上,可以帮助我们认识信息集中和分散的特征、趋势和规律,发现信息管理学的基础性定律。

B负面影响:(1)信息的优势和劣势过度积累,容易使信息工作者因循守旧、不求变革创新,按经验和简单的规则从事复杂多变的信息管理工作(2)马太效应所形成的信息分布富集有时仅仅是表面的、外在的。

(3)核心信息源是马太效应优势积累的结果,但过分注重核心信息源,就会忽略分布在其他信息源中有价值的信息,造成过度专门化,这是信息管理和信息服务之大忌。

(4)信息生产者的成长和数量无疑对信息的产生和分布具有较大影响,马太效应青睐名人、拒绝新人的习惯不利于信任成长。

C由以上分析可知,马太效应的积累要适度,不能任其发展,为保证信息的产生和分布计较科学合理,适当的干预是必需的。

3、普赖斯的平方根定律:受洛特卡定律的启示,普赖斯提出了核心生产者分布的“平方根定律”,即在某一特定领域中,全部论文的半数系由该领域中全部作者的平方根的那些人撰写的。

“那些人”无疑是核心或高产的。

4、信息离散分布规律:是信息的重要属性,它表现为信息的内容单元以不同的方式,从不同的角度,分布于各种载体中。

(它具有复杂的机理,本质上是由信息的生产和利用决定的)5、布拉德福定律:或称为布氏定律,如果将科学期刊按其刊载某个学科主题的论文数量以递减顺序排列起来,就可以在所有这些期刊中区分出载文率最高的“核心”部分和包含着与核心部分同等数量论文的随后几区,这时核心区和后继各区中所含的期刊数成1:a:a2的关系。

6、普赖斯曲线:(指数增长率)第四章信息获取1、信息源:人们在科研活动、生产经营活动、文化活动和其他一切活动中所产生的成果和各种原始记录,以及对这些成果和原始记录加工整理所得的成品都是借以获取信息的源泉,简称信息源。

2、记录型信息源:包括由传统介质和各种现代介质记录和存贮的知识信息3、记录型信息源地位:不仅在目前,而且在今后相当长的时期内,印刷型仍然是最基本的信息源。

4、一次信息,凡是在科研、生产、经营、文化及其他各类活动中生产的原始信息;二次信息,是对一次信息进行加工整理后产生的一类信息。

三次信息,是在一、二次信息的基础上,经过分析、综合而产生的信息。

5、实物信息源:由实物携带和存贮的知识信息。

6、智力型信息源:主要是指人脑存贮的知识信息,包括人们掌握的各类知识、诀窍、技能和经验,有的可以用语言和文字明确表达和记录,有的则难以明确表达和记录,故又称为隐性知识。

7、隐性知识8、零次信息源:是人们通过直接交流获得的信息,是信息客体的内容直接作用于人的感觉的结果,而不像记录型信息和实物型信息那样通过某种无患子载体的记录形式发生作用。

9、有价值的信息:是在特定的问题和状态中被利用并有效发挥其功能的信息,是实现某种目标所需要的知识,是进行决策和选择所必需的资料。

10、有价值的信息应该有的6个条件:能够及时地以适当的方式提供解决问题所需要的依据;信息符合用户需求的内容;信息的可信赖程度高;信息具有综合性;信息容易获取;信息的费用与目标吻合。

11、直接评价法:就是按照有价值的信息应当具备的一般条件或标准,从不同角度和侧面对信息源的价值给予评分评价。

总的来说,这种方法十分粗浅,不能准确地揭示信息源的真正价值,这是因为:第一,对各指标的评分带有极大的主观性,完全取决于信息工作者个人对信息源的认识和了解。

第二,信息源的价值只有在实际利用中才得到真正体现,这种评定方法完全不考虑信息源在实际利用中的真正动态,因而不能正确反映信息源的价值。

第三,上述五项指标也还是不够完备的。

尽管如此,还是可用来作评价,作为信息收集和传递信息的一个参考判据。

12、间接评价法:是通过信息用户来评价信息源。

以调查表的形式调查用户对信息源的需求和利用情况,然后由信息工作者对调查所得到的数据进行统计分析和对比,对信息源的价值做出评定。

特点:需要信息用户密切配合,工作量大,但评价结果较为客观。

13、交叉检验:一般把从各个方面获得同一信息,并进行比较评价的方法叫做“交叉检验”。

14、信息经济性评价的3个要点:所需信息存在率的评价;所需信息适合率的评价;所需信息可靠性的评价。

15、信息再现率,从信息库中检索到的相关信息的比例。

适合率,真正所需的信息的比例。

机构信息存在率,16、信息获取的效率指标及各自定义:采全率,用来衡量切题信息搜集的完整程度,指某一信息系统(信息库)所含的全部切题性信息(对该系统的全体用户而言)在当时系统内外所有切题信息中所占的比例。

采准率,用来衡量信息搜集的针对性,指某一信息系统(信息库)所含的全部切题信息(对该系统的全体用户而言)在当时该系统所有信息中所占比例。

及时率,用来衡量信息搜集的速度,即在最短的时间内完成信息搜集过程的能力。

费用率,用来衡量信息搜集的资金效率,指用于信息库中单位信息的费用的最低能力。

劳动好费率,指信息系统搜集到的单位信息所耗费的最低劳动量,可用搜集过程所有环节的劳动消耗总数来计算。

17、信息搜集的5个原则:针对性,系统性,预见性,科学性,计划性。

第五章信息组织1、信息组织含义:亦称信息整序,是利用一定的规则、方法和技术对信息的外部特征和内容特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转化为有序集合的过程。

2、信息组织内容:信息选择,目的就是从采集到的、处于无序状态的信息流中甄别出有用的信息,剔除无用的信息。

信息分析,是按照一定的逻辑关系从语义、语用和语法上对选择过的信息内、外特征进行细化、挖掘、加工整理并归类的信息活动。

信息描述与揭示,信息描述亦称信息资源描述,是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。

信息存贮,是将经过加工整理序化后的信息按照一定的格式与顺序存贮在特定的载体中的一种信息活动。

3、信息组织的3大特性:第一,信息组织的渗透性,指信息组织存在于各种信息揭示、存贮和检索活动之中。

第二,信息组织的依附性,指信息组织无法独立存在,它要以信息的识别、揭示等活动为前提。

第三,信息组织的增效性,是指信息组织可以增加信息传播、检索、利用的效率,是其他信息加工活动和利用的保障。

4、信息组织的4大原则:第一、客观性原则,客观存在的信息本身;与条件变化和环境变化保持客观一致性。

第二,系统性原则。

第三,目的性原则,必须围绕用户的信息需求开展工作。

第四,现代化原则,思想观念现代化和技术手段现代化。

5、信息组织的标准化,包括:基本术语标准;有关信息技术标准;信息组织技术标准;其他相关标准。

6、信息组织最基础的理论仍然是语言学、逻辑学和知识分类。

7、知识分类:是一门研究知识体系结构的学问8、耗散结构理论:信息系统是一个开放的系统,系统不断与外界进行物质和能量的交换,熵趋于最小值,能量远离平衡,混乱度最小,从原来无序结构转为一种时间、空间和功能上的有序结构。

9、自组织系统:凡是能够不再借助于外部控制而实现从无序到有序的转变,并维持稳定有序状态的系统。

10、突变理论:是指系统的熵可以增加也可以减少,这种熵增、熵减可以在宏观无限小的时间内突然产生。

11、元数据:是关于数据的数据,关于信息的信息,或描述数据的数据,它是专门用来描述数据的特征和属性,也是描述和组织信息资源、发现信息资源的语言和工具。

12、著录:是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。

著录的结果是款目。

13、标目:是从文献内容和形式的某一特征指引排检线索的著录项目。

14、文献著录标准化:是指在国家或国际范围内,对文献著录的原则、内容、格式等作出具有一定约束力的规范。

15、信息标引:原来多称文献标引,是指分析文献的内容属性及相关外表属性,并用特定语言表达分析出的属性或特征,从而赋予文献检索标示的过程。

包括两个环节:一是主题分析,二是转换标识。

16、分类语言,也称分类法。

它是用分类号表达主题概念,依据知识分类将主题概念组织、排列成类目体系,主要以类目体系的自身结构显示概念之间关系的标引语言。

17、主题语言,又称主题法。

它是一种由受控的自然语言语词直接表达主题概念,按语词字顺序列主题概念,主要用参照显示概念之间关系的标引语言。

18、分类标引:是指对文献进行主题分析,用分类语言表达出分析出的主题,赋予文献分类检索标识的过程。

19、主题标引:是对文献进行主题分析,用主题语言表达分析出的主题,赋予文献主题检索标识的过程。

20、MARC:机器可读目录。

21、SGML:是一种元语言,是用来描述置标语言的语言,适用于电子文档交换、文档管理和文档发布。

22、文献型信息4个组织方法分类组织法,主题组织法,引用组织法,文献型信息的宏观组织。

23、运用较为广泛的四种网络信息资源的组织方法:第一,文件方式,文件是计算机保存处理结果的基本单位。

第二,数据库方式,数据库技术是从计算机系统中文件系统的基础上发展起来的对大量规范化数据进行管理的一种技术。

所谓数据库组织方式,是指将所有已获得的网络信息资源以固定的记录格式存贮,用户通过关键词及其组配查询,就可以找到所需要的信息线索,并通过信息线索直接连接到相应的网络信息资源。

第三,主题树组织方式,就是将信息资源按照某种实现确定的概念体系结构,分门别类地逐层加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直至找到所需的信息线索,并通过信息线索直接找到相应的网络信息资源。

第四,超媒体方式,超媒体技术是超文本技术与多媒体技术的结合,它将文字、图表、声音、图像、视频等多媒体信息以超文本方式组织起来,使人们可以通过高度链接的网络结构在各种信息库中自由航行,找到所需要的任何媒体的信息。

24、知识组织:是对文献中所含内容进行分析,找到人们创造与思考的相互影响及联系的结点,像地图一样把她们标记出来(即知识地图),以展示知识的有机结构,为人们直接提供创造时所需要的知识。

25、数据仓库:是将整个机构内的数据以统一形式集成存贮在一起,便于针对一定主题的、集成的、时变的、非破坏性的数据进行集中分析。

“面向主题的、集成的、稳定的、不同时间的数据集合,用以支持经营管理中的决策制定过程”。

26、联机分析处理(OLAP):是一种友好而灵活的工具,它允许用户以交互方式浏览数据仓库,对其中的数据进行多维分析,及时地从变化和不太完整的数据中提出与企业经营活动有关的信息。

相关主题