信息检索基础学习目标1.掌握信息、情报、文献、知识的基本概念2.了解文献的类型、特点3.知道数据库的类型与结构4.掌握信息检索的途径、步骤5.理解检索式的编写与检索策略的调整6.熟悉信息网络技术与网络信息检索第一章信息检索与利用概论第一节信息学信息学是研究信息的获取,处理,传递和利用规律性的一门学科。
(一)信息(Information)美国-克劳德·申农(C.Shannon)。
1948年,《通信的数学理论》—―信息‖解释为―两次不定性之差‖,即通信的意义在于消除某种不定性。
该论文成为信息论诞生的标志。
定义1:信息是物质运动规律总和,即不是物质,也不是能量。
定义2:信息论的创始人申农(Shannon )认为:―信息是能用来消除不确定性的东西‖或―信息是确定性的增加” 。
定义3:信息是客观事物状态和运动特征的一种普遍形式。
钟义信1988年《信息科学原理》信息定义为:事物的运动状态和状态变化的方式。
被国内多数教材接受采用。
(二)信息的特征1.普遍性2.传递性3.依存性:信息必须依附于一定的物质形式上(如声波、电磁波、纸张、化学材料、磁性材料等),不可能脱离物质而单独存在。
4.相对性:客观上信息是无限的,但对于信息用户来说,人们实际获得的信息问题有限的。
同一信息对不同认知水平的用户所产生的作用和有效性也不同。
5.可加工性:信息可以加工处理,可以压缩、扩充和叠加,也可以变换形态。
6.时效性7.可共享性:信息与物质,能量显著不同的是。
信息在传递过程中并不是―此消彼长‖,同一信息可以在同一时间被多个主体共有,而且还能够无限的复制、传递,它可以共享。
(三)信息的作用1.信息是人类认识客观世界及其发展规律的基础。
2.信息的基本功能,主要表现为信息的认识功能。
3.信息是科学研究的必要备件。
4.信息是管理和决策的主要参考依据。
5.信息是社会发展的资源。
(四)知识、情报和文献1、知识Knowledge知识是人类认识的成果,它是在实践的基础上产生又经过实践检验的对客观实际的反应。
知识具备的特征:被证实的justified,真的true,被相信的believed(1)知识认识观、知识信息观知识认识观:知识就是对事物的属性与联系的认识,表现为对事物的知觉、表象、概念、法则等心理形式。
即是说,知识是对事物本质及联系的认识。
据此,知识分为:直接知识和间接知识。
----仅属于“有形知识范畴”。
知识信息观(当代知识观):知识是人类通过信息对自然界、生物界、人类社会运动规律的认识和概括,是人的大脑通过思维重新集成整合的系统化信息,是信息中最有价值的部分。
即使说,信息是产生知识的原材料,知识是信息加工的抽象化产物。
-----揭示了知识的信息本质(明确信息与意会信息),适应了信息化时代社会经济与科学技术进步的趋势与要求。
有形知识(显性知识,Explicit knowledge):个人具有有意识的提取线索,能直接用语言表达,便于与他人共享,以命题和命题网为其表征的明确信息。
无形知识(隐性知识,Tacit knowledge):个人不具有有意思的提取线索,不能用语言系统表达,不便与他人共享,以活动中的发生式系统为其表征的意会信息。
获取无形信息的办法:在实践的特定情境中,注意观察、体验他人的行为方式,从他人的观点出发来看待事物,进行领悟式情境学习。
(2)知识的分类——(经济合作与发展组织OECD《以知识为基础的经济》)①关于事实方面的知识,即know-what,类似于数据。
②关于客观原理和自然规律方面的知识,即know-why,类似于科学等。
③关于某些事情的技艺、能力,即know-how,类似于智能、技能。
④涉及谁知道如何做某些事情的信息,及know –who,类似于信息。
2、情报Intelligence ,Information:是指传递着的在特定效用的知识。
三个基本属性:①知识性:根据知识的定义和特性,知识去除了糟粕的信息,并且具有可实践性。
②传递性:没有被激活的知识只能发挥知识的价值,而不能体现情报的价值。
③效用性:情报最大的特点是可以发挥比其作为知识更为巨大的作用。
3、文献Literature ,Document:记录有知识的一切载体。
文献本身并不是知识,其包含的内容才是知识。
文献要素:知识内容、信息符号、载体材料,记录方式。
信息符号、载体材料和记录方式都影响知识内容的获取和利用。
概念间的关系:属种关系。
信息是属概念,知识和情报是信息之下具有交叉的种概念。
信息、知识、情报、文献四者的关系(五)信息源信息源是个人为满足其信息需要而获得信息的来源。
信息类型保存性:正式记录的信息源、非正式记录的信息源时间:先导(天气预报)、实时(现场直播)、滞后(报纸)表现形式:文字、图像、数值、语音内容:社会科学、自然科学、科技信息源存储载体:刻写型、印刷型、缩微型、声像型、机读型。
★★按产生次序和加工程度划分(重要):零次、一次、二次、三次信息理解各层次信息的含义,根据各层次信息的特点能够判断不同出版类型的信息、文献分别属于什么层次的信息和文献。
1.零次信息;从信息理论上来讲,零次信息是信息的一个部分,是一切信息产生的源信息。
即客观存在于社会生活中,通过人的视觉,触觉,听觉等形成的言语,神情,动作,气氛等表象形式。
其主体是口头信息及行为表现,包括广义的网络语言。
在此基础上延伸到记录在非正规物理载体上的未经任何加工处理的源信息叫做零次信息,Eg书信,论文手稿,笔记,实验记录,会议记录等。
2.一次信息:又称原始信息,它是人类社会实践活动中直接产生或得到的各种数据,概念,知识,经验及其总结。
人们直接以自己的生产,科研,社会活动等实践经验为依据生产出来的文献,这些文献是脑力劳动的正式产品,是科研成果的一种主要表达形式,代表新知识,组成了可供交流的系统性信息。
一次信息在整个文献中是数量最大,种类最多,所包括的新鲜内容最多,使用最广,影响最大的文献,Eg期刊论文,专利文献,科技报告,会议录,学位论文等。
一次信息的特点:创造性;原始性;多样性。
3.二次信息:指根据实际需要,按照一定的科学方法,将特定范围内的分散的一次信息进行加工整理使之简化和有序化而形成的文献信息。
它能较为全面系统的反映某学科某专业文献想线索,是检索一次信息的工具。
Eg书目,题录,索引和文摘等。
二次信息的特点:集中性;工具性;系统性4.三次信息:指通过二次信息提供的线索,选用一次信息的内容,进行分析,综合,改编,重组和综合概况生成的信息。
Eg专题评述,动态综述,系统评价,进展报告,学科年度总结,年鉴,指南,百科全书等。
三次信息的特点:综合性;针对性;科学性按出版类型划分:1.图书:有专著,教科书,论文集,会议汇编等。
2.期刊:Journal,又称杂志,是有固定刊名,以期,卷,号或年,月为序,定期或不定期连续出版的印刷读物。
特点为出版周期短,报道速度快,数量大,内容多,发行面广。
3.科技报告:是关于某项科学研究和革新成果的报告或研究过程重点阶段进展状况的实际记录。
内容高度专门化,有一定的保密性。
以单行本的形式出版。
4.专利文献5.会议文献6.政府出版物7.学位论文:特点为论文的水平和质量差别较大,论题比较专一,阐述系统,具体,有一定的独创性观点,且经过一点的审查,故有一点的参考价值。
8.标准文献9.产品样本10.科技档案二、信息需要与行为(一)信息需要指人们在从事各项实践活动的过程中,为解决所遇到的问题而产生的对信息的需求。
是信息行为发生的基础。
信息需要的特征:1.广泛性:人类的实践活动的广泛性也决定了信息需要是普遍存在着的心理现象。
2.社会性:信息需要的产生和发展是由社会环境和社会活动决定的。
所以信息需求不仅仅是个体的特性,而且主要是一种社会需要。
3.发展性:社会实践活动的发展,社会现象日趋复杂,刺激了信息需要的日益增长。
4.多样性:信息用户的知识结构、专业、地位、职责等的多样性决定了信息需要千差万别,即使对于同一信息用户,在不同的时间、地点和环境条件下,由于具体任务的变化,其信息需要也会有很大的差别。
★信息需要的层次(重要):1.未知的信息需要:没有或没有意识到自己处于信息需要的状态,属于客观信息需要。
2.潜在的信息需要:人们认识到而未表达出来的信息需要3.现实的信息需要:当人们意识到信息需要,而且明确表达出来的信息需要的内容:对信息本身的需要是用户信息需要的最终目标。
人们在从事各种社会活动的过程中,为了解决所遇到的问题,就需要了解情况,增长知识,及时做出有效的决策。
由于信息本身的诸多属性,用户对信息的需求也涉及到许多方面。
各类信息用户的需要特点:各类信息用户的信息需要在内容上、质量和数量上、类型上根据解决问题的属性均有所区别。
(二)信息行为:信息行为是人们满足自己信息需要的社会活动的过程。
用户的信息行为主要有信息检索行为、信息的选择行为和信息利用行为。
(1)信息检索行为信息检索行为,指的是用户自己查找、采集和寻求所需要信息的活动(2)信息选择行为信息选择行为指的是信息采集者从某一信息群中把符合自己需要的一部分信息挑选出来的过程。
信息选择的核心标准就是相关性和适用性。
(3)信息利用行为信息利用是用户寻求信息的根本目的。
信息利用行为指的是用户利用信息解决其所面临问题的过程。
(三)信息检索信息检索是指为达到某一特定目的,将信息源与用户需求连接起来,查寻、鉴别、选择并确定相关信息的过程。
广义的信息检索包括信息的存储和信息的检索,所以又称为―信息存储与检索‖。
信息的存储主要包括对在一定专业范围内的信息选择基础上进行信息特征描述、加工并使其有序化。
在现代信息检索技术条件下,信息检索从本质上讲,就是指人们希望从一切信息集合中高效、准确地查询到自己感兴趣的有用信息,而不管它以何种形式出现,或借助于什么样的媒体。
信息检索至少包括三层含义:(1)是按某一主题或某一特征从信息源或数据中查找到相关的信息及其获取线索,如OPAC 检索(2)是为解决某一问题从信息源或数据库中获取隐含于文献中的事实、数据、图像或理论等未知的知识,如全文检索(3)是将查寻的信息及其知识进行分析加工,提供给用户使用,如科技查新信息检索经历了三个发展时期:手工检索时期,机械检索时期,计算机检索时期。
信息检索的意义1)信息控制的手段2)获取知识的门径,学习的助手3)科学研究的工具和指南4)决策与管理的支持与参考第二节信息素养1989年,美国图书馆协会对信息素养定义为:具有信息素养的人能够知道什么时候需要信息,能够有效地获取、评价和利用所需要的信息。
标准一:有信息素养的学生确定所需信息的性质和范围标准二:有信息素养的学生有效地获取所需信息标准三:有信息素养的学生批判性地评价采集资料的信息及信息源,决定是否需要调整最初的信息需求和/或寻求更多信息源,并创建一个新的研究过程。