当前位置:文档之家› 计算机信息检索重点

计算机信息检索重点

信息检索数据(Data):泛指所有描述事物的形貌、特性、状态或任何其他属性的数字、文字或符号。

一般指原始,未处理过的数据。

信息(Information):1. 物质存在的一种方式。

一般指数据、消息中所包含的意义。

可以使消息中所描述的事件的不定性减少。

2. 是事物运动的状态与方式的反映。

知识(Knowledge):A、是在改造世界的实践中所获得的认识和经验的总和。

B、是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的有组织的陈述。

提供某种经过思考的判断和某种实验的结果。

(信息是知识的原材料,知识是信息加工的抽象化产物。

)情报(Information):钱学森:“情报是活化了的、激活了的知识”。

可以理解为是指传递着的有特定效用的知识或信息。

三要素:知识性、传递性、效用性文献(Literature):记录有知识的一切载体。

三要素:载体(文献的外部形式,它是知识的包装或运载方式,常称之为媒体(media)。

)、知识(反映了文献的信息内容。

)、记录(信息的一种人工编码,通过人工、机械以及声、光、电、磁等各种技术手段生成多种包含知识信息内容的符号,以一定的形态出现,形成各种媒体的文献类型。

)文献对人类文明进步具有重大意义:知识的积累、传播与创造研究成果的确认与评价信息环境及其认识:信息环境的变化,20世纪90年代中期前,书本时期-----手工检索,缩微时期-----缩微检索,20世纪90年代后期,光盘时期-----单机检索,网络初期-----联机检索21世纪,网络兴盛-----网络检索第一章信息检索原理一、信息检索的含义(掌握)广义:信息检索包括信息的存储过程和查找过程;狭义:仅指信息的查找。

二、信息检索的类型(一、)以检索内容划分(重点)1.文献信息检索凡是利用目录、文摘或索引等二次信息查找某一课题、某一著者、某一地域、某一机构、某一事物的有关信息以及这些信息的出处和收藏单位等,都属于文献信息检索范畴。

其检索的结果是文献信息2.数据信息检索(Data Retrieval)凡是利用参考工具书、数据库等检索工具检索包含在文献中的某一数据、参数、公式或化学分子式等,统称为数据信息检索。

其检索结果为数据信息。

3.事实信息检索(Fact Retrieval)凡是利用百科全书等检索工具从存储事实的信息系统中查找出特定事实的过程称为事实信息检索。

其检索结果是基本事实。

文献信息检索是一种相关性的检索,检索的结果是文献线索,还必须进一步查找才能检索到有关的一次信息;数据与事实信息检索是一种确定性检索,检索的结果是可供用户直接利用的信息。

一般情况下,文献信息检索通过二次信息来实现,而数据与事实信息检索则通过三次信息来完成。

(二、)以信息存储和检索的方式和技术划分(掌握)1.手工检索(Manual Retrieval)手工检索简称“手检”,是指人们通过手工的方式来存储和检索信息。

其使用的检索工具主要是书本型、卡片式的信息系统,即目录、索引、文摘和各类工具书。

检索过程是由人工以手工的方式完成的。

2.计算机检索(Computer-based Retrieval)计算机检索简称“机检”,是指人们利用数据库、计算机软件技术、计算机网络以及通信系统进行的信息存储和检索,其检索过程是在人机的协同作用下完成的。

三、信息检索的意义(重点)(会用自己的语言表达)1. 避免重复研究或走弯路—科学技术的发展具有连续性和继承性,闭门造车只会重复别人的劳动或者走弯路。

2. 节省研究人员的时间3. 是获取新知识的捷径一、检索工具的定义(了解)1.用来揭示、存储和查找信息的工具,主要指手工检索工具。

2.检索系统则是由一定的检索设备(如计算机)和经过加工整理并存储在相应载体(如磁带、磁盘等)上的信息集合及其他设备共同构成的一种具有存储和检索功能的信息服务系统。

二、检索工具的类型(了解)目录目录款目索引索引款目文摘1、目录综合性目录:是以各个学科门类的图书或者报刊文献为揭示对象的目录。

如《全国总书目》、《中国国家书目》、《中国报纸名录》、《中国期刊名录》等。

(1)专题目录(2)馆藏目录(3)联合目录2、索引(Index)(1)索引是指将信息中所包含的主题词、分类号、著者姓名、论文题名等内容摘录出来,并注明它们所在图书、期刊或检索工具中的位置,然后按照一定的规则编排组织起来所形成的检索工具。

如《工程索引》(Ei)的“主题索引”、“著者索引”等。

(2)索引条目至少有两个著录项目:标目(标识Heading)和存储地址,有时候可能还会有说明语。

主题索引、著者索引是最常用的索引。

3、文摘(Abstract)(1)文摘就是对一份文献的内容所进行的简略而准确的描述。

通俗地讲,文摘就是原始文献的内容摘要。

它是将论文或书籍的主要论点、数据和结论等信息简明扼要地摘录出来,注明出处,并按一定方式编排的一种文献检索和阅读工具。

它是检索工具的主体,二次信息的核心。

美国的《工程索引》(Ei)和英国的《科学文摘》(SA)等均属此类检索工具。

(2)文摘通常以一个内容上独立的文献单元(如期刊中的一篇论文、会议录中的一篇会议论文或一种图书)为基本著录单位(见第五章《工程索引》文摘款目的样页)。

它和目录的主要区别在于:目录以单位出版物为著录对象,而文摘的著录对象可以是一个单位出版物,也可以是单位出版物的个别内容;目录反映的是文献的外部特征,而文摘既反映文献的外部特征,又反映文献的内容特征。

三、信息检索的方法(掌握):1、常规法2、追溯法3、交替法(一)常规法:常规法就是利用检索工具查找信息的方法,因在信息检索中经常使用而得名。

它又分为顺查法、倒查法及抽查法三种。

⏹顺查法——顺查法即是利用检索工具、根据课题研究的起始年代由远及近逐年查找信息的方法。

顺查法比较费时间,但由于是逐年查找,因而有较高的查全率。

⏹倒查法——倒查法与顺查法相反,它是利用选定的检索工具由近及远、逐年逐卷地进行查找信息的方法。

当检索者的要求是获取近期文献时,最好采用倒查法。

倒查法的查准率较高,查全率比顺查法低。

⏹抽查法——抽查法是针对课题研究所处的发展高峰阶段进行的信息检索,它往往用来解决要求快速检索的课题。

抽查法有较高的检索效率,但使用该方法的前提是必须事先了解该研究课题的历史背景。

(二)追溯法:追溯法又称引文法,主要有以下两类。

1.传统追溯法——它是利用一次信息所附的参考文献进行追溯查找的方法。

检索时可以先查找出几篇与课题有关的专著或述评(这类文献往往附有大量的参考文献,多时可达上百篇),以此作为起点进行检索。

2.引文追溯法——它是一种由远及近的检索方法,即找到一篇与课题有关的论文后进一步查找该论文被哪些文献引用过、是否有人对该领域做过进一步研究、实践结果如何、最新的进展怎样等。

由远及近地追寻,信息愈来愈新,研究也就越深入。

这种方法主要依靠专门的引文索引,如《科学引文索引》(SCI)、《社会科学引文索引》(SSCI)等。

(三)交替法1、交替法就是以追溯法和常规法交替使用来查找信息的方法,又称分段法或综合法。

2、即先利用检索工具查出一批相关信息,然后利用这些信息所附的参考文献进行追溯,扩大线索,由此获得更多信息。

交替法比前两种方法的检索效果好,是一种立体型的检索法。

3、当检索工具缺期或缺卷时,使用该方法也能连续获得所需年限以内的信息四、信息检索的程序(重点)(会用自己的语言表达)1、分析检索课题2、选择检索工具3、选择检索途径,确定检索标识4、选择检索方法5、获取原始文献(一)分析检索课题课题分析是信息检索过程中最重要的环节。

每一项检索课题都有明确的目的和具体的要求。

课题分析应从以下几方面进行。

1.分析主题内容确定文献的学科范围,其次找出课题研究需要解决的关键问题,选择恰当的主题词或关键词,这是成功检索的第一步。

2.分析时间范围分析查找年代,确定检索的时间范围,可避免浪费时间和精力。

根据课题的历史背景和检索要求,推算出所需信息最为适当的时间段。

例如,为了了解某个领域的最新研究进展,只查询近一两年的文献就可以了。

如果是专利的查新检索,回溯年限则相对要长些。

3.分析信息类型在进行信息检索时,还要进一步确定待查信息的类型。

因为不同的检索工具对不同信息的收集量不同。

如研究基础理论课题,则应侧重于检索期刊论文、专著和会议论文;如果是技术应用和开发的课题,则侧重于检索专利文献、标准文献及科技报告等。

明确信息类型,可为选择检索工具和检索手段提供依据,提高检索的针对性,否则将会降低检索效率,甚至一无所获。

(二)、选择检索工具选择检索工具的依据有以下两方面。

1.根据课题涉及的学科范围进行选择如果课题复杂,涉及的学科多,应选择综合性和专业性检索工具相结合的方法进行检索:如果课题涉及学科单一,可以以专业性检索工具为主、综合性检索工具作为补充。

如要查找关于“计算机软件”的信息,可以先利用专业性较强的《科学文摘》(SA)的C辑“计算机与控制文摘(CCA)”查找,然后再用综合性的工具《工程索引》(Ei)作为补充。

如果检索课题涉及某种特定的信息类型,则应选用收录特定信息类型的检索工具。

比如要检索专利文献,应选用<<中国专利公报》、《世界专利索引》(WPl),或者专利信息数据库等检索工具。

2.根据检索工具收录范围和编制体系进行选择不同的检索工具在收录范围、报道形式、编排体系、著录格式和索引系统等方面不尽相同,使用时可根据具体检索要求加以选择。

这里需要强调的是,对于类型相似的检索工具,应该根据收录的信息量、文摘和题录的质量、标引的质量、使用的方便程度及出版的周期等加以选择。

(三)选择检索途径,确定检索标识检索途径是检索的入口。

主要有两类:一是反映信息内容特征(主题、分类)的检索途径,二是反映信息外部特征(著者、题名、代码等)的途径。

1.选择检索途径(1)分类途径——它是按学科分类体系查找信息的途径,主要有分类目录和分类索引。

它以学科概念的上、下、左、右关系来反映事物的派生、隶属、平行、交叉的关系,能够较好地满足族性检索的要求。

(2)主题途径(3)题名途径(4)著者途径如著者索引、著者目录、全国报刊索引。

⏹缺点:无系统性和完整性。

(5)信息代码途径⏹通过已知信息的专用代码查找信息的途径。

⏹ISBN、ISSN、专利号、合同号、标准号、入藏号等。

2.确定检索标识每个检索途径对应一种检索标识。

●采用主题词做检索标识时,应考虑该词的同义词、近义词,以免漏检。

●上位类(放大)、下位类(缩小)(四)选择检索方法(五)获取原始文献1.判断信息的发表类型2.缩写语和非拉丁语系文字的音译问题3.通过其他方式获得4馆际互借、代购、向著者索取、向出版发行机构购买、联机订购、数据库全文。

●信息检索是一种逻辑思维与推理过程。

相关主题