当前位置:文档之家› 信息检索复习资料

信息检索复习资料

信息检索公选课复习资料1.信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。

2.知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。

3.情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。

4.文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。

5.会议文献是指在国内外学术或非学术会议上发表的论文或报告。

6.学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。

7.著录是对文献内容和形式特征进行选择和记录的过程。

8.数据检索是指特定的数值型数据为对象的检索。

9.按信息的加工层次分类:(含义)一次文献:原始文献,图书、报纸、期刊、会议纪录、专利报告等二次文献:目录、题录、索引、文摘三次文献:论文丛集、综述、年鉴百科全书一次信息资源 (原始文献):以作者本人在生产和科研中所取得的成果为依据而创作的原始文献所传递的信息资源。

二次信息资源(检索工具):将分散的、无组织的一次信息资源,按一定的原则加工、整理、简化、组织成为系统的、便于查找利用的信息资源。

三次信息资源(参考性文献):在合理利用二次信息资源的基础上,选用一次信息资源的内容,根据一定的需要、目的进行分析、综合或浓缩重组而得到的信息。

二次信息资源与三次信息资源的区别:对象不同:二次信息资源以“篇”或“本”为单位进行加工;三次信息资源则归纳了较多的一次信息内容用途不同:二次信息资源为检索一次信息的工具;三次信息资源能直接提供检索答案.10. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。

11. 文献检索方法:指文献信息资源的一般检索方法,也是利用各种检索工具检索文献信息资料的最常用的方法。

常用:顺查法、倒查法、抽查法(适用特点、优缺点)顺查法从研究课题所需的起始年代作为起点,由远及近查,用于了解某一事物发展的全过程。

优点:系统、全面查全率高。

缺点:费时费力,工作量较大。

适合于复杂的大课题进行全面检索倒查法在出版发行时间上由近及远查,重点为近期,在基本上获得所需信息时即可终止检索。

优点:可保证情报的新颖性缺点:因漏检而影响查全率多用于查找新课题或有新内容的老课题抽查法(了解)专门查找某一段时间的文献。

这是利用学科发展一般是波浪式的特点查找文献的一种方法。

当学科处于兴旺发展时期,科技成果和发表的文献一般也很多。

因此,只要针对发展高峰进行抽查,就能查获较多的文献资料。

追溯法,也称追踪法、扩展法,是以文献末尾所附参考文献为线索进行追溯查询相关原始文献的方法。

综合法,又叫循环法或交替法,是把上述两种方法综合在一起或交替运用的检索方法。

12. 文献检索的途径:外部特征途径:题名途径、著者途径、序号途径、出版发行者途径。

内容特征途径:分类途径、主题途径其他途径1、题名途径,是以文献的名称为线索进行检索的途径,以文献名称(书名、刊名、篇名等)进行迅速查询。

2、著者途径,是以文献责任者名称为检索词进行文献信息检索的途径。

责任者包括作者、译者、编者、注释者、文献发布者及专利发明人等。

3、文献序号途径,是以文献的编号为特征进行文献信息检索的途径。

文献序号种类很多,有专利号、标准号、报告号、入藏号、合同号、国际标准书号和国际标准连续出版物号等13. 搜索引擎中,在普通查询词前面加一个filetype表示对文档类型限定。

或例如:访问百度文档的地址也可以达到此效果,它的网址是:/14.搜索引擎:是一种能够通过互联网接受用户查询信息指令,向用户提供符合查询要求的信息资源网址的网络信息搜索系统,是建立在传统数据库检索技术的基础上,增加了自动搜索和自动更新数据库信息的功能,并采用人工智能方法对检索结果进行区分和排序。

其搜索系统基本上是自动的,利用网页搜索软件如网络机器人、网络蜘蛛、网络流浪等的自动搜索程序,主动在网页上按某种策略进行远程数据搜索和获取,并生成数据库索引。

15.检全率=检出相关信息资源量÷系统相关信息资源总量×100%检全率反映的是检索系统检出相关信息资源的能力检准率=检出相关信息资源量÷检出信息总量×100%检准率是反映检索系统排除与检索提问物管信息资源的能力。

一般说,提高检索效果的措施有两项:一是选择质量较高的检索系统;二是提高检索者的检索水平。

查全率高时,查准率低;查准率高时,查全率低。

16. CNKI数据库下载的全文格式很多,如:caj,pdf,nh,caa,kdh需要下载安装CAJViewer 全文浏览器软件或Vip全文浏览器软件才能阅读这些资源。

17.维普资讯网的高级检索中,查询语句“K=(CAD+CAM)*R=机械”表示的意思是查找文献或文摘中含有“机械”,并且关键词中含有CAD或CAM的文献或文摘18.OPAC中文或者英文的解释是联机图书馆公共检索目录19.国内提供电子图书服务的网络站点很多,常用的有书生之家数字图书馆、方正Apabi 数字图书馆、中国数字图书馆等。

20. 信息检索的基本原理是:通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。

其中存储是为了检索,而检索又必须先进行存储。

21.检索语言是用来描述文献内容特征、外表特征和表达情报提问的一种人工语言。

检索语言的种类很多,按其构成原理一般可分为分类语言(又称分类法)、主题语言、代码语言和引文语言四种。

其中,分类语言又有体系分类语言、组配分类语言和混合分类语言的区别。

主题语言又有标题词语言、单元词语言、叙词语言和关键词语言的区别。

按其包括的学科范围,检索语言又可分为综合性语言和专业性语言。

按其标识的使用方法,还可以分为先组式检索语言(文献标识在编表时就固定组配好)和后组式检索语言(文献在检索时才组配起来)。

22. 在检索文献信息时,要根据具体要求来选择不同的检索方法,以达到省时省力和查全的目的。

主要的检索方法有一下几种:直接查找法、间接查找法、引文追溯法和综合法。

23. 进行信息检索,无论是用手工检索方法还是用计算机检索方法,其检索程序都是一样的,一般来说都有以下几个基本程序:分析课题、制定检索策略,选择检索工具,确定检索途径,选择检索方法,编写检索式、提交检索式,索取原始文献。

以上六个步骤只是检索文献的一般程序,并非每个检索课题都要经过以上几个步骤,有的由于对检索课题和所需检索工具比较熟悉,则可跨越几个步骤,直接从有关书刊中获取文献。

24. 目前可供人们使用的检索工具有很多,不同的检索工具各有特点,可以满足不同的信息检索的需求。

检索工具有不同的分类方法:按加工文献和处理信息的手段不同可分为:手工检索工具和机械检索工具。

按照载体形式不同可分为:书本式检索工具,磁带式检索工具,卡片式、缩微式、胶卷式检索工具。

按照著录格式的不同可将检索工具分为以下四种类型:目录型检索工具,题录型检索工具,文献型检索工具,索引型检索工具。

25. 检索工具的基本功能是存贮和检索文献,主要体现在四个方面:一是根据学科和主题集中文献。

避免了直接检索的分散性、盲目性和偶然性,从而提高了文献的查全率和查准率。

二是缩短了检索过程,节省了查找时间。

检索者不必去阅读大量分散的原始文献,只需反映原文状况的具体著录事项,因而提高了检索速度和效率。

三是便于按分类或主题等不同的检索途径,灵活地从多个角度进行检索。

四是有助于消除语言文字障碍。

26. 提高检索效果的措施和主要方法(1)提高检索系统的质量。

包括数据库收录文献内容的范围不但要广泛,而且要切合课题检索的要求;著录的内容详细、准确,辅助索引完备;具有良好的索引语言的专指性与网罗性及其标引质量等。

(2)提高用户利用检索系统的能力。

使之具备一定的检索语言知识,能选取正确的检索词,并能合理使用逻辑组配符号完整地表达文献需求的主题,制定优化检索策略;能灵活运用各种检索方法和检索途径等,使检索工具最大限度地发挥作用。

准确比如,全面准确地表达检索要求,合理使用文献检索点。

根据不同检索课题的需要,适当调整对查全率和查淮率的要求。

27. 提高查准率提高查准率时,调整检索式的主要方法有:①提高检索词的专指度,增加或采用下位词和专指性较强的检索词。

②增加AND组配,用AND连接一些进—步限定主题概念的相关检索项。

③减少OR组配。

④用逻辑非NOT来排除一些无关的检索项。

⑤加权检索。

⑥利用文献的外表特征进行限制,如限制文献类型、出版年代、语种、作者等。

⑦限制检索词出现的可检字段,如限定在篇名字段和叙词字段中进行检索。

⑧使用位置算符进行限制。

28. 搜索引擎的概念:泛指网络上以一定的策略搜集信息,对信息进行组织和处理,并为用户提供信息检索服务的工具和系统,是网络资源检索工具的总称。

29. 搜索引擎的类型。

①目录型搜索引擎:也称为分类索引或网络资源指南,是一种网站级的浏览式搜索引擎。

分类目录是通过人工的方式收集整理网站资料形成数据库的,比如Yahoo!分类目录以及国内的搜狐、新浪、网易分类目录。

②索引型搜索引擎:基于关键词检索。

索引型(全文)搜索引擎的数据库是依靠一个叫“网络机器人”或叫“网络蜘蛛”的软件,通过网络上的各种链接自动获取大量网页信息内容,并按以定的规则分析整理形成的。

Google、百度都是比较典型的索引型搜索引擎系统。

③元搜索引擎。

元搜索引擎一般都没有自己网络机器人及数据库,它们的搜索结果是通过调用、控制和优化其它多个独立搜索引擎的搜索结果并以统一的格式在同一界面集中显示。

如:Ixquick、Dogpile、Vivisimo、WebCrawler和万纬搜索等。

30.搜索引擎的工作原理。

①从互联网上抓取网页(手机网络资源)②建立索引数据库→③在索引数据库中搜索排序→④由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。

31. 专利文献是一种用法律形式来保护的文献,专利文献主要由专利说明书构成。

专利说明书是公开的文献,但只能由各国专利局发行,它反映了当前最新的技术成果。

专利说明书对于工程技术人员,特别是产品工艺设计人员来说,是一种重要情报源。

申请专利三个条件:新颖性、创造性和实用性中国专利类型:发明专利、实用新型专利、外观设计专利32. 科技报告:是指国家政府部门或科研生产单位关于某项研究成果的总结报告,或是研究过程中的阶段进展报告。

与期刊相比:在内容方面,报告比期刊论文技术含量高、时效性好、便于交流。

相关主题