信息检索复习题1、信息检索的原理是什么?(1)广义信息检索原理:在存储过程中,专门负责信息检索系统和数据库建立的人从各种各样的信息资源中,收集有用的信息,对有用的信息进行主题内容的分析,找出能够全面、准确表达主题内容的概念,借助于检索语言(通常是检索词表)把分析出来的概念转换成检索系统所采用的词语,或者直接使用自然语言,再按照一定的规则和方式将这些有用的信息组织成可供件所用的数据库,并存储在一定的介质上。
(2)狭义信息检索原理:狭义信息检索的原理就是广义信息检索中信息检索过程的那部分原理。
信息检索基本原理中的核心部分就是用户所使用的检索词或者由检索词和运算符所组成的检索式与数据库中的检索词及其逻辑关系之间的比较和匹配机理。
两者相匹配的信息被检索出来(命中),不相匹配的信息被拒绝。
*2、信息检索有哪些工具?按处理信息手段分:手工检索工具、计算机检索工具。
按著录方式分:目录型(国家书目、馆藏书目、联合书目、专题书目)、题录型、文摘型(指示性、报道性、评论性)、索引型(主题索引、分类索引、著者索引)。
3、信息检索的途径和方法有哪些?(1)信息检索途径分类途径:按学科分类体系来检索文献信息。
从分类途径检索文献信息,主要是利用分类目录和分类索引。
它以知识体系为中心,比较能体现学科系统性,反映学科与事物的隶属、派生与平行关系,便于从学科所属的范围来查找文献资料,并可起到“触类旁通”的作用。
题名途径:是根据文献名称包括书名、刊名、篇名等来检索文献的途径。
一些检索系统中提供题名字顺检索途径,如书名目录、刊名目录、篇名索引等。
(2)信息检索方法追溯法:也称引文法,是利用综述或已经掌握文献所附的引文注释和参考文献目录作为线索逐一追查原文,再利用这些原文所附的参考文献目录逐一扩检,产生滚雪球效果。
直接法:又称常用法,是直接利用检索工具检索文献的方法。
它又分为顺查法(由远及近)、倒查法(由近及远)和抽查法(重点时间段进行)。
综合法:又称循环法。
即利用检索工具查到某些文献,又利用这些文献所附的参考文献追溯查找,如此循环下去,直到满足检索要求为止。
是直接法和追溯法的结合。
4、什么是信息检索语言?有哪些类型?(1)概念:检索语言是根据信息检索的需要而创制的,能够唯一地表达各种概括文献信息内容的概念,能够显示概念之间的相互关系,并便于进行系统排列,便于将标引语言和检索用语进行相符性比较的人工语言。
它是一种受控语言,依据一定的规则对自然语言进行规范,将其编制成表,供信息标引以及检索时使用。
*(2)类型:分类检索语言:依据分类法,以学科体系为基础,按类目编排的检索语言。
主题检索语言:主题语言是以语词作为概念标识,按字顺编排的检索语言。
它又包括叙词语言和关键词语言,以及较早使用的标题词语言和单元词语言。
另外,按检索词的规范化程度分为人工语言和自然语言;按组配方式分为先组式语言和后组式语言。
5、信息检索的过程是什么?(1)课题分析,明确查找目的与要求。
包括学科范围、年代范围、出版类型、语种、数量,分析检索信息的特点及检索信息内容的主题概念。
(2)选择检索工具。
手工检索要确定具体的工具书;计算机检索则要确定检索数据库。
(3)确定检索途径和方法。
以数据库检索为例:A.选择字段(题名、文摘、著者、机构等)。
B.填写检索词。
C选择逻辑算符。
D.执行检索。
E.结果显示。
有题录、题录+文摘、全文等由检索者选择。
(4)调整检索策略。
重复(3),再次检索。
(5)根据文献线索,找到原文。
全文数据库可进行存盘、打印或发电子邮件等。
6、信息检索的有关概念有哪些?①加权检索:在每个提问词后给定一个数值表示其重要程度,这个数值称为权,在检索时,先查找这些检索词在数据库记录中是否存在,然后计算存在的检索词的权值总和,权值之和达到或超过预先给定的阈值,该记录即为命中记录。
②异构检索:也称跨库检索,是一个集成的、可同时对多个数据库进行一站式检索的综合检索平台。
用户可以只通过一个检索窗口,就能对该图书馆拥有的多个数据库同时进行检索。
*③字段检索:是一种用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,提高检索效果的检索方法,它多以字段限定的方式实现,即指定检索词出现的字段,被指定的字段也称检索入口,检索时系统只对指定字段进行匹配运算,提高了效率和查准率。
④原文检索:”原文“是指数据库中的原始记录,原文检索可以说是一种不依赖词表而直接使用自由词的检索方法。
检索时,使用位置算符连接检索词,并规定运算符的级别——记录级、字段级、子字段级和位置检索。
⑤查全率:检索结果中计算机输出的相关文献数与计算机数据库中相关文献的总数之比。
⑥查准率:检索结果中,输出的相关文献数与输出的文献总数之比。
⑦误检率:是与查准率相对应的概念,也是评价检索效果的指标。
⑧漏检率:是与查全率相对应的一个概念,,是评价检索效果的指标。
7、什么是信息资源?(1)广义信息资源广义的信息资源是指信息活动中各种要素的总称,既包括信息本身,也包括与信息相关的人员、设备、技术和资金等各种因素。
(2)狭义信息资源狭义信息资源只限于信息本身不包括其他因素。
(3)图书馆学:以图书馆学的角度,信息资源的内涵和外延主要包括以下4各方面:①信息资源应当是信息的集合。
②信息资源应当是有用信息的集合。
③信息资源应是经过人类组织的、有序的、可存取的信息集合。
④信息资源应包括各种文献载体形式。
如文字、声像、数字信息(4)定义因此,信息资源应定义为:信息资源是经过人类筛选、组织、加工,并可存取和能够满足人类需求的各种信息的集合。
8、信息资源的类型及特点有哪些?(1)类型①按信息的载体和传输形式分:体载信息资源;实物信息资源;文献信息资源;网络信息资源。
②按载体形式分:印刷型;缩微型;电子型;声像型。
③按出版形式分:图书、期刊、报纸、会议文献、科技报告、学位论文、专利文献、标准文献、技术档案、产品样本。
即通常所说的“十大信息情报源”。
(2)特点①稀缺性②不可独占性③不可分性④不同一性⑤驾驭性9、解释检索信息与信息资源之间的关系。
*/**①信息资源指人类社会信息活动中积累起来的以信息为核心的各类信息活动要素(信息技术、设备、设施、信息生产者等)的集合。
信息资源是实现信息检索的对象、范围和载体。
②信息检索则是指将各种信息资源按一定方式组织、存储,并通过人为的手段和工具进行查询和调用的过程。
信息检索是实现信息资源管理和利用的有效方式。
③两者互为一个有机的整体,对信息资源的管理是信息检索要实现的目标,而信息检索则是实现信息资源管理的手段。
10、说明信息资源利用的意义。
*/**①能够满足信息用户需求;②使信息组织与评价得以充分应用;③对信息资源开发者提出新挑战。
11、评价信息资源的指标是什么?(1)可靠性——内容要求:立论科学、论据充分、数据精确、阐述完整、技术成熟、参考价值较大。
形式要求:作者、出版社资料来源等。
外界反应效果。
(2)先进性——内容有新发现、新创造等;刊物著名;时间新。
(3)适用性——符合国情;适合一定范围的读者参考等。
12、数据库的类型有哪些?(1)按存储介质分:磁带数据库、磁盘数据库、光盘数据库等。
(2)按数据存取方法分:关系型数据库、层次型数据库、网络型数据库。
(3)按数据库内容分:文献型、数据型、事实(字典)型、图像型、多媒体型。
其中文献型数据库又分为:索引型、书目型、全文型等。
13、网络信息资源的类型有哪些?(1)按网络传输协议分:wab信息资源、FTP信息资源、telnet 信息资源、用户服务组信息资源等。
(2)按出版物类型分:电子图书、电子期刊、电子报纸等。
14、中文综合数据库有哪些?利用它们能检索到哪些信息?(1)CNKI:能够查询期刊杂志、博士论文、硕士论文、会议论文、报纸、工具书、年鉴、专利、标准、国学、海外文献等多种信息资源。
(2)万方:集纳了各个学科的期刊、学位、会议、外文期刊、外文会议等类型的学术论文、法律法规、科技成果、专利、标准和地方志。
(3)维普:专注于中文科技期刊的收录与加工。
15、中文报纸有哪些数据库?(1)报刊整合数据库①全国报刊索引数据库②人大复印报刊资料数据库③华文报刊文献数据库④金报兴图报纸、期刊数据库⑤中国重要报纸全文数据库(CNKI)(2)专项报纸数据库①红色报刊档案数据库②瀚堂近代报刊③爱如生中国近代报刊库(3)各大报纸数据库①《人民日报》图文数据库②《光明日报》数据库③《经济日报》全文检索系统④《大公报:1902-1949》⑤《申报》16、检索中文图书可利用哪些数据库?①超星电子图书馆②书生之家数字图书馆③方正Apabi数字图书馆④读秀图书搜索与阅读平台⑤中国国家图书馆⑥CALIS中国高等教育文献保障系统17、外文综合数据库有哪些?利用他们能检索到什么信息?①ScienceDirect数据库:爱思唯尔(Elseiver)收录了物理学与工程、生命科学、健康科学、社会科学与人文学科四大领域的学术期刊文献(全文)。
②SpringerLink数据库:斯普林格发行电子学术期刊(全文)、电子图书、丛书、参考工具书和回溯文档等资源的检索和服务。
③ProQuest数据库:包含了经济管理商业期刊、综合期刊、回溯期刊、医学与健康期刊、历史研究期刊、文学与语言学期刊、新闻与报纸、科技期刊、艺术研究期刊等文献文摘检索平台和服务。
(原剑桥科学文摘CSA数据库并入ProQuest数据库)④Ei Compendex数据库:收录了在工程技术领域具有学术价值的非纯理论期刊论文的文摘。
⑤SCI数据库:收录了覆盖科学与技术(偏侧重基础科学)的图书、期刊论文、会议论文和其他各类型的文献。
⑥Scopus数据库:涵盖了生命科学、自然科学、医学和社会科学四个领域的期刊、会议记录和商业出版物等文摘和索引,是全球最大的文摘和引文数据库。
18、外文学科数据库有哪些?(1)数理科学类①SPIE数据库的检索②AIP/APS数据库检索(2)地质与矿业工程类①GSW数据库检索②SPE数据库检索(3)冶金与材料工程类①Maney数据库检索(4)机械与仪器仪表类①ASME数据库检索②SAE数据库检索(5)动力与核能工程类①ANS数据库检索(6)电气电子与信息工程类①IEL数据库检索②INSPEC数据库检索(7)化学工程类①ACS数据库检索(8)轻工纺织与食品工程类①TTI数据库检索②FSTA数据库检索(9)土木建筑与水利工程类①ASCE数据库检索②IWA数据库检索(10)管理工程类①Emerld数据库检索②ABI/INFORM数据库检索19、检索外国的标准、专利、学位论文、技术报告有那些数据库可利用?(1)专利文献检索①DII数据库检索②WIPO数据库检索(2)科技报告检索①NTIS数据库检索②STINET数据库检索③DOE information Bridge数据库检索④NTRS数据库检索(3)会议文献检索①ISTP数据库检索(4)学位论文检索①PQDT数据库检索②NDLTD数据库检索(5)标准文献检索①NSSN数据库检索②ISO标准检索③IEC标准检索④ITU标准检索20、系统相关性的评价因素有哪些?*(1)信息源的领域覆盖范围;(2)信息组织的结构化程度;(3)信息检索语言的规范性;(4)索引方法和工具的选择;(5)检索结果的匹配程度;(6)系统数据库存储的覆盖率;???(7)系统查询方式/检索界面:快速检索、专家检索、高级检索;???(8)系统检索形式和语义的相关。