当前位置:文档之家› 武汉大学信息管理学院2001-2002学年度第一学期《信息检索》期末考试卷

武汉大学信息管理学院2001-2002学年度第一学期《信息检索》期末考试卷

2008-2009学年度第二学期《信息检索》考试试卷(B)答案
一.名词解释(5 x 4=20分)
1.截词检索:是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。

检索中,计算机会将所有含有相同部分标识的记录全部检索出来。

截词符用“?”或“*”表示。

2.信息检索:信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。

3.查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。

4.查全率:是指检出的文献数量占数据库中全部相关文献数量的比例。

5.引文索引:是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。

二.简答(5x 6=30分)
1.查找国内外学位与会议论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。

学位论文索引与摘要,如:CALIS《学位论文库》(http://162.105.138.230/opac/treatise),万方数据资源系统《中国学位论文数据库》(),PQDD (/dev/dissertations)
会议论文索引与摘要,如:CALIS 会议论文数据库(http://162.105.138.230/opac/meeting),万方数据资源系统《中国学术会议论文数据库》(),OCLC 会议数据库(/login )——《在会议上提交的文章索引》(PapersFirst),《会议出版物索引》(Proceedings),科学网会议录索引(Web of Science Proceedings,)
2.布尔逻辑检索的主要运算符有哪些?它们各代表什么含义?请分别举一例说明。

布尔逻辑检索的主要运算符有“AND”、“NOT”、“OR”,它们分别代表逻辑与、或和非,如:美国AND 社会保障,数字图书馆OR 虚拟图书馆,玉米NOT 甜玉米
3.搜索引擎有哪些类型?
按照信息组织方式分:有网络资源指南与关键词搜索引擎;按学科范围与资源种类分,有综合性搜索引擎和专门性搜索引擎;按照功能分,有独立搜索引擎和元搜索引擎
4.
5.电子图书有哪些特点?
容量大,节省空间,环保,功能多
6.网络信息选择的标准有哪些?
权威性、内容、时效性、网页设计、适用性、用户对象、访问次数或被链接次数
三.选择填空(5 x 5=25分)
此题为多项选择题,选错者不倒扣分,但所选答案不得多于5个。

1.c d e h i
2.a c d e h
3.a c d f h
4.b d e f g
5.a b g i j
四.论述题(1X25=25分)
通过检索实践,你认为网络信息检索中的主要问题有哪些(10分)?应掌握哪些技巧与注意事项(15分)?该题鼓励同学们在课本有关内容基础上进一步发挥。

“网络信息检索中的主要问题”部分考察学生发现问题的能力,鼓励个人发挥,若只答
课本上的信息污染、信息安全、黑客攻击等,只能得5分。

自己发挥部分视回答内容针对性和特色加1-5分。

技巧与注意事项部分考察学生总结与归纳以及解决问题的能力,鼓励个人发挥,若只答课本上的有关部分(见下面),只能得8分。

发挥部分视对策的可操作性、科学性加1-7分。

Internet 检索技巧
1.分析检索的主题
即要确切了解所要查询的目的和要求,确定需要的信息类型(全文、摘要、名录型等;文本、图象、声音)、查询方式(浏览、分类检索、关键词检索)、查询范围(所有网页、标题、新闻组文章、FTP、软件;中文、外文)、查询时间(所有年份、最近几年、最近几周、最近几天、当天)等。

2.选择合适的检索工具
各种搜索引擎在查询范围、检索功能等方面各有千秋,不同目的的检索应选择不同的搜索引擎。

选择合适的检索工具主要从工具的类型、收录范围、检索问题的类型、检索具体要求等方面综合考虑。

一般来讲,如果用户希望获得关于某个问题的广泛性信息,那么最好使用象YAHOO这样的目录式搜索引擎,而要获得关于该问题的细节性信息,则要利用象Alta Vista这样的关键词检索工具。

下表列出了不同检索目的下搜索引擎的最佳选择:如:查找广泛、综合性信息:雅虎中国,搜狐,Yahoo, Infoseek, Lycos,全文检索(交叉学科问题):Excite, Opentext,Altavista。

对搜索引擎的了解与选择,可以借助于搜索引擎的集合与评价站点,如搜索引擎大全(/home/chinese-search/)。

在进入新的检索前,应花点时间了解如何使用这种检索工具,尤其要注意了解该系统所特有的检索方式,它所允许的检索功能(布尔逻辑检索、字段限制检索、截词检索、短语检索等)同时还应了解检索结果有几种表达方式,所使用的搜索引擎的缺省语法。

不同的引擎缺省的运算符不同,如LYCOS 为“OR”,有的引擎不支持某些运算符,如YAHOO,LYCOS不支持NOT。

许多搜索引擎使用各自的标准去排列检索结果,这些标准包括:题目、URL、HTML、META tag等。

3 抽取适当的关键词。

应尽量选专指词、特定概念或专业术语,避免普通词和太泛的词,如计算机、互联网、中国、世界等,太多太泛,失去了检索价值,会反馈数以万计的检索结果,失去检索意义,被称为“禁用词”。

现对关键词的选择提出以下建议:
(1)使用名词或物体做关键词
(2)检索式中使用2——3个关键词
(3)使用截词检索(可检索出词根相同的词或同一词的单复数形式),如,film*
(4)通过OR连接同义词、近义词、相关词或术语的不同表达方式,如,Internet OR Web OR www OR (the net)
(5)对专有名词,如人名、地名、机构名,使用大写字母指定检索, 如,United States
(6)对固定短语,用“”括起进行短语检索,如“World Wide Web ”,以提高检索的精度
(7)用括号将各个概念分开,如(Internet OR Web )AND (search* OR retriev*)
4正确构造检索式
利用搜索工具支持的检索运算(几乎网上一流的搜索引擎都支持布尔逻辑检索)、允许使用的检索标识、各种限定,这是进行有效检索的基础。

许多搜索引擎都提供简单查询和高级查询,建议使用后者,如组合使用布尔逻辑运算符AND(+)、NOT(—)、双引号、使用日期与语种限定,可使检索结果控制在一定范围内。

OR 可能是用处最小的,因为它检索出的信息太多,有许多网上服务器甚至不对带有这种运算符的请求进行加工,但当我们的检索术语有两种或两种以上的表达方式时,一般可用OR。

充分利用进阶检索,即某些工具提供的Refine, Search within these results, 等功能,在前一次检索产生的结果基础上做进一步的检索,如,可在“Refine”检索框内继续增补检索词或修改检索式,使检索范围缩小。

5 及时调整检索策略
(1)扩大检索范围。

当检索结果为零或检索结果太少,需要扩大检索范围。

使用同义词、近义词或相关词,或逐渐减少最不重要的概念词,或使用较普遍的词,或改用上位词;使用缩写与全称;使用截断技术;利用某些搜索引擎的自动扩检功能进行相关检索;使用多个搜索引擎;或者直接利用多元搜索引擎。

(2)缩小检索范围。

检索时,如果得到太多的检索结果,或检索结果不相关,需要缩小检索范围。

使用逻辑“与”;使用逻辑“非”;位置算符;固定词组检索(短语检索);限制查询范围。

6 加快检索速度,节省检索时间与费用
(1)直接进入相关站点。

不一定每次都从搜索引擎入手,可以利用平时积累的有用的网址,这就需要
我们注意搜集常用的网址,或利用浏览器的“书签”功能,将经常访问的网站加入“收藏夹”对其进行保存,再次使用时,直接点击便可进入,省去大量输入网址和利用工具搜索的时间。

另外,还可以利用网上书签。

相关主题