当前位置:
文档之家› 国内外网络信息检索实验报告---人物搜索
国内外网络信息检索实验报告---人物搜索
检索模式
普通模式
高级检索
普通模式检索结果
1
2
3
Web格式:6,370,000
Image格式:757,000
Video格式:8条记录
高级检索
设置高级检索条件: 全部包含、精确检索、 至少包含、布尔检索
设置语言
选择检索结果的文件格式和日期
页面权限选项:无权限、免费共享、 可以修改等其他各种选择
检索实例(一)
LOGO
②、不同点:
专业人物搜索引擎微软人 立方不支持高级检索,只 能使用自然语言进行检索, 在搜索框内不能输入各种 逻辑运算符。而作为综合 性搜索引擎的AltaVista、 AOL提供高级检索功能, 不仅可以在其高级检索页 面逐项设置检索条件,还 可以在其检索框内任意输 入带有逻辑运算符、截词 符、字段限制等的检索式。
①、在人立方搜索中,检索结果出现明显的错误。 例如,在人立方搜索中, 可以以互联网上众多的信息为搜索对象, 其中必然包含一些不准确的、虚假的信息。
②、重名现象影响检索结果。 三个搜索引擎对于重名现象, 系统只能识别出最具影响力的人, 检索结果可能不满足检索需求。
③、外国人的名字在翻译成中文的问题。 非中文的名字在译为中文时,存在难以避免 的差异。如在人立方搜索的关系图中“比尔”、 “盖茨”与“比尔·盖茨”被认为是三个人。
1.关键词:林丹 精确检索:苏迪曼杯,共计1,630,000条检索结果
2.林丹和李宗伟去年在奥运会之外的比赛,简体中文显示有15条检索结果
检索实例(二)
3.近似检索:关键词:林丹 共计307,000条检索结果 4.近似检索中,如果设定的时间为一天内,那么有8条检索结果 5.链接 搜索过去24小时内关于林丹的链接,共112条检索结果 6.关键词:林丹 英文检索结果,共计449,00页均未显示“高级搜索”选项, 都是在普通检索模式的结果页面 再出现高级检索设置,并且三者 高级检索条件大致相同,“与”、 “或”、“非”,语言选择、每 页结果显示条数等。可以再在高 级检索界面设置,也可以在检索 框内输入检索式。
5
5、OL的1,550,000记录,而 AltaVista检索出15,500,000条记 录。但是如果输入“Lin Dan”, 那么结果会大相径庭。这种情况 下,AOL、Alta 词,此时若不改变为简体中 文结果有865,000条,远远少于 “林丹”作为检索词的结果数目。
①、相同点:
人立方、 AltaVista、AOL 三个搜索引擎都 可以进行基于自 然语言的简单检 索,直接在检索 框内输入检索词, 即可进行检索。
检 索 Text 技 Text 术 Text
②、不同点:
人立方没有设置“高 级检索”,不支持布 尔检索、截词检索、 邻近检索的功能。 AltaVista、AOL支持 布尔检索、截词检索、 字段限制检索、邻近 检索等,可以使用各 种逻辑运算符、多层 括号设置优先级。对 检索要求进行明确的 控制。
检索。
高级搜索
高级搜索提供 用户以日期、 布尔逻辑和近 似条件搜索。 ANDNOT、 NEAR、()
主题搜索
主题包括图象 (Images)、 MP3/Audio & Video等。主页显 示LookSmart 的 索引目录并提供 LookSmart注册。
常规检索
(1)、自然语言搜索。在简单搜索框中输入要搜 索的人名 shakespeare
能代替数字。
但输入人名进行截词检索时,
所得检索结果却大大减少。
说明Altavista不适用于截词 检索进行人名搜索。
高级检索
高级检索包含了简单检索的所有特性,是一种结 构式的操作和公式表达的方式,与简单检索最大的区 别是支持布尔检索,使用逻辑运算符AND、OR、 NEAR 和ANDNOT以及(),也可以使用符号&、|、 ~代替单词。
检索实例(三)
在AOL检索框内输入英文“lin dan”,共有6,060,000条结果
三、国内外搜索引擎的比较
❖ 通过这次网络信息检索实验,进一步了解了搜索引擎的检 索规则,体验了关于人物搜索的过程,使用了中英文三种 搜索引擎,有外文的综合性搜索引擎AltaVista、AOL, 还有中文专业搜索引擎微软人立方。在实验之后,我们总 结了使用心得,交流了对各自所用搜索引擎的评价,并进 行了中英文搜索引擎的对比,结合人物搜索这一主题,描 述了每个搜索引擎的特点,针对搜索结果分析搜索引擎的 不足之处。
(2)、加减号检索(限定检索)
在关键词前添加减号表示必须/不能出现此关键字, 需要注意的是,加减号与后面的关键词间不能留空格。
出现了 shakespeare 和 romeo and Juliet, 并没 有出现hamlet
(3)截词检索
Altavista 支持截词检索,但通配符*只能在末尾
而不能在中间和开始,且*最多只能代替5个字母。不
(一)、专业与综合的比较
❖ 主要比较专业性搜索引擎和综合性搜索引擎,针对我 们所使用的人立方、AltaVista、AOL三种搜索引擎, 因为AltaVista、AOL均为外文综合性搜索引擎,所 以归结为一种,把两个合二为一与人立方进行比较。
1、检索模式
2、检索技术
3、检索结果
1、检索模式
①、相同点: 人立方、AltaVista、 AOL三个搜索引擎界面 简洁大方,提供一个检 索框和检索按钮,全部 支持普通模式的简单检 索,受众范围大,不需 要用户有任何专业检索 背景。
二、搜索引擎介绍及搜索过程介绍
和
1. 微软人立方(中)
2. Alta Vista (英)
3. AOL (美国在线服务) (英)
人立方检索框只接受名词和词组检索,其他检索方式 如截词检索和布尔检索等都不能使用
输入关键词进行搜索,会返回一张五 颜六色的人物关系图,各人物以不同 颜色的圆圈显示并以直线连接起来。
LOGO
人物搜索
小组:*****组 班级:信息管理与信息系统 姓名:*****、*****、****** 学号:********、*********、********
一、概述
随着信息的海量增长,信息检索的重要性与 日俱增,人物检索的意义日益凸显。通过这次网 络信息检索实验,进一步了解人物检索的过程, 使用微软人立方、Alta Vista、AOL三种搜索引 擎,对比中外人物搜索引擎,说明各自的特点, 以及体验之后的感受、对搜索引擎的评价。
(四)、总体评价
❖ 每个搜索引擎都有其明显的特色,比如人立方的六度 搜索、Alta Vista的翻译功能、AOL的地方搜索。对 于检索效果而言,两个外文搜索引擎AOL、Alta Vista更胜一筹,支持多语种检索,检全率、检准率 都要相对高一些,数据来源相当广泛。但如果针对特 定的人物关系进行搜索,人立方才是第一选择,详细 的展示该人的身份以及相关关系,允许用户编辑词条, 增强互动性。
涉及范围
显示格式
检索界面
Al索
1
1、检索界面 AltaVista与相同, 首页简洁清晰,都是简单 的检索框外加检索按钮, 不同的检索分类条目置于 检索框之上,便于用户设 置检索结果的类别。而 AOL搜索引擎的首页更 倾向于web形式,检索框 的下面,展示主要的类目, 比如和门户网站新浪就很 类似。对于没有专业检索 背景的用户来说,不会增 加任何的难度,输入自然 语言即可进行搜索。
2
2、涉及范围 AltaVista、AOL、百 度的搜索范围都相当广 泛,涉及不同方面的内 容,比如经济、体育、 军事、教育、购物、娱 乐等,检索速度都很快, 呈现出海量的检索结果, 提供了链接供用户选择。
3Байду номын сангаас
3-显示格式 AOL提供了web、image 、video等格式,在检索 首页输入检索词之后,默 认检索结果为web格式, 点击检索结果页面左侧即 可转换不同的显示格式。 AltaVista有Web、 images、video、new,比如MP3、图 片、视频等,当然在结果 页面也可以转换。
布尔检索
在检索框中分别输入William、Shakespeare,并使 用布尔检索技术,试图查找英国文人 William Shakespeare .
邻近检索
❖ Altavista,也可以进行邻近检索,可以使用ONEAR、 NEAR/n等 以及()的使用。
(三) AOL(美国在线)搜索引擎
网络信息检索过程
人立方关系百科
人立方关系 百科是人名、 机构名、网 页、地点及 他们之间相 互关系的知 识大百科
通过人立方关 系百科搜索人 名,例如“张 伟”,可以进 入“张伟的同 名人俱乐部”, 在这里能找到 所有叫张伟的 人的词条和信 息。
六度搜索
人立方关系百科能够建立准确的人物词条关系,因此,在 关系百科的关系结构上所建立的六度搜索将是精准的人立方百 科六度搜索结果。只需要选中列出的百科词条即可得到百科六 度搜索结果:你须要在左右两端都选择百科词条才能够触发搜 索。
LOGO
Altavista是全球最知名的网上搜寻引擎之 一,提供搜寻引擎后台技术支持。以网页全 文检索为主、同时提供分类目录和20余种语 言的查询服务,使用专门的语言识别技术的 搜索引擎。内容极其丰富,真正可以称上海 量信息检索。
检索服务
常规搜索
常规检索,又 称为简单检索 支持自然语言 检索、截词检 索,字段限制
3、检索结果
人立方、AOL、 AltaVista三个搜索 引擎都可以满足一般 性检索需求,大多数 检索结果都是相对正 确的,但是其中也不 乏错误的信息。
(二)、国内外综合搜索引擎对比
结合A于人物搜索这一主题 存在的联系。