当前位置:文档之家› 利用网络获取信息

利用网络获取信息

第三章因特网技术应用
第一节利用网络获取信息
一、因特网信息检索工具的产生背景
进入20世纪90年代,伴随着因特网的飞速发展,网上的资源呈爆炸式增长,面对因特网上无穷无尽的各种信息资源,普通用户想找到需要的资料如同大海捞针,这时,满足网络用户信息检索需求的因特网信息检索工具便产生了。

目前,在所有的因特网信息检索工具中,数量最多、应用最广的是搜索引擎。

二、搜索引擎及其类型
1.搜索引擎含义
◆狭义角度:搜索引擎(search engine)是指对因特网上的资源进行标引和检索的一类检索系统机制,由信息收集软件、索引数据库和查询接口三部分组成。

◆广义角度:搜索引擎是指因特网上的一类网站,它们能根据用户提出的各种检索要求,在万维网中主动搜索信息,并最终建立相应的索引和目录服务,提供用户需要的信息或相关链接。

2.搜索引擎类型及工作原理
搜索引擎按其检索机制主要可分为三种:全文搜索引擎、目录搜索引擎和元搜索引擎。

(1)全文搜索引擎
◆工作原理:
全文搜索引擎利用一种叫“蜘蛛”程序或“机器人”程序,在因特网中对网站进行扫描,自动提取网站的信息和网址加入到自己的数据库中,以备用户查询。

具备以下三个特征:
①有自己的数据库。

②属于自动网站检索,数据库为“蜘蛛”程序自动建立,不需要任何人工处理,
全部由程序自动完成。

③主要采用关键词索引技术。

◆含义:
全文搜索引擎是通过用户输入关键词来查找所需的信息资源。

从搜索结果来源的角度,全文搜索引擎又可细分为两种:一种拥有自己的自建数据库,另一种则租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos 引擎。

国外代表性的网站:Google、AltaVista
国内代表性网站:百度
◆优点与不足:
优点是全文检索;检索功能强;信息更新速度快。

不足之处是提供的信息虽然多而全,但提供的查询结果重复链接较多,层次结构不清晰,感觉繁多杂乱。

(2)目录搜索引擎
◆工作原理:
目录搜索引擎的信息收集系统主要是由人工完成,搜索引擎的标引专家依靠手工来搜索不断出现的新网站,给每个网站一个标题和大概的描述,将其放入相应的类目体系中,这些类目也称目录导航。

目录搜索引擎提供两种查询方式。

一种是网页上按分层目录逐级查找,直到找到所需的信息为止;另一种就是选择关键词搜索,用户直接在搜索框中输入所需信息的关键词,服务器接受命令后就会去索引数据库中查找匹配的关键词,返回查询结果。

目录搜索引擎具有以下三个特征:
①信息搜集系统主要由人工完成。

②为用户提供目录导航系统。

③有自己数据库。

◆含义:
目录搜索引擎是把搜集到的信息资源按照一定的主题进行分类,建立具有包含关系的层次目录。

用户查找信息时,只要逐层浏览打开目录,逐步细化,就可以查到要找的信息。

代表性的网站:Yahoo、搜狐、新浪、网易。

◆优点与不足:
优点是层次结构清晰,易于查找;多级类目,便于找到具体明确的主题;
分类目录下有简明扼要的内容,一目了然。

缺点是搜索范围较小;更新速度慢;查询交叉类目时容易遗漏。

(3)元搜索引擎
◆工作原理:
元搜索引擎是以一个代理的角色,提供一个统一的界面,接受用户的查询请求,然后利用其组合的多个具有独立功能的搜索引擎来执行用户的查询需求。

具有以下三个特征:
①一般没有自己的数据库和“蜘蛛”程序。

②是一个代理的角色。

③用户只需提交一次查询请求,就可以查询多个搜索引擎,检索效率高。

◆含义:
元搜索引擎也称为集成型搜索引擎,它将用户的检索请求同时送到多个引擎上进行搜索,并将结果返回给用户。

著名的元搜索引擎:MetaCrawler、Ask、Dogpile等。

三、因特网信息检索工具的使用技巧
1.正确选择因特网信息检索工具
目录搜索引擎适合未有明确的检索概念,仅对某一专题作泛泛浏览时使用。

全文搜索引擎适合用户已经明确了检索词的情况下使用。

元搜索引擎适合想要节省在多个全文搜索引擎之间进行转换的时间时使用。

2.选择合适的关键词
(1)正确使用布尔运算符
布尔运算符主要包括“与”、“或”、“非”即“AND”、“OR”、“NOT”三种形式。

利用它们把多个检索词连接起来,可以更准确地表达检索要求以优化检索结果,提高检索效率。

(2)用双引号进行精确检索
如果要查找一个特定的词组、短语或一句确定的句子,可将其加上西文输入状态下的双引号,可使检索精度提高。

(3)避免输入错别字及使用太常见的关键词
(4)尝试使用近义词
如果检索返回的结果较少,可以适当扩大检索范围,尝试使用同义词、近义词。

比如用“计算机”代替“电脑”。

3.合理利用“网页快照”、“网页预览”和“相关搜索”
当遇到检索到的网页无法打开的情况,可以使用百度、Google等搜索引擎提供的“网页快照”、“网页预览”、“相关搜索”等功能。

4.研究检索工具提供的说明,提高查询效率
百度、Yahoo!、Google等许多网络信息检索工具都提供了高级检索功能,可利用其附有的详细使用说明和检索技巧来学习如何使用高级检索功能。

四、因特网信息检索工具的发展趋势
1.出现搜索引擎技术和搜索数据库服务提供者
向其它搜索引擎提供全文网页检索服务,是搜索引擎的搜索引擎。

如国外的Inktomi,国内的百度。

2.网络搜索软件与搜索引擎的智能化
为了保证信息来源的质量,加强智能化研究是因特网信息检索工具的一种发展趋势。

3.搜索引擎的本地化和多语种检索
Yahoo!、Google等搜索引擎服务者都已经专门开发出面向不同地区、不同语种的服务项目。

“沉鱼”指
(注:素材和资料部分来自网络,供参考。

请预览后才下载,期待你的好评与关注!)。

相关主题