当前位置:文档之家› 第4章网络信息资源检索精品PPT课件

第4章网络信息资源检索精品PPT课件

(4)inurl:限制你搜索的关键词出现在网 页的url中。
• 例:搜索网页url中含有“mp3”的网页,输入: “inurl:mp3”。
(5)link:可以得到一个所有包含了某个指 定URL的页面列表.
• 例如:link: 就可以得到所有连接到Google的 页面。
12
单击中文主页,单击 in English链接进入英文界面。英文界面还有 更多功能:
第4章 网络信息资源检索
4.1 概述 4.2 网络检索工具—搜索引擎 4.3 综合性搜索引擎 4.4 专业性搜索引擎 4.5 特色搜索引擎
1
4.1.1 网络信息资源的定义、特点
定义:
• 从字面上理解,网络信息资源是指“通过计算 机网络可以利用的各种信息资源的总和”。具 体的说是指所有以电子数据的形式把文字、图 像、声音、动画等多种形式的信息存贮在光、 磁等非纸介质的载体中,并通过网络通信、计 算机或终端等方式再现出来的资源 。
(5)信息分散、无序。互联网是一个基于TCP/IP协议的联结各国、各 机构数以万计的计算机网络的通信网,对网络信息资源本身的组织管 理无统一标准和规范,网络信息分散于不同国家、不同地区服务器上, 采用不同的操作系统及数据结构,字符界面、图形界面、菜单方式、 超文本方式等,缺乏集中统一的管理机制。
3
4.1.2 网络信息资源的类型
• 例2:搜索包含“网络安全”方面的powerpointer文 件。输入:网络安全。
• 例3:搜索包含“搜索引擎”方面的pdf文件。输入: 搜索引擎。
11
(3)intitile:限制你搜索的关键词出现在 网页标题中。
• 例:搜索网页标题中含有“信息检索”的网页, 输入:“intitile:信息特点:
(1)数量庞大,增长迅速。最大的搜索引擎Google已收录200亿网页, 且每年以级数的速度在增长。据预测,式多样。通过因特网可以获取学习、娱乐、工作、生 活、购物等各方面的信息。另外,资源有有文本、视频、音频、动画 多种表现形式。
13
Google的免费软件:
桌面搜索:只有1.7MB。 Google 工具栏 Picasa 图片管理软件 Google talk:即时通讯软件。 Google Earth:基于卫星图片的地图软件。 Google SketchUp:3D作图软件。 Google Pack:Google发布的免费软件包。
• Blog Search:博客搜索,已支持中文检索。 • Book Search:Google的图书搜索。 • Froogle:Google的商品购物搜索引擎。 • Google Finance:财经搜索。 • Google Maps:Google的图书搜索。 • Google Video:Google的视频搜索。
2006年4月12日Google公司宣布Google 的全球中文名称正式取名为“谷歌”。
(屏蔽了一些网站)
10
网页搜索:支持以下几个高级命令检索:
(1) “site”表示搜索结果局限于某个具体网站 或者网站频道。
(2):搜索特定类型的文件。格式:“关键词 文件的扩展名”。
• 例1:搜索包含“电子商务”关键词的word文件。输 入:电子商务 。
• 从互联网上抓取网页 • 建立索引数据库 • 在索引数据库中搜索排序。
7
4.2.3 搜索引擎类型
按照信息搜集方法和服务提供方式的不同, 搜索引擎系统可以分为三大类:
• (1)目录式搜索引擎: • (2)全文搜索引擎: • (3)元搜索引擎:
超搜索---:网页数据库式分为:HTML、TXT、DOC 、PDF、 RM、 MP3……。
5
4.1.3 网络信息检索的一般方法
1.网上浏览
• (1)偶然发现。 • (2)顺“链”而行。
2.网络资源指南(目录型检索工具) 3.搜索引擎 4.图书馆网站的网络导航
6
4.2 网络检索工具—搜索引擎
4.2.1 搜索引擎概念 4.2.2 搜索引擎基本原理 搜索引擎的原理,可以看作三步:
(3)变化频繁,价值不一。比较大的网站的一般信息一般每天更新一次, 特别是新闻信息实时更新,大网站的内容更新快且真实可靠,小网站 或个人网站虽不乏优秀和可参考的信息,但质量良莠不齐。
(4)结构复杂,分布广泛。网络信息主要采取万维网网页形式—超链接 结构,但网上还有大量的FTP文件,论坛信息,新闻组信息,不同的 信息结构需要不同的检索工具。
8
4.3 综合性搜索引擎
4.3.4 搜狐搜狗的使用
9
4.3.1 Google的使用
两位斯坦福大学的博士生 Larry Page 和 Sergey Brin 在 1998 年创立了 Google。 Google是目前因特网上最大的搜索引擎
4
• 若按组织形式分,可将网络信息资源分为以下 三种类型:文件型、数据库型、超媒体型。
• 按时效性分,可将网络信息资源分为动态信息、 电子报纸、电子期刊、电子图书、联机馆藏目 录、联机数据库等。
• 按信息的媒体形式分为:文本信息、超文本信 息、多媒体信息。
• 按网络信息服务方式分为:网站信息、新闻组 信息、论坛信息、文件服务信息。
按人类信息交流的方式分类:
• 非正式出版信息。如电子邮件、电子会议、专题组和论坛、电子 公告板新闻等。
• 正式出版物。即用户可以查询到的各种数据库、联机杂志、电子 版工具书、报纸、专利信息等。
从网络信息检索角度,按信息查询方式对网络信息进行分 类:
• (1) 互联网(WWW)信息。 • (2) FTP信息。 • (3) Telnet信息。 • (4) USENET/Newsgroup信息资源。 • (5) USTSERV/Mailing List 信息。 • (6) Gopher信息。
相关主题