当前位置:文档之家› 第二章 网络信息资源检索

第二章 网络信息资源检索


(3)网络信息资源按网络传输协议可划分为www、 Telnet、FTP、用户服务组、Gopher等信息资源。 ● www信息资源:是建立在超文本、超媒体技术以 及超文本传输协议的基础上,集文本、图形、图像、 声音为一体,并以直观的图形用户截面展现和提供信 息的网络资源形式。
● Telnet信息资源:指借助远程登录,在网络通信 协议(Telecom-munication Network Protocol)的 支持下,可以访问共享的远程计算机中的资源。
2、网络信息资源检索的特点 (1)信息检索空间的拓宽 (2)交互式作业方式 (3)用户界面友好且操作方便

3、网络信息资源检索工具 网络信息检索工具的类型: WEB资源检索工具、非 WEB资源检索工具。 其中WEB资源检索工具还可以分为: ①目录型网络检索工具 ②搜索引擎 ③多元搜索引擎

第3节

常见的目录型检索工具
1、概述 目录型网络检索工具,也称网络目录索引,顾名 思义就是将网站分门别类地存放在相应的目录中。
●工作原理:依靠专职编辑人员建,完全依赖手工操 作。用户(指网络上的各个网站的站长们)提交网站 后,目录编辑人员会亲自浏览所提交的网站,然后根 据一套自定的评判标准甚至编辑人员的主观印象,决 定是否接纳该网站,然后形成信息摘要,并将该站点 的信息放在相应的类别和目录中。所有这些收录的站 点同样被存放在一个“索引数据库”中。
雅虎口碑网是雅虎中国的一个特色产品。以全 网搜索为基础而打造出来的一个生活服务平台。雅虎 口碑网提供的检索为区域性的检索,它能对用户的 IP地址进行分析,确认用户所在地,并返回页面。 若用户想了解其他地方的资讯,可以点击页面左上角 的“切换城市”。 雅虎口碑网提供了分类极为细致的目录索引服 务,也提供了简单的搜索引擎服务。
●目录型网络检索工具所采用的分类法主要有:主 题分类法、学科分类法和图书分类法等。 ●优点:信息准确、导航质量高,分类浏览方式直 观易用 ●缺点:其数据库的规模相对较小,在某些主题下 收录范围不够全面,使检索到的信息数量有限;其更 新、维护的速度或周期要受系统人员工作时间的制约, 导致检索工具的新颖性不够,可能会产生一些“死链 接(Dead link)”。
雅虎口碑网
搜索引擎 服务
目录索引 服务
3、有道搜索(网易) “有道搜索”作为网易自主研发的全新中文搜索 引擎,它致力于为Internet用户提供更快更好的中文 搜索服务。它于2006年底推出测试版,2007年7月 正式成为网易旗下搜索引擎的内核,并 于2007年12月11日推出正式版。目前有道搜索已推 出的产品包括网页搜索、博客搜索、图片搜索、新闻 搜索、音乐搜索、 海量词典、桌面词典、工具栏和 有道阅读。 /about/productlist.html
第一节

网络信息资源
1、Internet(因特网)概述 因特网是英文Internet的中文译名,也有人译作互 联网或国际互联网。1997年7月18日,全国科学名词 审定委员会正式确定Internet译为因特网。
(1)Internet发源于美国国防60年代的研究计划。 (2)Internet遵循的是TCP/IP(也即传输控制协议/网 间协议),它是一种网络通信协议,它规范了网络上 的所有通信设备,尤其是一个主机与另一个主机之间 的数据往来格式以及传送方式。
ALEXA排名
Alexa是第三方网站流量统计机构。 Alexa原理:Alexa排名是“到达率”及“页面浏览量”决定,统计数 据包括一天、一周和三个月3个时间单位。 1)每百万到访人数:表示一百万个安装alexa工具条的用户中有多少 个访问了此站。而周、三月平均到达率是分别统计一周内及三月内的 日平均到达率。 2)平均页面浏览数:是安装alexa工具条用户对某个网站的页面浏览 数量,同一天内同一用户访问同一页面只计算一次。 “人均页面浏览数”是所有网站访问者一天内访问页面的平均数, 同一页面同一用户访问只算一次。 而周、三月平均浏览数是分别统计一周内及三月内的日平均浏览数 局限性:alexar排名只能对安装了alexa工具条客户端进行统计 /

SOSO导航
搜搜特色服务之一: 搜吧:搜吧是与搜索技术结合紧密的一种类似论 坛的社区,在搜吧里用户可以自由创建感兴趣的新版 面,在该版面的主题涵盖范围内畅所欲言,特色是进 入门坎低,发言自由自在,并与腾讯公司的其它服务 紧密结合。用户可以通过搜吧首页的“目录分类”导 航,选择所感兴趣的吧进入;也可以通过搜索引擎进 入相应吧(前提是此吧存在)。
第二章 网络信息检索
浙江大学宁波理工学院图书馆 乐思诗
在现在的网络信息环境下,网络信息资源是我 们学习、工作、生活中利用率最高的信息资源之一。 对网络信息资源的利用是终身学习的需要,也是个人 信息素养中的重要内容。 因此,本章节将为大家介绍如何充分发挥网络 信息资源的重要作用,并能迅速在上百万个网站中快 速有效地查找到所需信息。
2、网络信息资源的特点 (1)信息的开放性 (2)信息来源丰富 (3)信息内容多样性 (4)信息表现形式多样化 (5)免费信息资源丰富 (6)信息传播速度快

(7)信息交互性 (8)信息承载平台的多样性 (9)信息关联性 (10)信息组织的局部有序性与整体无序性
3、网络信息资源的分类 网络信息资源可按照信息来源、信息载体或网络传输协 议来分类。 (1)网络信息资源按信息来源可分为:政府、公众、商用 等信息资源。 ●政府信息资源:由各国政府在网络上发布有关该国家 与政府的各种公开信息。 ● 公众信息资源:为社会公众服务的机构所拥有信息资 源。
第二节

网络信息资源检索
1、网络信息资源检索概述 (1)网络信息资源检索的作用 ① 能比较全面地掌握有关的网络信息 ②能提高网络信息利用的效率,节省时间与费用 ③能提高人才的信息素质,加速成才
(2)网络信息资源检索的方式 ①浏览 ②借助网络目录索引查找信息 ③利用搜索引擎进行信息检索 ④在线数据库查询

●商用信息资源:由商情咨询机构或商业性公司拥有 的并负责发布的各类信息。 ●教育科研信息资源:由各类教育科研机构或网上数 据库拥有并负责发布的各类信息。 (2)网络信息资源按信息载体可划分为电子邮件型、 图书馆目录、书目与索引、全文资料及电子出版物、 数据库、新兴资源等信息资源。 ● 新兴资源:包括网上论坛信息资源、博客信息资 源、问答互动平台信息资源等等。



PR值查询网站 / /Ranks/ /pr/ 提高PR值

内容丰富。一个500页的网站和一个有5000 页内容的网站的PR值显然会有所不同 网站持续更新 被更多的网站链接 网页中的内容的独特性等。
爱问的特色服务之一: “爱问”共享资料-- “iShare”资料共享平台 用户可以从这里找到由其他网友提供的各种各 样的资料,如合约合同范本、音乐录音带、教育资料, Flash短片或小游戏等。 网友必须注册,并使用用户名、密码登录后方可 使用iShare的各种资料。
爱问--共享资料
爱问的特色服务之二: 知识人--中文互动问答平台 用户如有疑难问题,可以选择先在已有问题中 搜索,看是否已经有了现成的答案;如果没有,用户 可以发出提问,等待其他用户的回答。 “知识人”将已有问题进行了详细的分类,用 户可根据这个目录索引逐层找到自己所需的答案。

有道全部服务
有道搜索最大的特点是:鼠标移动到某个搜索结 果网页地址前的“预览”图标,本页窗口会弹出一 个预览文本框。在预览文本框中快速浏览结果页面的 文本信息后,用户就能判断是否需要点击链接访问该 网页。
有道的搜索结果预览
4、搜狗(搜狐) 搜狗是搜狐公司于2004年8月3日推出的全球首 个第三代互动式中文搜索引擎,域名为 。目前搜狗搜索引擎的中文网页收 录量达到100亿,平均每天更新5亿网页。 搜狗的产品线还包括了网页应用和桌面应用两大 部分。
2、雅虎中国(YAHOO!) 雅虎()是世界上最早的搜索引 擎之一,雅虎拥有一流的Web目录和较佳的新闻链 接以及许多附加服务。有10余种语言版本,各版本 的内容互不相同。提供类目、网站及全文检索功能。 目录分类比较合理,层次深,类目设置好,网站提要 严格清楚。

雅虎口碑网
爱问--知识人
6、搜搜(腾讯) 搜搜()是腾讯旗下的搜索网站, 是腾讯主要的业务单元之一。网站于2006年3月正式 发布并开始运营。搜搜目前主要包括网页搜索、综合 搜索、图片搜索、音乐搜索、论坛搜索、搜吧等16 项产品,通过Internet信息的及时获取和主动呈现, 为广大用户提供实用和便利的搜索服务。

搜狗提供的全部服务
搜狗网址导航
5、爱问(新浪) “爱问iAsk”(/)是新浪完全 自主研发的搜索产品,采用了智慧型互动搜索技术, 为广大网民提供了较为人性化的搜索服务。 “爱问”提供了网页、新闻、博客、音乐、图片、 地图、知识人、资料等信息的检索服务。

新浪“爱问”
4、网络信息资源的评价 网络信息资源的统一评价指标 (1)可靠性:信息提供者、元信息 (2)精确性:时效性、全面性、服务对象及目的 (3)合理性:引用数据或事实的准确性、客观 (4)便利性 (5)支持情况:信息来源、外链 (6)网站的服务连续性和安全性

谷歌网页级别

谷歌网页级别即PageRank(PR),又称网页排名,是谷歌的专利技术。与文 献计量学中的引文分析相似,即它基于这样的假设:论文被引用的次数越高, 它的学术价值就越大。 谷歌通过计算PageRank(PR) 对网站(网页)进行评价,PR值一般为0~10 之间,数字越大,网站(网页)的重要性或权威性越高。 在网站(网页)总量一定的前提下,PR值在总体上保持“能量守恒”,即当一 个网站的PR值上升后,总有一个网站的PR值会下降。 PageRank 技术是通过对由超过 50,000 万个变量和 20 亿个词汇组成的方程进 行计算,PageRank 能够对网页的重要性做出客观的评价。PageRank 并不计 算直接链接的数量,而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网 页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的投票数量来评估该 页的重要性。此外,PageRank 还会评估每个投票网页的重要性,因为某些网 页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值 。重要网页获得的 PageRank(网页排名)较高,从而显示在搜索结果的顶部 。谷歌技术使用网上反馈的综合信息来确定某个网页的重要性。搜索结果没有 人工干预或操纵,这也是为什么谷歌会成为一个广受用户信赖、不受付费排名 影响且公正客观的信息来源。
相关主题