当前位置:文档之家› 网络资源及搜索引擎

网络资源及搜索引擎

网络资源及搜索引擎
网络资源的特点:
1)数量巨大,增长迅速。

2)内容丰富,形式多样。

3)信息发布自由,信息资源良莠不齐。

4)传播范围广泛。

6)网络信息具有一定的交互性。

搜索引擎的概念及工作原理
概念:(Search Engine)从广义上讲是用来对网络信息资源管理和检索的一系列软件,在Internet网上查找信息的工具或系统
组成:WWW服务器,搜索程序(如spider、crawler、robot),索引数据库(包括成千上万甚至上亿个网页),检索程序(用来处理用户的检索请求)
工作原理:
简单地说主要包括以下几个步骤:
网页信息搜索
索引库的建立
用户检索式的处理
检索结果输出
在索引数据库中排序
Google的工作过程:
抓取原则:
深度优先和广度优先:深度优先——从起始页的某一个链接开始,一直深入下去(如google);广度优先——从起始页的全部链接着手,再从另一个网页的链接开始
免费与付费:有的网站通过付费来保证其被搜索引擎收录
定期搜索与提交网站:定期搜索——搜索引擎派搜索程序定期对网页进行搜索(如google每隔30天);网站拥有者主动向搜索引擎提交网址,在一定时间内(2天到一个月不等),搜索引擎扫描网站,并将有关信息存入数据库.
输出结果排序原则:
检索词出现的位置和词频(位置词频法)
链接流行度(网页被其他网页或网站引用或链接的次数,被引用或链接频率越高,说明网页越重要,便排在前面)
付费:竞价机制引入搜索引擎,如Baidu,根据网站或网页提供者付费的多少,来决定网页在检索结果中出现的位置
搜索引擎
基本语法:
1)布尔逻辑: 逻辑”与”:AND.(注关键词之间的空格默认为逻辑与)
如:墨攻AND 鸡犬不宁
逻辑”或”:OR, | (注:不可以用小写的or,否则被忽略)
如:墨攻OR 鸡犬不宁
逻辑”非”:-(注:-前面有空格,后面没有空格;不用NOT或not,否则被作为
检索的一部分)
如:张艺谋–大红灯笼高高挂
2)短语搜索: “to be or not to be”
“beijing university of technology”
3)通配符:* 如:beijing* university
4)英文大小写不敏感
限制检索
1)link:含某个链接的网页如:link:
2)site:域名中包如:site:
3)Intitle:标题搜索. 如:intitle:休斯顿火箭队
4)Intext:正文检索.如:intext:像素600万
5)Inurl:搜索url.如: inurl:mp3
6)filetype:文件格式. 如:filetype:pdf
(注:以上语法可用google高级搜索实现)
搜索策略
选择合适的关键词
利用高级检索功能(包括布尔算符,限定文件类型、时间、语言等)
想了解世界电影节的情况,具体有哪什么电影节并不清楚。

用目录式搜索引擎可以获得较多的提示。

三、可以看到这么多电影节,挑你感兴趣的了解吧
不过,不一定所有的
电影节都列在了这
里,比如威尼斯电影
节就没有,所以目录
式搜索引擎搜索的范
围还是有限的
如果用google直接搜索呢?我们来对比一下
用google搜索,结果多,但杂乱、结构不清晰,需要耐心地挑选一阵子
协议类型/服务器名/文件路径
域名:计算机在internet上的名字,标识团体、组织或个人在internet上的地址
常见的标明组织机构类型的“一级域名”:
.com --商业机构(commercial organizations)地址
.edu--教育(education)及研究机构地址
.gov--政府机构(government agencies)地址
.net--主要网络服务机构地址
.org--专业团体组织(organizations)
.mil--用于军事领域
新出的域名:
.aero--航空运输业
.museum--博物馆的专用顶级域名
.coop--商业合作社
.biz--可以替代.com的通用顶级域名,适用于商业公司
.info--可以替代.com的通用顶级域名,适用于提供信息服务的企业
国家代码:
.cn-China
.au -Australia .cl-Chile
.br-Brazil .de -Germany
.ca -Canada .eg-Egypt
.ch-Switzerland .jp-Japan
.mx-Mexico .nl-Netherlands
.nz-New Zealand .uk-United Kingdom
与”或”
其他设置
图书
搜索结果在参考文
献中找到
全文(一般为
PDF格式)
搜索帮助
高级搜索
其他设置
检索结果
帮助系统
推荐学习网址:中文搜索引擎指南网
检索练习:
1. 盲文的英文是什么?从何而来?
2. 1码等于多少尺?1人民币等于多少韩元?
3.查找关键词为”metal semiconductor material”,类
型为pdf的文章
4.比较google和百度两大搜索引擎,指出二者的异同
点和各自的优缺点
网络资源的评价
作者:作者具有撰写这一主题文章的专业水平吗?
出版年代:这篇文献所包含的信息是最新的吗?
出版者:是什么样的机构?执行什么样的出版政策?出版目的?
他人对文章的评论:对于你查到的这些资料,人们是怎么评论的呢?
内容:你所找的资料适合你的研究吗?这篇文献对你的研究有多大参考价值呢?。

相关主题