第4讲:信息检索搜索引擎
靠分类目录检索,用户通过逐级层层点击 浏览类目,导找自己所需的信息。
用户必须清楚信息所属的类别,找到的是 相关的网站。
例如:Yahoo、搜狐、新浪、网易等。
元搜索引擎
1995年,一种新的搜索引擎形式出现了:元搜索引擎 (A Meta Search Engine Roundup)。用户只需提 交一次搜索请求,由元搜索引擎负责转换处理后提 交给多个预先选定的独立搜索引擎,并将从各独立 搜索引擎返回的所有查询结果,集中起来处理后再 返回给用户。
2.3.2 Google学术搜索(中文)简介
2006年1月11日,Google公司宣布将 (Google Scholar)扩展至中文学术文献领域, 推出面向中文的Google学术搜索服务。
搜索结果:论文、图书、预印本、摘要、 技术报告等。
信息来源:合作伙伴(万方、维普等); 互联网
Google Scholar应用示例:
Yahoo! 1994
第一代搜索 目录搜索
元搜索 引擎 1995
第二代搜索 作原理
3.2常用搜索引擎
3.2.1、搜索引擎的类型
目录类搜索引擎 元搜索引擎 ……
全文搜索引擎
目录搜索引擎
具有搜索功能,严格意义上不是真正的搜 索引擎,是按目录分类的网站链接列表 。
经过几个月的聊天,J发现自己已经深深喜欢上了R.见R一面的想法不 断冲击着他.不过R并不同意见面: J:你上班的环境好吗? R:挺好的,在一个商厦里,而且旁边就是我们这儿最大的广场,交通什么 的都很方便. J:哦 ,那我能来见你一面吗? R:为什么要见面呢?网上不是挺好的吗?
J:…….
Allinurl:pdf +cgi
intitle
在网页的标题中查询
intitle:藤原纪香 电影
Allintitle 杨家f燕iletype
在网页的标题中查询
allintitle:古龙 金庸
限定所查搜文索引献擎类应型用与经典搜索案例 filetype:ppt 信息检索33
GOOGLE高级检索罕用语法
博士班休学,其指导教授是 Terry Winograd 博士。 Google 就是由Page在斯坦福大学发起的研究项目转 变而来的。
Google 简介:
SergSeyeBrgriney Brin,创始人之一,主管技术的总裁。出生 于莫斯科,是马里兰大学校本部的荣誉毕业生,拥 有数学专业和计算机专业的理学士学位。已取得斯 坦福大学计算机专业硕士学位,目前暂时从博士班 休学。29 岁的 Sergey 是美国国家科学基金会的奖 学金得主。他在斯坦福 遇到了 Larry Page 并参与了后来成为 Google 的研究项目。他们于1998年 共同创立了 Google。
4、通过公司性质找到公司名称及网站 /Company/Index.html
1 搜索引擎原理和概况 32 常用搜索引擎 3 搜索引擎使用十大经验
3.1搜索引擎原理和概况
1、什么是搜索引擎?
定义:提供信息检索服务的工具平台,它使用某
些程序把因特网上的网站信息进行收集和归类。
搜索引擎其实就是一个网站,是专门提供信息“检 索”服务的。
一般是利用其内部的一个叫SPIDE(蜘蛛)的程序, 自动提取网站的信息和网址加入自己的数据库,供 用户查询。
搜索引擎是人们获取网络信息最常用的工具。
2、搜索引擎的发展历史
搜索引擎发展历史
Archie 1990 Gopher 1993
L.C. Spears ‘Practicing Servant Leadership’, Leader to Leader, 2004,34, pages 7-11.
L.C.Spears 2004
杨家燕
搜索引擎应用与经典搜索案例
32Leabharlann GOOGLE高级检索常用语法
语法词
说明
举例
site Link Inurl
其他限制 “intitle:” 如:intitle:george walker bush “link:” 如:link:
等等
检索结果
Intitle:”george walker bush”
能从Google服 务器里直接取出 缓存的网页
2.3 Google的学术搜索
.Google语法简介
提供可能最符 合要求的网站
1 一般功能:
逻辑运算: • 逻辑“与”:空格即可 • 逻辑“或”:大写“OR”表示 • 逻辑“非”:用“-”表示,“-”前必须有空格
词语检索 双引号“”,常用于专业词语的检索
大小写 Google不区分大小写
2 特殊功能
查询某一类文档: “关键词 filetype:文档类型” 如:“教育技术引擎。提供网页快 照、网页预览/预览全部网页、相关搜索 词、错别字纠正提示、新:搜索引擎
成功=智商+情商+搜商
《搜商:人类的第三种能力》
搜网(sowang)总裁 陈沛 著 清华大学出版社 2006-11
搜索引擎应用与经典搜索案例
2
案例一-寻找网友
两个网友的谈话:
在某聊天室里,帅哥J和美女R,两人相谈甚欢…… J:你是做什么工作的啊?可以告诉我吗? R:我在一个出国服务公司做翻译呢。……..
237 万
要爱情还是面包? google给了我们答案
爱情万岁!
262 万 富有哲理的答案……
搜索引擎应用与经典搜索案例
36
Google的特色服务
1. Google Picasa 图片编辑处理工具 2. 桌面搜索程序 3. Google Earth() 4. Gmail (免费邮箱) 5. Googlepages() 6. Google Calendar(/calendar/) 7. Google Scholar () 8. Google Finance () 9. Google Print () 10. 本地搜索(/clochp) 11. 人肉搜索
金庸 qq 开始 书 赵薇 用户名
GOOGLE告诉我们世界是怎样的……
(趣味网络计量学)
检索词2 检索词1页 检索词2页
面数
面数
结论
琼瑶
42万 12万3000
金庸占压倒性优势!
msn
480 万 523 万 还差一点点,民族软件加油!
结束
969 万 284 万 有多少开始没有结束???
电影
946 万 305 万
Google搜索引擎
Google搜索引擎诞生于斯坦福大学的一个学生 宿舍里,然后迅速传播到全球的信息搜索者。
Google 目前被公认为万维网上最大的搜索引擎, 它提供了简单易用的免费服务,使用户能够访问一 个包含超过 80 亿个网址的索引。
“Google”来自于数学名词“Googol”, Googol 表示一个 1 后面跟着 100 个零。Google Int.使用这 一术语体现了公司整合网上海量信息的远大目标。
J太想见到R了,但他甚至连她在什么地方都还不知道。这时,J注 意到这个聊天室可以看到网友的IP地址,于是他查到R的IP是 61.130.1.234
亲爱的朋友,你能带J找到R吗?
解决方法
1、查找R的IP地址归属地
2,找到当地最大的广场 3、通过电子地图查找广场位置,并查看四
周确定商厦名称
Allinurl
结果局限在某网站或某域名 联接网站页面
吸星大法 site: Site:cn 红旗
Link:
网页链接中包含查询第一个关 键字,后面的关键字出现在联 接中或文档中
网页链接中包含所有查询关键 字
Inurl:security web inurl:midi 沧海一声笑 inurl:pdf ecommerce
第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。元搜索引 擎概念上好听,但搜索效果始终不理想,所以没有 哪个元搜索引擎有过强势地位。
元搜索引擎通常是引用比较知名的搜索引擎,查全 率很高,但查准率低。
杨家燕
成立于美国硅谷,2000年,落户中国。
李彦宏
2001年8月,发布搜索引擎Beta版, 从后台服务转向独立提供搜索服务,并且在中国首 创了竞价排名商业模式。在美国纳斯达克上市。语法词
说明
举例
related cache
info
用来搜索结构内容方面相 related:
似的网页
用来搜索GOOGLE服务 器上某页面的缓存,这个 功能同“网页快照”,通 常用于查找某些已经被删 除的死链接网页
Cache:http://www.jiuji /ziliaoku/jiu bakanghong/
Google 简介:
Larry Page,创始人之一,主管产品 的总裁。密西根安娜堡大学的荣誉毕
Larry Page
业生,拥有理工科学士学位。他还因
其出色的领导才能获得过多项荣誉,以奖励他对工学 院的贡献。他曾担任密西根大学 Eta Kappa Nu 荣誉 学会的会长。目前他暂时从斯坦福大学计算机研究所
书籍的力量!
李亚鹏
32万 7 万7500
臭名也是名啊~~
密码
363 万 482 万 这是部分用户常更改密码所致
搜索引擎应用与经典搜索案例
35
检索词1 战争 打假 求婚 鲸鱼是鱼
美女 警察 面包
得到
检索词2 和平 制假 结婚
鲸鱼不是鱼 女人 小偷 爱情
失去
检索词1页面 数
132 万 35万5000
11万
用来显示与某链接相关的 info:
一系列搜索,提供cache、 link、related和完全包含 该链接的网页的功能