当前位置:
文档之家› 文献检索,信息检索(5)第5章(搜索引擎)
文献检索,信息检索(5)第5章(搜索引擎)
➢ 1994年4月,Stanford University的两名博士 生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo。
➢ 1995年,一种新的搜索引擎形式出现了——元 搜索引擎。第一个元搜索引擎,是Washington 大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。
六、常用的中英文搜索引擎网站介绍
❖ 全文式搜索引擎 ❖ 目录式搜索引擎 ❖ 元搜索引擎 ❖ 特色搜索引擎
全文式搜索引擎
❖ 1.Google() ❖ 2.搜索引擎() ❖ 3.中国搜索搜索引擎
() ❖ 4.北大“天网”() ❖ 5.FAST/AllTheWeb
) ❖ 10.Aol() ❖ 11.HotBot ()
❖ 12.WebCrawler
()
1.Google搜索引擎应用
7.《Search Day》 (/searchday/archi ves.html)
学习中文搜索的网站主要有:
1.
搜
索
研
究
院
(/9238/);
2.中文搜索引擎指南网的《搜索引擎使用指导》 栏目(/)
引 擎
❖ 它主要是针对检索词中含有人名、地名等专有名词 的情况。
的 高
❖ 大多数搜索引擎在查询中要区分大小写,在区分大 小写的情况下,
级 检 索
小写——匹配大小写字符 大写——只匹配大写字符,检索词能被当
功
作专有名词看待
能 ❖ 目前,AltaVista和Infoseek等工具有此特点。
搜
索
引
擎
的 ✓ 5、范围限制检索
URL由存取协议、主机名、文件名三部分构成,其格式 为:<通信协议>://<主机>/<路径>/<文件名>。
1、根据信息检索方式分类:
全文搜索引擎、分类搜索引擎、混合搜索引擎
2、根据信息覆盖范围及适用用户群分类:
综合性搜索引擎、专用性搜索引擎
3、根据搜索范围(功能)分类:
独立搜索引擎、集成搜索引擎
五、搜索引擎的使用技巧
4.Searchtools(/)
5.Search Engine Conference (/searchengines/)
6.Search Engine Watch (/)
➢ DEC的AltaVista1995年12月才登场亮相。但是, 大量的创新功能使它迅速到达当时搜索引擎的 顶峰。
➢ 博士生Larry Page于1997年9月15日注册了 的域名。Google在PageRank、 动态摘要、网页快照、DailyRefresh、多文档 格式支持、地图股票词典、寻人等集成搜索、 多语言支持、用户界面等功能上的革新,从一 定程度上改变了搜索引擎的定义。
int ➢国标际题组限织制(格式为title:检索式),如title:mars
➢ 主机名限制(格式为site:检索式/host:检索式),
如”mars landing”+host:edu
➢ URL限制(格式为url:检索式),如url:home.html
➢ 链接检索(格式为lin 专利发明人、前Infoseek资深工程师李彦宏与 好友徐勇(加将进入「战国时代」? 微革命?
搜索引擎及其检索
❖ 一、搜索引擎的概念 ❖ 二、搜索引擎的构成及工作原理 ❖ 三、搜索引擎的检索功能 ❖ 四、搜索引擎的分类 ❖ 五、搜索引擎的使用技巧 ❖ 六、常用中英文搜索引擎网站介绍
擎
的 用某一检索词进行检索时,能同时对该词同
高 样或类似概念的同义词和近义词进行检索,
级 以达到扩大检索范围,提高查全率的目的。
检 例如,当用户使用intellectual property
索 功 能
right检索时,检索结果不仅包括含有上述词 组的网页,还能检索出包含copy right等词 组的网页。如:Excite
➢ 世界上第一个Spider程序,是MIT Matthew Gray 的World wide Web Wanderer,用于追踪互联网 发展规模。
➢ Lycos是搜索引擎史上一个重要的进步。Carnegie Mellon University的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了 Lycos。
本 检 索
❖❖ 雪莱精确s查p找ring “冬天已经来了,春天还会 ❖ 远吗“e”lectronic magazine”
功 能
❖ “知识经济与社会发展”——知识经济与社会发
❖ W展 hen Winter comes, can Spring be
far behind? / If winter comes, can
➢ 2002年6月,Openfind重新发布基于GAIS30 Project的Openfind搜索引擎Beta版,推出多 元排序(PolyRankTM),宣布累计抓取网页 35亿
➢ 北大天网是国家“九五”重点科技攻关项目 “中文编码和分布式中英文信息发现”的研究 成果 ,收录网页约6000万,利用教育网优势, 有强大的ftp搜索功能。
一、搜索引擎的概念
Search Engine
搜索引擎实际上是个专用的WWW服务器,它存有庞大的 索引数据库,收集了Internet上百万甚至上千万个 WWW主页的信息。
搜索引擎泛结指果在信数息据列库表系中统的中条查目找至信少息有的三工个具 元,素是:那些在 因特标网题上或通过因特网能够响应用户提交的搜索请求,返 回相U应RL查询结果的信息技术和系统。它是一些站点中提供 的将摘因要特网网站和网页信息进行收集、整理和组织,从而
各万维 网站点
资源
详细信息反馈
搜
索
引
❖ 1、布尔逻辑检索
擎 的
❖ 逻辑与 (and、AND、 & )
基
❖ 逻辑或(or、OR、|)多用于英文搜索引擎,大多数
本
情况下,两个关键词之间没有空格就相当于“或者” ,如计算
检 索
机病毒
功
❖ 逻辑非(not、NOT、!)
能
搜
索
引 擎
➢ 2、 +、- 检索
的 ➢ +:放在检索词前,表示该检索词在检索结
帮助用户找到所需信息的手段。
影视作品
历史事件
标题
摘要
URL
搜索引擎有两个主要的功能: 1、收集网络信息资源,对其进行
索引并建立数据库。
2、提供网络的信息导航与检索服 务(主要的功能)。
信息搜索 信息处理
信息查询
二、搜索引擎的构成及工作原理
用 户 网络 系 统
搜索引擎
用 搜索器
户
接
索引器
口 检索器
spring be far behind?
搜
索
引 擎
➢ 1、自然语言检索
的 ➢ 支持字、词、句子检索
高 ➢ 几乎所有的搜索引擎都支持该功能
级 ➢ 如:知识经济的支柱产业
检
How has WTO developed?
索
What is the Weather in London?
功
能
搜
索
引 2、概念检索
Google简介
Google()是一个搜索引擎,由两个 斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发 明,Google Inc. 于1999年创立。2000年7月份,Google替代 Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成 为中国网易公司的搜索引擎。98年至今,Google已经获得30 多项业界大奖。到Google的新闻中心 (/press/index.html),你可以找到 关于一切关于Google的历史和新闻资料。
Internet信 息资源及
其检索
搜索引擎
Internet信息资源
❖ 特点: ——丰富、形式多样、交互性强等
❖ 种类: ——www、Telnet、FTP、用户服务组、
Gopher等
Internet信息资源检索
❖ 检索方法:
1.基于超文本的信息查询 2.基于目录的信息查询 3.基于搜索引擎的信息查询
基
果中必须出现。
本 ➢ -:放在检索词前,表示该检索词在检索结
检
ቤተ መጻሕፍቲ ባይዱ
果中不能出现。(-前必须空格)
索 功 能
➢ 几乎所有的搜索引擎都支持这种功能。 ➢ 如:+计算机+病毒 –CIH
或 计算机 病毒 -CIH
搜
索
引
擎 ❖❖ 雪4、莱完的全诗字里符串的检“索冬天已经来了,春天
的 基
❖ 还采会用远双吗引号”“的”英代表文字原符文串
❖ 影响检索的因素:
1.信息资源质量对信息检索的影响 2.检索软件对信息检索的影响 3.用户水平对信息检索的影响
搜索引擎及其检索
搜索引擎发展史
➢ 现代意义上的搜索引擎的祖先,是1990年由 Montreal的McGill University学生Alan Emtage、 Peter Deutsch、Bill Wheelan发明的Archie
() ❖ 6.AltaVista()
❖ 7.Lycos () ❖ 8.EXCITE() ❖ 9.InfoSeek(或
搜
索
引
擎 ➢ 3、相关信息反馈检索 的
高 ➢ 提供与检索结果类似的检索结果。如:
级 检 索
➢ ➢
雅虎中国的“相关网站、相关网页、相关新闻”。 Lycos的“More Like This”
功 ➢ Excite的“Search for more documents like