搜索引擎及其使用技巧
且慢,让我先Google一下☺
我们若能更妥善地搜寻资料,实在已经改变世界
21
2 Google及其使用技巧
由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明。 约搜索30亿张网页,包括35个国家和地区的语言的资源。 已占有全球搜索市场的80%。Google 在中国的搜索市场的市场份额
第三讲 搜索引擎及其 使用技巧
回顾及引入
下一讲:实习
主要内容
✓ 搜索引擎定义、原理及分类 ✓ Google及其使用技巧 ✓ 常用的学术搜索引擎 ✓ 其它搜索引擎
1 搜索引擎概述
1.1. 搜索引擎的定义
搜索引擎,即Search engine,是指根据一定的策 略、运用特定的计算机程序搜集互联网上的信 息,在对信息进行组织和处理后,为用户提供 检索服务的系统。或是一个提供信息“检索” 服务的网站。 搜索引擎常常是用户利用网上资源的第一途径。
/
全文搜索引擎 (Full Text Search Engine)
提取以网页文字为主的信息,建立索引数据库,检索与用户查询条件 匹配的相关记录,然后按一定的排列顺序将结果返回给用户。
分类:从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种 是拥有自己的检索程序,并自建网页数据库,搜索结果直接从自身的 数据库中调用;另一种则是租用其他引擎的数据库,并按自定的格式 排列搜索结果,如Lycos引擎。
பைடு நூலகம்
• 自动"and"查询
默认情况下,Google 只返回包含所有搜索字词的网页。在字词 之间无需添加"and"。请记住,字词键入的顺序会影响搜索结果。要 进一步限制搜索,只需加入更多字词。
• 大小写
Google 搜索不区分大小写。不论您如何键入,所有字母都会视
为是小写的。例如,搜索 INFORMATION 、information 、 INformaTion等所返回的结果是一样的。
“-”与前面一个检索词之间要 有空格
“-”与后面一个检索词之间不 能有空格
近似词检索 注意: “~”为英文字符 “~”与检索词之间不能有空格
特定词组检索
要搜索与指定网站有相似内容的网页,需在搜索框中 键入“related:”,并在其后键入相应的网址。
如:related:
2.1 Google检索步骤
确定检索需求 构建检索策略 点击检索 评估检索结果 点击浏览 保存所需信息
2.2 Google检索技巧
正确选择搜索字词 不区分大小写、自动使用“AND” 合理利用 “与/或”的搜索:OR 搜索中包括或不包括的词:+、 搜索近似词:~ 搜索特定词组:“ ” 网页快照、类似网页 利用高级检索 使用“更多”功能
没有自己的数据库,利用一个统一的界面,查询其他 独立的搜索引擎。
优点:快捷,信息覆盖面更加广泛 缺点:高级检索功能不完善,检索结果没有经过处理 代表:InfoSpace、Dogpile、Vivisimo等(元搜索
引擎列表),中文元搜索引擎中具代表性的有北斗等。
/
支持13种非HTML 文件的搜索
Google 高级检索实例
例:查找与美国计算机协会类似的网站 ()。
输入
信息需求:查找相关专业的重要网站
查找其他类型文件
Google可以支持13种非HTML文件的搜索。除了PDF文档, Google现在还可以搜索Microsoft Office (doc, ppt, xls, rtf) 、Shockwave Flash (swf)、PostScript (ps)和其它 类型文档。新的文档类型只要与用户的搜索相关,就会自 动显示在搜索结果中。 例如,如果您只想查找 PDF或Flash 文件,而不要一般网 页,只需搜索: 关键词 filetype:pdf 关键词 filetype:swf”
优点:是查询全面、充分,用户能够对各网站的每篇文章中的每个词 进行搜索,检索直接、方便,而且可使用布尔逻辑检索、短语检索等 高级功能。
缺点:擎(META Search Engine)
同时在其他多个引擎上进行搜索,并将结果返回给用 户。
1.2 搜索引擎的工作原理
1. 抓取网页 2. 处理网页 3. 提供检索服务
1.3 搜索引擎的种类
按工作语种区分
单语种搜索引擎
多语种搜索引擎
按数据来源区分
独立搜索引擎
元搜索引擎
按检索内容区分
综合型搜索引擎
专题型搜索引擎
按检索机制区分
目录搜索引擎
元搜索引擎
全文搜索引擎
目录式搜索引擎(Search index/Directory)
也已突破30%,并且增长速度迅猛,在中文搜索市场有举足轻重的作 用。 有庞大的数据库,提供全面的结果信息,可搜索所有网站,快速有效 的搜索到自己所需内容,是一个快速、强大的搜索引擎,它具有足够 的响应能力来处理任何极度复杂的搜索,用户界面相当好。并且具有 一定的大写、名词识别能力的快速搜索引擎,它的数据库是最大的, 能找到别的搜索引擎所不能找到的东西。
✓ 通过用户浏览层次类型目录来寻找所需信息。 ✓ 分类:一般按主题分类,并辅之以年代、地区
等分类。 ✓ 优点:使用户清晰方便地查找到某一大类信息,
尤其适合那些希望了解某一范围内信息,并不 严格限于查询关键字的用户。 ✓ 缺点:搜索范围较全文搜索引擎要小许多,尤 其是当用户选择类型不当时,可能遗漏某些重 要的信息源。 ✓ 代表:Yahoo、搜狐、新浪网站
自动排除常用字词
• Google 会忽略常用字词和字符,如“where”和“how” 以及其他会降低搜索速度,却不能改善结果的单个数字和 单个字母。
• 如果必须要使用某一常见字词(数字)才能获得需要的结 果,您可以在该字词前面放一个"+"号,从而将其包含在查 询字词中。
注意: “-”为英文字符
货币转换
要使用我们的内置货币转换器,只需在 Google 搜索框中键入您需要完成的货币转换,并单击 “回车”键或 Google Search 按钮即可。 【实例】