搜索引擎概述
按其工作方式可分为三种: 全文搜索引擎(Full Text Search Engine) 目录索引搜索引擎 (Search Index/Directory) 元搜索引擎(Meta Search Engine)
四川建院图书馆 信息检索技术
全文搜索引擎
从互联网上提取的各个网站的信息而建立的数据库中,检索与用户查 询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。 从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有 自己的检索程序,并自建网页数据库,搜索结果直接从自身的数据库 中调用;另一种则是租用其他引擎的数据库,并按自定的格式排列搜 索结果,如Lycos引擎。 优点:是查询全面、充分,用户能够对各网站的每篇文章中的每个词 进行搜索,检索直接、方便,而且可使用布尔逻辑检索、短语检索等 高级功能。 缺点:繁多而杂乱的感觉。 代表性的全文搜索引擎是Google、。.rtf富文本文件
.swf
Shockwave Flash
搜索引擎
指定文件类型
四川建院图书馆 信息检索技术
搜索引擎
–检索语法
• 搜索的关键词包含在URL链接中:inurl: • 搜索的关键词包含在网页标题中:intitle: • 搜索的关键词包含在网页的“锚”中: inanchor: 或allinanchor: • 搜索所有链接到某个URL的网页:link:
四川建院图书馆 信息检索技术
全文搜索引擎
(Full Text Search Engine)
• • • • • • • Google Sogou Soso Youdao () Bing () 即刻()
四川建院图书馆 信息检索技术
目录式搜索引擎
用户通过浏览层次类型目录来寻找所需信息。 分类一般按主题分类,并辅之以年代、地区等分类。 网站多以此方式组织。例如:新浪>分类目录>计算机 与互联网> 硬件>行情报价。 优点:使用户清晰方便地查找到某一大类信息,尤其 适合那些希望了解某一范围内信息,并不严格限于查 询关键字的用户。 缺点:搜索范围较全文搜索引擎要小许多,尤其是当 用户选择类型不当时,可能遗漏某些重要的信息源。 代表性的目录式搜索引擎是Yahoo、搜狐、新浪网站
总结
• • • • 信息检索 搜索引擎类型 搜索引擎技巧 专业搜索引擎
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
ห้องสมุดไป่ตู้
元搜索引擎
• Ixquick中文版 : /jia • 搜乐搜索:
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
二 搜索引擎
ie
爱尔兰
us
美国
• 指定文件类型:filetype:
• 可以在一类文件中进行搜索
• 比如:filetype:pdf, filetype:ppt等。
四川建院图书馆 信息检索技术
计算机文件扩展名与文件类型对 照表
文件类型 文件扩展名 .doc .xls .ppt .pdf Microsoft Word Microsoft Excel Microsoft Powerpint Adobe Acrobat PDF .ps .dwf .kml .kmz Adobe Postscript Autodest DWF Google 地球 KML Google 地球 KMZ 文件扩展名 文件类型
四川建院图书馆 信息检索技术
搜索引擎
词组检索
四川建院图书馆 信息检索技术
检索语法
• Site:表示把搜索结果局限在指定的某个具体 的网域、网站或者网站频道,某个域如 、某个网站如、某个网站频道如 等。 Filetype:即在指定的文件类型中查找信息。 link:搜索所有链接到指定URL地址的网页。 related:按类似网页搜索 info:命令可以搜索指定网页的一些基本信息。 define:按词语的网络释义搜索
搜索引擎 云技术的应用:有道的云笔记 移动搜索引擎
专业搜索引擎
• 找法智搜 /fagui/ • 搜索软件吧 • 职通车/so/
四川建院图书馆 信息检索技术
目录型搜索引擎
四川建院图书馆 信息检索技术
元搜索引擎
通过一个统一的用户界面帮助用户 在多个搜索引擎中选择和利用合适 的(甚至是同时利用若干个)搜索 引擎来实现检索操作,是对分布于 网络的多种检索工具的全局控制机 制。 优点:快捷,信息覆盖面更加广泛 缺点:高级检索功能不完善,检索 结果没有经过处理 著名的元搜索引擎有InfoSpace、 Dogpile、Vivisimo等(元搜索引 擎列表) 图 Dogpile界面
教育学术 官方政府单位
.net 网络管理或服务机构 .org 财团法人或基金会等非官方的一般机构 .int 国际性组织 .com 代表商业企业团体与组织 中国科学研究机构
四川建院图书馆 信息检索技术
常用地理性顶级域名
国家或地区 代码 au ca ch cn de es fl fr hk 澳大利亚 加拿大 瑞士 中国 德国 西班牙 芬兰 法国 香港(中国 ) in it jp mo ni ru sg tw uk 印度 意大利 日本 澳门(中国) 荷兰 俄罗斯联邦 新加坡 台湾(中国) 英国 代码 国家或地区
四川建院图书馆 信息检索技术
搜索引擎
• Google
– 高级检索功能
• 可以排除某个特定站点的网页(限定网域) • 可以对检索结果页面的语言类型进行限制(限定语种 ) • 可以限定检索结果的时间范围(更新日期) • 可以限定关键词出现的位置(字词位置) • 可以检索链向某一个网页的所有页面(键连功能) • 可以检索与某一个网页相关的所有网页(相似网页检 索)
四川建院图书馆 信息检索技术
搜索引擎
逻辑与功能
四川建院图书馆 信息检索技术
搜索引擎
逻辑或功能
四川建院图书馆 信息检索技术
搜索引擎
逻辑非功能
四川建院图书馆 信息检索技术
检索语法使用
– 双引号(“ ”)的使用
– 书名号(《》)的使用
– 空格的使用
– 减号(-)的使用
– 加号(+)的使用:强调“+”后的内容,必须 出现 – 使用通配符(*),(?)
• • • • •
指定网域:利用site:可以在某 个特定的网站或域中进行搜索。 输入格式:检索词 site: 例如:梁思成 site:
四川建院图书馆 信息检索技术
搜索引擎
指定网域
四川建院图书馆 信息检索技术
如何辨别网站的性质
.edu
.gov
2.1.1搜索引擎原理
• 从互联网上抓取网页→建立索引数据库→ 在索引数据库中搜索排序。 • 大多数搜索引擎并不真正搜索互联网,它 搜索的实际上是预先整理好的网页索引数 据库。 • 搜索引擎也不能真正理解网页上的内容, 它只能机械的匹配网页上的文字。
四川建院图书馆 信息检索技术
2.1.2 网络搜索引擎类型
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
360搜索
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
实际操作
• • • • 寻找不同语言中“我爱你” 的写法和发音 查找初一学生关于时间的名人名言 查找雷明的个人资料 半夜里,突然牙齿痛得厉害,不方便去医院,请 上网找紧急止痛方法。
• 我想找知识管理方面的pdf格式的资料? • 刘明看到一篇转载自赛迪网() 的介绍Excel函数的文章,感觉挺有帮助,想看看 赛迪网中还有没有类似的文章,怎么办? • 病人在医院里做的“CT”,是什么意思? • 你的朋友开了花店,请你帮忙起个三个字的名 • 德阳的特色景点与小吃有哪些? • 查找电视连续剧《红樱桃》创作人员
搜索引擎概述
• 搜索引擎概述 • 搜索引擎技巧
四川建院图书馆 信息检索技术
2.1 网络搜索引擎概述
• 搜索引擎是一个提供信息服务的网站,它 使用某些程序把因特网上的所有信息归类 以帮助人们在茫茫网海中搜寻到所需要的 信息。 • 搜索引擎常常是用户利用网上资源的第一 途径。
四川建院图书馆 信息检索技术
• 搜索引擎的工作原理
– 搜索引擎构成
• 搜索器 • 索引器 • 检索器
– 搜索引擎的不足
• 准确性差 • 各种搜索引擎使用的检索符号、格式等不统一
四川建院图书馆 信息检索技术
搜索引擎 • 基本检索技术:
–(布尔检索功能)
•逻辑“与”:检索框中的两个关键词 之间用空格隔开则默认为是“AND”(“与 ”运算)连接。 •逻辑“非”:用“—”(减号)表示,同 时要求在减号前保留一个空格。 •逻辑“或”:用“OR”表示。
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术
四川建院图书馆 信息检索技术