当前位置:文档之家› Internet网络信息检索技巧

Internet网络信息检索技巧


搜索引擎分类
检索型搜索引擎:它使用自动索引软件来发现、收集并标 引网页,建立数据库,并以Web形式让用户找到所需信息 资源。比较著名的有: A信息系统地分门归类,经过 人工整理后形成庞大而有序的分类目录体系,用户可以在 目录体系的导引下通过逐级浏览,发现、检索到有关的信 息。雅虎就是以卓越的分类目录型导航服务而称誉全球。 混合型搜索引擎:它兼有检索型和目录型两种方式。如: 新浪、搜狐、网易、中华等门户网站。 多元搜索引擎:也称为集合型搜索引擎。它是将多个搜索 引擎集成在一起,通过统一的检索界面进行网络信息多元 搜索 的检索工具。
3.5其他用法类似的限定检索
参阅英文Google大全。
()
Yahoo是因特网上历史最悠久、用户数最多的综合型、混 合型搜索引擎,是分类式搜索引擎的典范。它拥有10余种 语言版本,且各版本的内容互不相同。 如果用户的检索词在Yahoo !中查询不到结果,它会自动 将查询转交给Google搜索引擎做进一步的检索。 Yahoo!支持词语检索和“+‖ 和“–‖限制检索等,它还提 供日期限定、URL和题名限制检索等。“+‖限定关键字串 一定要出现在结果中; “–‖限定关键字串一定不要出现在 结果中。
利用Google进行专题信息检索
1 简单专题信息检索及目录检索 接受一项简单专题,最直截了当就是在搜索框内输入一个 关键词,然后点击下面的“ Google 搜索”按钮(或者直接回 车),结果就出来了。 如果对查询的领域熟悉,只想寻找某些专题网站,首先考虑 用目录检索。目录分类明确,则网站专题信息集中,剔除了大 量不相关的信息。不过对查找中文信息,Google的中文目录太 少只有非常普通简单的类目,可能很难满足需求(中文目录 “/Top/World/Chinese_Simplified/”) 。
搜索引擎使用-附加功能搜索
附加功能搜索: -网页快照: (Snap shot) 直接从引擎数据库缓存(Cache)中调出该网页的存档文件,方 便用户在预览网页内容后决定是否访问该网站,或是在对应网页 发生变动时查看原始页面,或解决死链接。 -横向相关查询: 当用户找到某个感兴趣的网页,搜索引擎提供查询内容近似的其 他网页的功能(不限于同一网站)。一般是在信息条目后面给出 “Similar Pages‖或“More results like this‖链接。 -除上述功能外,现在搜索引擎都纷纷开始提供分类搜索,如新 闻搜索、图象搜索、新闻组搜索、Flash搜索等等。
3.1限定在网站或域名的检索 “site‖表示搜索结果局限于某个具体网站或者 网 站 频 道 , 如 “ ‖、 ―‖, 或 者 是 某 个 域 名 , 如 “ ‖、―com‖ 等等。如果是要排除某网站或 者域名范围内的页面,只需用“-网站/域名”。 [例1]搜索上关于搜索引擎技巧的页面,检索式为: 搜索引擎 技巧 site:。Leabharlann 3.4 限定在数据类型的检索
“filetype:‖是Google开发的非常强大实用的 一个搜索语法。也就是说, Google 不仅能搜索 一般的文字页面,还能在某一类文件或某些二 进制文档中查找信息进行检索。其中最实用的 文档搜索是PDF搜索,PDF文档通常是一些图文 并茂的综合性文档,提供的信息一般较全而专。 如搜索一些期刊影响因子方面的 PDF 文档, 检索式为:影响因子 期刊 filetype:pdf。
搜索引擎使用-常用搜索引擎
国外综合型检索工具
目前有记录可查的国外的搜索引擎数量已达到 2500个,其中有不少优秀的综合型搜索引擎, 如: Google、 Yahoo!、AltaVista、Excite、 Infoseek、Lycos、HotBot、OpenText等。 访问AltaVista() 的次 数超过1亿次。 HotBot( )是美国享 有盛誉的综合型、混合型搜索引擎。
Internet网络信息检索
网络信息检索工具——搜索引擎 网络资源导航、学科门户 网上书目 专利文献检索 物理网络资源及检索
网络信息检索工具 搜索引擎简介
搜索引擎是采用信息自动跟踪标引等技术、建立在因特 网上专门提供网络信息资源导航服务检索工具。 搜索引擎的检索系统由以下几部分组成: 搜索器、分析器、索引器、检索器和用户接口。 同检索数据库一样,利用搜索工具检索,也需要用户能 够将自己的检索需求编制成合适的检索策略,并且需要 一定的检索技巧。 搜索引擎采用的检索词和信息标识词匹配运算的主要方 法有:布尔逻辑检索、截词检索、限制检索、加权检索、 词位置检索和全文检索等。
site后的冒号为英文字符,而且冒号后不 能有空格, 否则,“site:‖将被作为一个搜索 的关键词。此外,网站域名不能有“http://‖前 缀,也不能有任何“/”的目录后缀;网站频道 则只局限于“频道名 . 域名”方式,而不能是 “域名/频道名”方式。
3.2 限定在URL链接的检索
使用“inurl‖操作结果关键词出现在链接中 的目录名称或者网页名称或者网页文档中。有很 多网站把某一类具有相同属性的资源名称显示在 目录名称或者网页名称中,可以用inurl找到这些 相关资源链接,然后,用第二个关键词确定是否 有某项具体信息。使用inurl通常能提供非常精确 的专题信息。“ allinurl‖ 操作使用结果网页的链 接中包含所有作用关键词,查询的关键词只集中 于网页的链接目录名称或者网页名称,如 “ allinurl: google search‖ 相当于“ inurl:google inurl:search‖。 [例]查找机动车安全检测的网站,检索式为: inurl:机动车 安全 检测
著名综合型检索工具Google
()
Google 是目前世界上最大的搜索引擎,它提供 70 多种界面语言和 35 种检索语言,有分类查询和关 键词检索两种检索功能。 Google 不支持“词干法”和“通配符”,但可使 用布尔逻辑检索,且逻辑“与”不用算符,词与词 之间留一空格,逻辑“或( OR )”和“非(- )” 算符前必须留一空格。 简单检索可直接使用字段限定检索。
搜索引擎使用-用好搜索逻辑命令
用好搜索逻辑命令 有些搜索引擎支持附加逻辑命令查询,常用的是布 尔(Boolean)逻辑命令与(AND)、或(OR)和非 (NOT)。用好这些命令符号可以大幅提高我们的搜 索精度。 如:前述
computer adventure game
即computer(AND)adventure(AND)games 也可用 policy(OR)goverment
搜索引擎使用-提炼关键词
搜索关键词提炼
要在搜索引擎上搜索信息首先必须输入关键词,所以 说关键词是搜索的开始。大部分情况下找不到所需的信息 是因为在关键词选择方向上发生了偏移,学会从复杂搜索 意图中提炼出最具代表性和指示性的关键词对提高搜索效 率至关重要,这方面的技巧(或者说经验)是所有其他搜 索技巧的基础。 原则是,首先确定你所要达到的目标,在脑子里要形 成一个比较清晰概念,即我要找的到底是什么?是资料性 的文档?还是某种产品或服务?然后再分析这些信息都有 些什么共性,以及区别于其他信息的特性,最后从这些方 向性的概念中提炼出此类信息最具代表性的关键词。
在中文(简体)网页上,查找有关“搜 索引擎的历史”的信息。
[检索式1]:搜索引擎 [检索式2]:搜索引擎 历史 [检索式3]:搜索引擎 历史 -文化 -中国历史 -世界历史 [检索式4]:搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo -文化 -中国历史
3、利用Google的高级检索——限定检索
搜索网站精选Google: : 中文雅虎:/ 新浪搜索:/ 网易搜索:/ 3721中文网址搜索:/ 北大天网搜索:/
Google的字段限定检索
site:限定在某个特定的域或站点中进行检索。 命令格式: 检索词 site:域名 示例:要搜索北京大学山鹰社的信息。检索式:山鹰社 site: inurl:表示限定搜索结果网页的 URL 必须包含所规定的字 符串。 命令格式: inurl:限定的字符串检索词 示例:搜索电子商务软件环境的专题资料。许多中文网站都以 “dzsw‖作为 电子商务专题目录或频道名称。检索式: inurl:dzsw软件环 境 filetype:用来限定命中文件的类型。 命令格式:filetype:文件类型检索词 试析检索式: filetype: ppt信息检索
2、复杂专题信息检索
2.1 分析课题,选择正确的关键词 正确选择关键词、运用Google检索语法规 2.2 Google基本检索语法规则
布尔逻辑检索: 短语或者句子检索: 通配检索:加权检索 例如,检索“internet 上www 的历史”,为 :+www +的历史 internet。 又如,“ www 的历史”中,“的”其实是忽略词,但因为被用 英文双引号引起来,搜索引擎就强制搜索这一特定短语。
搜索引擎使用-细化搜索条件
给出的搜索条件越具体,搜索引擎返回的结果也会越 精确。 比方说你想查找有关电脑冒险游戏方面的资料, 输入game是无济于事的。computer game范围就小一 些,当然最好是敲入computer adventure game,返回 的结果会精确得多。 由于中英文在词语排列上的差异(英文词与词之间有 空格隔开,而中文则没有),使得中文切词成为搜索 引擎的一大挑战。虽然目前支持中文搜索的引擎在切 词方面已做得相当出色,但求其完美无缺也不太现实。 因此在搜索关键词较多的情况下,建议主动将中文字 词之间用空格隔开,以避免过多的无效搜索。比如查 中文电脑冒险游戏的资料,输入"电脑游戏 冒险",而 不是"电脑冒险游戏"。
搜索引擎使用-搜索引擎的选择
搜索引擎分几种,工作方式也不同,因而导致了信息 覆盖范围方面的差异。搜索仅集中于某一家搜索引擎 是不明智的,再好的搜索引擎也有局限性,合理的方 式应该是根据具体要求选择不同的引擎。 日常信息需求大致可分为两种,一种是寻找参考资料, 另一种是查询产品或服务。搜索引擎还分为全文搜索 引擎(Full-Text Search Engine)和目录索引(Search Directory)。 若要查找参考资料,可能的话,全文搜索引擎便自然 成了我们的选择。 如果找的是某种产品或服务,那么目录索引就略占优 势。
相关主题