当前位置:文档之家› 主要的中文搜索引擎

主要的中文搜索引擎

6.5主要的中文搜索引擎随着Internet在中国的普及和发展,网上中文信息资源和以中文为母语的网上用户也在急剧增加,已有的外文搜索引擎已不能适应我国上网的大部分用户的需求,迫切需要以中文为基础的搜索引擎来满足网上用户查询中文信息资源的要求。

于是许多以中文为母语的国家和地区都相继开发出了各种各样的中文搜索引擎,据统计,目前已有中文搜索引擎200多个。

由于网上的中文信息迅速膨胀,因此,世界级的网站都纷纷涉足中文信息市场。

美国一些著名的搜索引擎公司,如Yahoo!、Altavista、Lycos、Excite等先后推出中文版的搜索引擎,全面进军中国的搜索引擎市场。

下面,介绍几个主要的中文搜索引擎。

6.5.1 中文雅虎(http://gbchinese.yahoo.com)中文雅虎是美国“Yahoo!”公司于1998年5月推出的中文搜索引擎,提供中文简体与中文繁体两种版本。

中国大陆的站点一般使用简体中文,而香港与台湾地区的站点一般使用繁体中文。

中文雅虎并非英文版的全文翻译,而是收录了数万个中文的Internet 站点,按照英文版的分类方法以14个类目列出,提供Internet 上的中文站点信息检索服务。

中文雅虎主页(见图6-10)提供和英文版相同的检索方法:分类目录检索与关键词检索。

图6-10 中文雅虎主页1. 分类目录检索中文雅虎的分类目录位于其主页的中部。

用户可以根据查找的内容所属的类别在分类目录中逐级逐类地选择相应的类目,经过多次选择后,就可以访问到包含所查找内容的站点。

例如,要查找科学领域的内容,首先在主页的分类目录中点击“科学”大类,进入有关科学领域的下级类目页面。

在该页面中,列出有关科学领域的详细分类,如地理学、工程学、能源、生物学、天文学、物理学与图书馆等。

再点击“图书馆”,就会出现有关图书馆方面的站点信息。

2. 关键词检索如果用户已知要查找内容的主题概念,就可以利用关键词检索方式。

在检索文本框中输入要找的关键词,然后点击“搜索”按钮,中文雅虎就会在数据中查找与关键词匹配的记录,并将符合检索条件的结果显示出来。

使用关键词检索还有简单方法与复杂方法之分。

简单方法就是将关键词直接输入检索文本框中,可以输入一个词也可以输入几个词,并对检索要求不加限制,系统在处理时会按照自身的规则将用户的查询字符串分为几个部分,这样返回的结果可能与用户想要的相差甚远。

复杂方法就是利用字段限定符号和限制选项构建复杂的检索表达式来进行检索,这样会获得比较准确的查询结果。

中文雅虎支持以下几种限定检索操作符:(1)用引号(“”)来查询完全符合关键词字符串的网站。

(2)在关键词前加“t:”,搜索引擎仅限在网站名称中查找。

(3)在关键词前加“u:”,搜索引擎仅限在URL中查找。

(4)在关键词前加“+”,查询结果中一定要出现“+”号后面的字符串。

(5)在关键词前加“-”,查询结果中一定不能出现“-”号后面的字符串。

6.5.2 搜狐(http://)搜狐是爱特信公司创办的大型中文门户网站,于1998年2月正式推出。

2000年9月14日搜狐收购国内最大的年轻人社区网,成为中国最大的门户网站。

搜狐公司从中国首家大型分类查询搜索引擎,发展成为最受用户喜爱的综合门户网站。

1999年至今,搜狐公司连续推出新闻中心、体育、财经、IT、汽车、生活、教育、求职、搜狐商城等17个内容频道,为广大网民提供网上社交、学习、生活和购物的理想场所,成为中国网络用户进入互联网的最佳渠道。

搜狐比较规范、系统的分类目录与强大的全文检索为广大用户提供一个优秀的中文信息查询工具。

用户可以直接通过搜狐网站首页(见图6-11)上的分类目录和关键词搜索方法查找信息,也可以点击首页中的“搜索引擎”进入“分类搜索”页面进行目录导航检索和关键词检索。

1. 目录导航检索目录导航检索是按照信息所属的类别层层点击查找信息,所以用目录导航检索时首先要考虑清楚想要查找的信息属于哪个类别。

比如查找“计算机杀毒软件”,首先浏览搜狐的分类目录(见图6-12),看到“计算机与互联网”类目,应当是属于这个类目,点击进入,下面有“软件”,点击“软件”进入,下面有“病毒与安全”,再点击“病毒与安全”进入,下面有“杀病毒软件”,最后点击进入“杀病毒软件”就会找到许多有关杀病毒软件的的网站。

目前,搜狐“分类目录”共有十八大类,包括:娱乐休闲、工商经济、公司企业、文学、国家与地区、计算机与互联网、教育、艺术、体育与健身、卫生与健康、生活服务、社会与文化、社会科学、新闻与媒体、科学与技术、旅游与交通、政治与法律、个人主页,五万多不同层次的子类目,形成了一个十分庞大的树枝状结构,几乎涉及到所有行业或领域。

用户只要遵循一定的查询规律(与图书馆的图书分类法类似),就能很快找到需要的所有网站信息。

图6-11搜狐首页图6-12 搜狐分类搜索页面2. 关键词检索关键词检索是按照信息的主题内容来查找信息,在搜狐的搜索框内输入想要查找的信息的关键词,然后点击“搜索”按纽,系统就会自动查找与关键词匹配的信息,并且在页面上将这些信息提供给用户。

在搜狐的首页或搜狐网站的分类与搜索主页及其下的任何页面上,都会看见一个长条状的搜索框。

搜狐的“搜索”工具提供网站、类目、网址、网页、新闻、软件等类信息的查找。

用户只要做简单的选择,就能找到相关的信息,选择的方法是通过搜索框后面的下拉式菜单进行选择,或直接在搜索框下进行选择。

当使用搜狐的“搜索”工具进行查找时,其默认选项为“网站”搜索,其搜索结果是搜狐分类目录下网站信息中的内容。

各选项及其查询范围如下:(1) 搜狐类目:检索结果页列出相关的搜狐检索类目。

(2) 网站搜索:检索结果页列出搜狐分类搜索数据库中,在网站名称、网站简介或网站关键字中含有与键入的关键字相匹配的内容的所有相关网站。

(3) 网页搜索:除了相关检索的一些链接之外,检索结果页列出整个Internet上与键入的关键字相匹配的内容的所有相关网页。

(4) 新闻搜索:检索结果页列出三个月内出现在搜狐新闻库中,包含用户输入的关键字的相关新闻。

(5) 网址搜索:检索结果页列出3721网站的数据库中,在网站名称中含有与用户键入的关键字相匹配的内容的所有相关网站。

3. 高级检索从分类搜索页面点击“高级检索”进入高级检索页面(见图6-13)。

在高级检索页面提供下列选项:(1) 搜索包含:可以指定查询结果中包含的关键词,即希望返回的网页包含“所有输入的关键词”或者“至少其中一个关键词”。

(2) 编码选择:可以指定查询结果的编码类型,即希望返回的网页是“简体(国标码)” 、“繁体(大五码)”,还是两者都要(“简体及繁体”,此为默认选择)。

每种编码类型前有一个圆框,用户只需点中其一即可。

(3) 类聚方式:可以指定查询结果的类聚方式,即希望返回的网页是“内容类聚”、“站点类聚”,还是两者都要(“站点类聚及内容类聚”,此为默认选择)。

每种类聚方式前有一个圆框,你只需点中其一即可。

所谓“内容类聚”是指同一个内容的网页只出现一次,而不管整个INTERNET 上有多少个不同的URL指向该网页。

也就是说,“内容类聚”屏蔽掉了同样内容的网页,只提供其中一个URL供用户浏览使用。

而“站点类聚”则只给用户提供相关网站的主页的URL,屏蔽掉了同一个网站中各个不同的页面。

但是, 用户可以通过相关摘要底下的URL访问到该网站所有的页面。

(4) 时限选择:还可以指定查询结果中网页的生成时间,目前有四种选择:“任何时间的网页”(默认选择)、“三个月内的网页”、“六个月内的网页”、“一年内的网页”。

生成时间是一个下拉菜单,用户可以从中选择。

搜狐检索系统目前支持的运算符有:-、&、|、()、空格。

这些运算符既可以是英文,也可以是中文(全角或半角)。

a.使用空格、&,来指定查询串必须出现在结果中。

例如:输入“modem 鼠标”,搜索结果是包含“modem”,并且包含“鼠标”的所有网页。

b.使用 - ,来限定-后的查询串不出现在结果中。

例如:输入“宗教 - 法轮功”,会找到仅包含“宗教”的所有网页,且不包含“法轮功”的网页。

c.使用 | ,来指定|两边的查询串中有一个一定出现在结果中。

例如:输入“计算机 |软件”,搜索结果是含有“计算机”或“软件”的所有网页。

d.使用()或“”,来指定()或“”内的表达式是一个整体单元。

例如:输入“计算机 - (软件硬件)”,会查询到包含“计算机”,且不包含“软件”与“硬件”的所有网页。

图6-13搜狐高级检索页面4.修改检索“网页搜索”的结果页面中,还有相关检索的一些链接,最下部是一个搜索框,你可以在其中输入新的字串,按“重新搜索”按钮进行另一次新的搜索;按“在结果中搜索”按钮在结果中搜索,以对用户的搜索进行精确化。

例如,第一次查找“计算机”时返回了太多网页,用户可以在此框中输入“家用电脑”在结果中查询,本引擎会为你查出更为相关的内容。

5. 检索结果的排列搜狐中文检索系统引擎会根据分类类目及网站信息与关键字串的相关程度来排列出相关的搜狐中文类目和网站。

相关程度越高,排列位置越靠前。

6.5.3 新浪网()新浪网搜索引擎是面向全球华人的网上资源查询系统。

提供网站、网页、新闻、软件、游戏等查询服务。

网站收录资源丰富,分类目录规范细致,遵循中文用户习惯。

目前共有16大类目录,一万多个细目和二十余万个网站,是互联网上最大规模的中文搜索引擎之一。

新浪网推出新一代综合搜索引擎,这是中国第一家可对多个数据库查询的综合搜索引擎。

在关键词的查询反馈结果中,在同一页面上包含目录、网站、新闻标题、新闻全文、频道内容、网页、商品信息、消费场所、中文网址、沪深行情、软件、游戏等各类信息的综合搜索结果,最大程度地满足用户的检索需要,使用户得到最全面的信息。

除了资源查询外,新浪网搜索引擎推出了更多的内容和服务,包括:新浪酷站、本周新站、引擎世界、少儿搜索、WAP搜索、搜索论坛等。

图6-14 新浪搜索引擎主页1. 一般搜索功能新浪搜索引擎提供“分类检索”和“关键词查询”两种查找方法。

(1)分类检索分类检索是从搜索首页按照树型的主题分类逐层点击来查找所需信息的方法。

如果我们想看看小说,但又不是很明确具体是哪一部小说,就可以采用分类检索,也即目录查询方式。

从新浪网首页点击“新浪搜索”进入搜索引擎主页(见图6-14)。

在搜索引擎主页中的14大类目录中点击“文学艺术”目录,再选择“文学”目录点击进入,这时页面中上部列出的是文学目录的细分目录,下部列出的是属于文学目录的网站。

可以继续点击文学的子目录“各类文学”中的“小说”目录。

同样,这时页面中上部列出的是小说目录的细分目录,下部列出的是属于小说目录的网站。

这时就可以选择想要看的网站进入浏览了。

相关主题