智能搜索引擎建设
智能搜索引擎建设
搜索引擎是使用某些软件程序(如Robots、 Spiders 等)以一定的策略把因特网上的信 息归类或者人为地把某些数据归入某类别, 形成一个可供查询的大型数据库。使用搜 索引擎能够帮助人们从不同形式的数字化 信息中进行搜集,并对发现的信息进行理解、 提取、组织和处理,快速找到人们所需的信 息,从而起到信息导航的目的。
搜索引擎的搜索原理
搜索引擎尽管种类很多,但其原理都是通 过某种界面与用户交互,接受用户查询请求, 然后将用户查询的特定信息分解成若干关 键词进行分析,再在索引数据库中进行匹配, 挑出符合条件的信息,按照匹配程度的高低 进行排序,最后将结果返回给用户
智能搜索引擎的特征
1) 智能性。智能搜索引擎的搜索器可对特定 站点或者遍历整个因特网自动完成在线信 息的索引,再通过启发式学习采取最有效的 搜索策略,选择最佳时机获取从因特网上自 动收集、整理的信息。智能化搜索引擎可 以将多个引擎的搜索结果整合,作为一个整 体存放到数据库中。
智能搜索引擎的技术实现
知识库 知识库的丰富程度决定着检索程度的高 低,它是实现智能搜索的基础和核心。知识库可以 对信息进行接受、判断、提取、分析和概括之后 形成自己的知识,然后保存,成为下一次分析、概括 的依据和基础,这样它就始终处于一种自增长、自 循环的状态。知识库的知识可粗略分为3 个层面: ①语言层面,反映语言表面现象的知识,如一个词的 多语种形式,它的同义词、反义词、一些习惯用语 和词的层次关系等。②本体论层面,对概念的本体 论的定义与解释,概念之间复杂的语义关系。③常 识层面,一些事物存在着常识上的关联
自然语言理解技术
所谓自然语言,也就是人们日常使用的各种 通俗语言。自然语言理解是计算机学在人 工智能方面的一个极富挑战性的课题,其任 务是建立一种能够给出像人那样理解、分 析并回答自然语言的结果的计算机模型。 从实用性的角度来说,我们所需要的是计算 机能实现基本的人机会话、语义理解或自 动文摘等语言信息处理功能。这其中要利 用到汉语分词技术、短语识别技术、同义 词处理技术等。
智能搜索引擎的特征
4) 个性化。智能搜索引擎有效的分类可为用 户提供个性化的服务,允许用户为自己定制 起始页面,选择感兴趣的内容和经常使用的 服务放在该页面中。
智能搜索引擎技术
智能搜索引擎的研发主要有两大方向,一 是基于机器翻译技术,利用计算机实现自然 语言之间的转变,用户可以使用母语搜索非 母语的网页,并以母语浏览搜索结果;二是基 于语义理解技术,通过搜索引擎技术与语言 学的结合,开发检索词专用词典或是通过全 文扫描和词间关系的分析,实现搜索引擎对 搜索词在语义层次上的理解。
智能搜索引擎的特征
2) 主动性。智能搜索引擎能通过观察用户的 行为,了解用户的兴趣爱好;通过不断的训练 学习,增长智能;通过用户对返回信息的评价, 调整自己的行为。
智能搜索引擎的特征
3) 交互性。智能搜索引擎可以通过自然语言 与用户交互。它采取诸如语义网络等智能 技术,通过汉语分词、句法分析以及统计理 论有效地理解用户的请求,并对搜索结果进 行合理解释。
智能搜索引擎的术实现
要做到智能搜索还必须考虑知识库和信息库结合的问 题。要使两个核心库有机结合就要做到以下3 点。①语义 分析,分析用户语言的具体含义。它应该实现以下几个功 能:第一,分词;第二,处理同义词;第三,根据知识库分析关键 词,明确概念和语义,确定用户真正用意;第四,一定程度的知 识库。②知识管理,主要实现知识库的自增长。前面提到, 知识库增长的基础是对信息库的概括和提取,所以知识管 理首先要做到对信息库的分析和概括,然后是对知识库的 扩充。③知识检索。知识检索是实现智能搜索的最后一环, 通过前面语义分析结果,明确用户用意,对信息库进行知识 (概念) 层次的检索,在给出准确答案的同时,给出用户相关 问题,从多方位对用户的问题进行解答。
智能搜索引擎的技术实现
信息库 信息库指的就是因特网,它是一 个巨大的、非结构化而且不停变化的信息 空间。信息库可以起到两方面的作用。首 先,信息库是知识库存在和发展的空间,知识 库所做的其实就是对信息库的判断、提取、 分析和概括。其次,信息库也是用户所要检 索的内容,智能搜索引擎所做的就是通过知 识库把用户的问题提高到知识(概念) 的层面, 然后利用这个知识(概念) 检索信息库。