当前位置:文档之家› 语义搜索的分类

语义搜索的分类

语义搜索的分类一.按语义搜索引擎服务内容的分类语义搜索引擎从人们头脑中的概念到在搜索领域占据一席之地经历不少坎坷。

语义网出现后,语义搜索迎来了高速发展的机遇期。

虽然语义搜索服务内容主要集中在传统搜索引擎不擅长的语义网搜索方面。

不过语义搜索引擎也试图拓展服务范围,提供比传统搜索引擎更全面的服务。

语义搜索引擎的服务内容主要包括以下几个方面:知识型搜索服务、生活型搜索服务、语义工具服务等。

(1)知识型搜索方面,主要针对语义网知识信息资源。

其中包括:①词典型搜索服务。

一种形式是如同使用电子词典一样,通过关键词直接查询与关键词对应的概念。

这些概念由语义搜索引擎索引的本体文件中提取。

另一种形式则是对在线百科全书的搜索服务,如PowerSet,这一点与传统搜索引擎近似,但语义搜索引擎在信息的组织上远胜于传统搜索引擎。

②语义网文档(SWD)的查询服务。

用户可以通过语义搜索引擎查询所需的语义网文档和相关的语义网文档。

Falcons 为统一资源标识符(URI)定义的语义网对象和内容提供基于关键词的检索方式。

Swoogle 从互联网上抽取由RDF 格式编制的语义网文档(SWDs),并提供搜索语义网本体、语义网例证数据和语义网术语等服务。

③领域知识查询。

部分语义搜索引擎提供了针对某个或某几个专业门类的信息检索服务,用户可以选择自己所需相关信息。

Cognition 以搜索法律、卫生和宗教领域为主。

个别语义搜索引擎提供针对特定领域的多媒体语义搜索服务,如Falcon-S 对足球图片的搜索服务。

不过多媒体语义搜索面临与传统多媒体搜索相似的困境,缺乏有效的语义标注。

对多媒体信息的辨别和分类能力仍有待提高。

(2)生活型搜索方面,语义搜索引擎在传统搜索引擎力所不及的诸方面发展迅速。

①社会网络搜索。

部分语义搜索引擎提供社会网络搜索功能,这种功能可以实现通过姓名、著作、所在单位等信息中的一条或几条,查询与这些信息有关联的更多信息,如我国的ArnetMiner。

②资讯搜索。

目前语义化的网络搜索服务能够更有针对性,更准确地为用户提供新闻资讯。

Koru就是这方面的代表。

(3)语义工具服务。

这是语义搜索引擎所属的研究机构的一个较为独特的方面,和传统搜索引擎提供的桌面搜索等工具不同,语义搜索引擎提供的语义工具一般不是对语义搜索功能的直接移植,而是对文档的相似性、标注等进行处理用的。

这些工具可以为语义搜索引擎的索引对象进行前期数据加工,同时也供科研使用。

理论上讲语义搜索引擎能够提供包括普通网络文档检索在内的所有类型网络文档搜索服务,但是由于语义搜索引擎对网页的索引方式不同,微处理器需要比传统搜索更长的时间才能分析完一个页面,因此很多语义搜索网站只能扫描到外部网站的二级页面,这样将难以满足用户全网络搜索的需求。

二.按语义搜索引擎服务模式分类语义搜索引擎高速发展的阶段正值传统搜索引擎发展的平台期,虽然语义搜索引擎暂时尚不具备传统搜索引擎的市场竞争力,但是它们却可以很容易地借鉴传统搜索引擎的成功服务模式,用相同或相似的方式提供自己的特色服务。

(1)传统型服务模式。

这些来源于传统搜索引擎的服务方式可以称作传统型服务模式。

语义搜索引擎所借鉴的服务方式主要是其中的两种:即简约型服务模式和专门型服务模式。

①简约型服务模式。

由于用户的检索行为对信息检索系统的服务模式产生巨大的影响,因此如何在尽可能不影响用户检索体验而实现方便快捷的搜索服务,则成为语义搜索引擎的一个重要标准。

许多语义搜索引擎就采取了与传统搜索引擎相一致的搜索界面,并允许用户以关键词的方式提交搜索请求,尽可能贴近用户操作习惯。

②专门型服务模式。

语义搜索引擎对搜索对象的标引和信息提取等要求高于传统搜索引擎,导致其信息加工时间延长而不利于全面网络搜索。

因此语义搜索引擎扬长避短,展开专门领域的垂直搜索。

(2)创新型服务模式。

语义提取和运用是语义搜索引擎的独到之处,因此也有很多语义搜索引擎以此为契机,摒弃了传统搜索引擎简化单一的服务模式,以用户的搜索行为和搜索服务特色为基础,推出了创新的搜索服务模式。

即精确应答服务模式、刻面搜索服务模式和查询引导型服务模式等。

①精确应答服务模式。

除直接搜索语义网文档之外,语义搜索引擎还能够根据某一个查询需求获得相关的本体数据,可以通过输入关键字与某一个分类,某一个语义关联或者实例信息匹配,并将相关的部分本体文件以片断的形式反馈给用户,这种简洁的搜索结果就是用户提出的问题的答案。

这类的典型代表包括Swoogle, Falcons, Sindice 和Watson。

②刻面搜索服务模式。

为了更好地发挥语义搜索对用户搜索过程的指导作用,语义搜索引擎在用户接口方面做出了很大改动,采取了更为复杂但符合用户使用习惯或具有针对性的搜索界面。

其中著名的当属刻面搜索(faceted search),这种搜索方式不但可以集成分词过滤或多种搜索条件,而且还可以针对不同的搜索结果类型分开显示【10】。

③查询引导型服务模式。

语义搜索引擎在实现查询提问的歧义消除方面拥有独到的优势。

在有了更好的语义匹配作保障的情况下,通过引导用户逐步细化查询可以更准确地呈现搜索结果。

koru 采用了独特的横向三页面模式(如图2 所示),按照建立适当查询、浏览文档列表、深入阅读所选文档这一网络用户检索习惯的步骤逐级引导用户。

三.按本体技术在语义搜索中的作用分类可将语义搜索分为三类:基于传统搜索的增强型语义搜索、基于本体推理的知识型语义搜索及其他形式的语义搜索。

(1)基于传统搜索的增强型语义搜索这一类型的语义搜索利用语义技术来改善传统搜索的效果。

其核心仍然是传统的搜索引擎,本体技术以多种途径被用来增强关键字搜索,改善搜索的查全和查准率。

关键词在本体中被检索,其他不同的概念通过图搜索的方式也被检索出来,与这些概念相关的词被用来扩展或者约束搜索。

(2)基于本体推理的知识型语义搜索这一类型的语义搜索以本体构建的知识库为主体,通过本体知识库推理实现知识发现型的语义搜索。

根据搜索对象的不同,我们可将其分为概念搜索和关联搜索。

2.1概念搜索根据用户查询的复杂程度,概念搜索可分为两类,一为简单概念搜索,二为复杂约束概念搜索。

①简单概念搜索知识库中包含有正式的语义信息,主要是指概念、实例和关系。

事实上用户感兴趣的数据并不是抽象的领域知识如“人”这样的笼统概念,而是属于某个概念的具体实例信息。

因此,概念搜索的任务是快速有效地检索出属于某个概念的所有实例。

简单概念搜索中用到的一般性方法是关键字和概念之间的匹配算法。

②复杂约束概念查询在查询中,可能会出现诸如此类的复杂约束查询,如:检索所有的老师,这些老师在20世纪60年代出生,同时指导80年代出生的硕士生完成研究生阶段学习,该查询属于典型的复杂约束概念查询。

复杂约束概念查询在实现的过程中,万方数据通常需要检索出一组概念,概念之间通过特定的联系被连接在一起。

在语义Web环境中,复杂约束概念查询的形式化不难实现。

主要问题在于对用户来说如何表达复杂的约束查询并不容易。

因此,研究者们在用户查询接口方面已经展开了相关研究,其目的在于尽可能为用户提供较直观的查询模式。

文献[33]实现了图形化的用户接口GRQL,该接口可创建基于本体浏览的图模式查询。

查询定制的步骤为:首先选中本体中的概念,所有与此概念相关的属性被显示出来以供扩展。

然后点击选中的属性,通过约束该属性扩展查询图,也可选择该属性的值域概念作进一步扩展。

其他约束操作也可以在查询模式上执行,如可将某些概念限定为子概念,也可限定某些属性为子属性。

文献[34]描述了另一种图形化查询界面。

用户给出了领域模式来选择查询开始点,查询的定制可以通过属性限制概念,也可以是概念的可兼容性替代,例如用子概念或父概念替代此概念。

2.2关联搜索大部分研究者都将语义搜索定义为语义网中对资源的搜索,利用基本推理功能,找到用户需要的相关资源。

该定义满足了大部分情况下的用户请求,但遗漏了实际上可能普遍存在的一类搜索,称作“关联搜索”,关联搜索在语义Web中搜资源间的关联关系,资源间的链接路径在某些特定领域比资源本身更具价值,比如在国家安全领域通常需要搜索资源之间的链接关系,这些关系可能意味着某些潜在的安全威胁。

关联搜索中的主要问题在于,如何定义链接的兴趣尺度,且这种定义方法不仅能够消除用户不感兴趣的关联关系,而且可以搜索到数据之间复杂的、隐藏的关联关系。

关联关系搜索的结果排序[38-39]也是语义搜索需要解决的关键技术,知识库中实体之间关系的个数可能会超出实体本身,语义关联就是指实体之间的复杂关系。

传统搜索引擎采用的搜索结果排序方法只能对文本信息进行排序,无法对结构信息排序,无法满足语义搜索结果的排序。

目前多是结合传统搜索引擎结果排序算法和信息检索技术,尝试新的语义搜索结果排序方法。

(3)其他类型的语义搜索华盛顿大学(University of Washington)Turing中心是一个多学科交叉的研究中心,其开发的KnowltAll系统用于提取web上的信息,目的在于构建一个人工智能系统,该系统在足够长的生命周期内可构建基于整个web的知识库,以实现未来用信息提取的方式取代搜索引擎。

语义搜索通过推导出知识库中的隐含知识,实现对语义的识别,如利用包含关系扩展搜索中的语义。

文本注解形成RDF图。

RDF图的遍历通过spread activation算法实现。

本体中的弧线根据兴趣给出权重,附加信息和查询相关联。

上海交通大学和香港科技大学联合提出一种增强的语义搜索模型[4 7。

该模型认为关键字是本体中的概念,概念的实例属于某个概念是具有模糊值的。

模糊逻辑的形式化被用来计算相关性。

该模型针对语义portal进行搜索,将传统的信息检索技术引入结构化查询,其推理的实现基于模糊描述逻辑(fuzzy DI.)参考文献:1.《传统搜索引擎与语义搜索引擎服务比较研究》赵夷平(吉林师范大学图书馆,吉林四平136000)2.《语义搜索研究综述》文坤梅卢正鼎孙小林李瑞轩(华中科技大学计算机科学与技术学院武汉430074)。

相关主题