第30卷第8期
2013年8月 计算机应用与软件
Computer Applications and Software V0l_30 No.8
Aug.2013
基于语义网的农业学习资源推荐系统研究
王俊红
(仲恺农业工程学院广东广州510225)
摘要 为了提高农业学习资源推荐准确性,构建基于语义网的农业学习资源推荐系统模型。该系统综合考虑学习者评价的核
心概念和学习资源两个影响学习者相似度的因素,利用核心概念问及学习资源间的语义相似度,算出学习者的相似度,并以此作为
学习资源推荐的依据。实验表明该系统不仅能提高农业学习资源推荐的有效准确,而且能解决新学习者由于无访问记录而找不到
邻居,无法实现推荐的“冷启动”问题。
关键词 语义网 农业学习资源核心概念
中图分类号TP3 文献标识码A 语义相似度 玉米本体
DOI:10.3969/j.issn.1000—386x.201 3.08.064
oN AGRICULTURAL LEARNING RESOURCE RECoMMENDATIoN SYSTEM
BASED oN SEMANTIC WEB
Wang Junhong
(Zhongkai University ofAgriculture and Engineering,Guangzhou 510225,Guangdong,China)
Abstract In order to improve the accuracy of agricultural learning resource recommendation,in the article we construct the semantic web—
based agricultural learning resource recommendation system mode1.The system comprehensively considers two factors that influence the simi—
larity of learners,the one is the core concept,the other is the learning resource,both are evMu ̄ed by the learner.The similarity of learners
is calculated by using the semantic similarity between the core concepts and between the learning resources,and is emplwed as the basis of
learning resources recommendation.Experiments show that the system not only improves the effective and accurate recommendation of agricul・
tural learning resources。but also solves the“cold start”problem of the new registered learners caused by no visit records.
Keywor ̄ Semantic web Agricultural learning resource Core concept Semantic similarity Corn ontology
0 引 言
随着农业信息化建设和E—learning的发展,出现了越来越
多的农业学习资源站点。但在海量的信息资源中想要查找所需
的学习资源存在一定的困难,特别是对农村基层群众尤为困难,
所以迫切需要建立农业学习推荐系统。
推荐方法或推荐技术是整个推荐系统的核心,很大程度上
决定了推荐系统性能的优劣。根据推荐的依据不同分为基于规
则的推荐、基于内容的推荐、协同过滤推荐等。
基于规则的推荐技术根据管理员制定的一系列规则,然后
利用制定的规则度量项目间的相互关联性,将关联密切的项目
推送给用户…,然而规则的制定和维护困难。
基于内容的推荐技术是建立在资源的内容信息上进行推荐
的,而不需要依据用户对资源的评价意见,更多地需要用机器学
习的方法从关于内容的特征描述的事例中得到用户的兴趣资
料,然而存在只能处理文本类型学习资源、不能为用户发现新的
感兴趣的资源 等问题。
协同过滤推荐方法通过分析用户之间的关系进行推荐,把 相似用户浏览的资源作为推荐的内容。协同过滤技术虽然克服
了基于内容推荐方法不能为用户发现新的感兴趣资源的缺
陷 J,但存在用户评价矩阵稀疏性、新资源无评价及新用户未
评价任何资源的冷启动…等问题。
以上这些推荐方法或混合以上两种的推荐方法,都未考虑
资源在语义上的相似性,因此无法实现准确的推荐。语义
webL4 的出现为有效准确地学习资源推荐提供了一种新思路。
1 系统模型
基于语义网的农业学习资源推荐系统主要由农业学习资源
管理组件和基于语义的推荐组件组成。为了实现基于语义的推
荐,需要本体库的支持,本文选取研究成熟的玉米本体 及其
相关学习资源,在资源推荐时利用玉米本体中概念间的关系计
算不同用户的兴趣相似度,根据最近邻居的兴趣实现推荐算法,
从而提高资源推荐的有效性和准确性。系统模型如图1所示。
收稿日期:2012—09一l1。仲恺农业工程学院校级科研项目 (G3100020)。王俊红,讲师,主研领域:语义网,农业信息化。
234 计算机应用与软件 2013正
学
2推荐算法 图1搜索引擎系统框架
算法的总体思路是根据学习者的浏览行为和对学习资源的 评分得到学习者感兴趣的核心概念集合和学习资源集合,然后
根据领域本体中概念间的关系分别计算某两个学习者评价的所
有学习资源集合间的语义相似度和所有核心概念集合间的语义
相似度,最后根据以上得出的两个相似度值共同决定学习者兴
趣的相似性,找到具有相似兴趣的最近邻居,从而实现学习资源
的推荐。
2.1获取学习者兴趣
获取学习者感兴趣的核心概念和学习资源的主要途径有:
1)学习者注册时填写体现学习者兴趣的核心概念,为保证 核心概念的准确性,供选择的选项是参照玉米本体 中概念
来设置的。从提高兴趣度方面考虑,当出现两个或多个概念上
下位关系时,一律选择下位概念,并写入学习者兴趣模型中。如
同时订制了玉米和甜玉米,系统会合并两个相近的兴趣关键词,
只保留甜玉米。
2)跟踪学习者的查询确定用户感兴趣的核心概念。学习
者提出的查询请求通常能直接反映其兴趣,因此可以把频繁使 用的查询关键词提取出来作为核一t2,概念 J。
3)跟踪学习者的浏览行为确定学习者感兴趣的学习资 源l71,如:下载、收藏、推荐、学习时长、学习次数等,并把这些行
为加权转化为用户对资源的隐式评分。
4)学习者对核心概念和学习资源的显式评分。
2.2核心概念语义相似度计算
在树状的本体结构模型中,概念的语义相似度就可使用概
念间距离来度量,即通过度量两个概念的最短路径距离来表示 它们的语义相似度。两个概念的距离越大,其语义相似度越低;
反之,两个概念的距离越小,其语义相似程度越大。
此外,概念所处的节点的深度和该深度上节点个数对语义
相似度计算也有影响 。
定义1设根节点概念为cr,令cr的深度为1,则任一非根 节点概念c 在树中的深度Dep(Ci)=Dep(Cp)+1,其中cp为
概念 的父概念。
同样距离的两个概念,概念相似度随着他们所处层次的总 和的增加而增加,因为,层次总和的增加意味着分类趋向细致,
和同样概念距离的层次总和较小的概念对比较,其相似程度就
越高。
定义2.概念所处的节点深度对概念语义相似度的影响 因子:
= ㈩ ; ¨
其中,c 为 和 的共同祖先节点中深度最大的节点。
定义3一个核心概念节点C的直接孩子概念结点个数称
为核心概念节点的宽度,记为Width(C)。
定义4如果一个核心概念节点的宽度为Wi&h(C),则从
它引出的连接到每条孩子节点的边的强度为1/Wi&h
(C) J,即:
S(C)=1 ̄Width(C) (2) 从核心概念节点 到另一个核心概念节点q(不包括 )
所经历的节点称为从 到 的路径,记为P(Ci, )上所有边
的强度之和记为:
s(P(Ci, ))= ∑s(c) C∈P一(Ci,0) 定义5核心概念节点的语义相似度 为:
Sire(a,q)=0c・ 1+SfJP(Cr.C 1+S(P(Cr,CO"))+5(P( , ))+S(P( ,q))
(3)
其中,Ot为定义2中的影响因子,cr为根节点。
2.3学习资源语义相似度计算
将学习资源按照树状结构组织后,学习资源的语义相似度
也可以按照核心概念的语义相似度方法计算,所以
定义6学习资源的语义相似度:
RSim(RCi,R )= ・
1+SfPfRCr.RC 1+S(P(RCr,Rcq))+S(P(Rcq,RCi))+S(P( C ,R(了)) (4)
其中,RCi、RCj为学习资源节点,RCr为学习资源根节点,影响因
= 一 望 ( 2 Dep(RCi)+Dep(Rcj)。
2.4核心概念评分对学习者相似度的贡献
定义7核心概念评分对学习者相似度的贡献
Diff(Ua,Ub, ): (5) O 其中k为核心概念, 、矾为对核心概念k评分的学习者,
SUak、SUbk为 、珊对核心概念k的评分, 为评分矩阵中所
有用户对核心概念 评分的最高分。
2.5学习资源评分对学习者相似度的贡献
同核心概念评分对学习者相似度的贡献计算:
RD/y(Ua,Ub, ): (6)
其中r为学习资源, 、珊为对核心概念r评分的学习者,SUar、
SUbr为 、册对核心概念r的评分,占为评分矩阵中所有用户
对核心概念r评分的最高分。
2.6根据核心概念计算用户相似度
KCSim(Ci,a,Ua,Ub)为根据核心概念计算用户相似度,它
与核心概念节点的语义相似度及核心概念评分对学习者相似度
贡献值成正比关系,根据式(3)和式(5)得:
KCSim(Ci,cj,Ua,Ub)=Sire(C ,cj)XDiff(Ua,Ub,Ci)X
D ,珊, ) (7)
2.7根据学习资源计算用户相似度
同根据核心概念计算用户相似度,根据式(4)和式(6)得:
KRSim(RCi,Rcj,Ua,Ub)=RSim(RCi,Rcj)X D Ua,Ub,