当前位置:文档之家› 个性化推荐技术综述

个性化推荐技术综述

个性化推荐技术综述
在互联网时代,各类信息层出不穷,用户往往面临着“信息过载”的困扰,难以在大量信息中找到有价值的信息。

而个性化推荐则通过用户的兴趣特点和历史行为快速高效的为用户推荐用户感兴趣的信息或商品。

通常情况下,根据推荐方式的不同,推荐技术大概可以分为以下几个类型:
1.协同过滤的推荐算法
协同过滤推荐算法由Goldberg、Nicols、Oki和Terry 在1992年提出,该算法应用在Tapestry系统。

Breese 等人将协同过滤推荐技术分为两种类型,一种是基于内存的协同过滤方法,另一种是基于模型的协同过滤方法,各自常用的算法如图1所示。

基于内存的协同推荐( memory-based collaborative filtering) 也称为启发式的协同推荐,主要直接利用用户的历史数据来提供预测结果。

根据相似性度量的对象的不同,基于内存的协同过滤又分为User-based 协同过滤和Item-based协同过滤。

User-based 协同过滤的基本原理是如果一些用户对一些物品评价的分数比较接近,那么通常情况下他们评价其它物品的分数也会很接近。

那么我们要得到某个用户对物品的评分时,就可用和该用户评分相似的其他用户对目标物品的评分去估计。

Item-based协同过滤的基本原理是如果一些物品的典型特征具有相似性,那么同一个用户对他们的评分是接近的。

基于上述原则,如果我们得到用户对和目标物品相似的其它物品的评分时,那么我们就可以通过这些分数来逼近用户对目标物品的评分。

基于模型(Model-based)的推荐算法是首先通过用户-项目评分矩阵训练得到一个决策模型,在为目标用户进行推荐时,利用该离线模型为用户进行预测产生推荐结果。

大致理念就是通过机器学习算法,在数据中找出模式,并将用户与物品间的互动方式模式化。

该方法无需了解用户及物品的特征,在大多数情况下都能得到令人满意的结果,但需要解决冷启动的问题。

图1常用的协同过滤算法
2.基于内容的推荐算法
基于内容的推荐算法的原理是找到和用户喜欢物品相似的物品,然后推荐给用户,这是推荐算法中比较常见而且容易的一种做法。

内容推荐算法过程的第一步是为用户创建喜好和兴趣特征信息,本质是一个属性描述文件。

然后再为目标项目建立特征文件,最后通过对比目标项目的特征和用户兴趣爱好特征的相似程度来确定是否推荐该目标项目给用户。

如果用户的兴趣喜好特征不好建立,我们也可以通过对比用户喜好的项目与目标项目特征的相似程度的高低来决定是否推荐该项目。

基于内容的推荐算法主要基于信息检索技术和信息过滤技术,除了传统的文本信息检索方法以外,基于内容的推荐算法还增加了机器学习、数据挖掘等领域相关的技术和方法。

基于内容的推荐算法的优点有: 使用描述文件可以较好地呈现物品的典型特征而用于匹配相关信息。

推荐的理由可以通过列举推荐物品的典型特征而明显地找到。

其缺点也很明
显:项目必须能够容易地抽取出典型的特征,即要求项目的数据非常结构化。

对于非结构化的音乐、视频、图形等多媒体文件,其本质是二进制文件,无法有效地提取文件的特征数据,只能依靠人工进行手动建立。

3.基于知识的推荐算法
很多推荐算法都无法解决冷启动问题,因此不少专家提出基于知识的推荐,希望利用用户的需求爱好、产品知识和功能知识来为用户推荐项目,该方法在某种程度可以看成是一种推理技术。

该方法可以分为3 类: 基于约束的推荐、基于实例的推荐和基于知识推理的推荐系统。

由于不需要用户的历史行为数据,所以不存在冷启动问题,但也存在不少问题,例如如何获取、如何表示领域知识以及在推荐系统中采用哪种交互模式等。

4.混合的推荐算法
鉴于各种推荐方法都有优缺点和技术特点,且具有将强的互补性,因此在实际推荐系统中,通常采用组合推荐的方式来对用户做出推荐。

目前的组合推荐方法中,较为流行的是将协同过滤和基于内容推荐相结合,最简单的做法就是用协同过滤推荐方法和基于内容的方法分别得到一个推荐结果,最终结果由这两者然后按照一定的原则组合产生。

尽管在理论上有很多种方法的组合方式,但在实际应用中解决某一问题时并不见得都有效,因此在混合式的推荐技术中,一个最重要原则就是根据实际情况选择合适的组合方式,使得组合后的推荐方法能够扬长避短,避免或弥补各自的缺点。

相关主题