当前位置:文档之家› 文献综述-餐饮电子商务个性化推荐系统推荐算法

文献综述-餐饮电子商务个性化推荐系统推荐算法

科研训练文献综述餐饮电子商务个性化推荐系统推荐算法研究院系:软件学院班级:1105班姓名:学号:指导老师:2013/9/15餐饮电子商务个性化推荐系统推荐算法研究The Research on recommendation algorithm of Recommendation System in Catering E-Commerce餐饮电子商务个性化推荐系统推荐算法文献综述摘要:随着电子商务的快速发展,大数据以及云计算时代的到来,个性化推荐系统成为了电子商务网站的核心技术之一。

本文分析了个性化推荐的特点,发展。

作为个性化推荐系统的核心----推荐算法,本文讲述了常见的几种算法(协同过滤,基于内容推荐,社会网络(二部分图)算法,混合算法),比较了这几种算法的优劣。

最后根据餐饮的特点,作者提出了自己的一些关于推荐算法的想法。

Abstract:With the rapid development of e-commerce, the advent of the era of big data and cloud computing, personalized recommendation system has become one of the core technology of e-commerce sites. This paper analyses the characteristics of personalized recommendation, development. As the core of the personalized recommendation system, recommendation algorithm, this paper tells the story of several common algorithm (collaborative filtering and content-based recommendation, social network (2 parts) algorithm, the hybrid algorithm), comparing the several kinds of advantages and disadvantages of the algorithm. Finally according to the characteristics of the food and beverage, the author put forward some ideas about the recommendation algorithm.关键字:数据挖掘;推荐系统;个性化;协同过滤Key words:data mining; Recommendation system; Personalized; Collaborative filtering一、概述信息爆炸的现代互联网时代,简单搜索引擎已无法满足用户在海量信量中获取信息的需要,信息的利用率降低。

为解决这一问题,研究人员提出了个性化推荐系统,可有效地解决在单个的互联网用户在海量信息中的获取有用信息的问题。

个性化推荐系统是通过分析用户的历史行为,提示用户习惯和喜好,建立相应的推荐算法,为每个用户产生一个推荐列表,使其可以快速地找到自己感兴趣的信息。

上世纪末,推荐系统主要应用于音乐、电影、书籍等产品的推荐。

近年来,推荐系统已被广泛地应用于电子商务领域,成为电子商务中不可缺少的一部分,各大电子商务网站,如Amazon、ebay都不同程度的使用了推荐系统,显著地提高了电子商务企业的销售额,同时也为用户搜索商品提供了方便。

与此同时对推荐系统的研究在理论上促进了多学科的交叉发展。

设计出更优秀的推荐算法已经成为理论界关注的热点。

目前为止,学者们提出了基于内容的推荐算法、协同过滤推荐算法、基于复杂网络的推荐算法、混合推荐算法等不同的算法,数据挖掘领域、机器学习领域的一些新方法也被应用到推荐算法中。

二、推荐系统的基本概念和关键问题2.1 推荐系统的定义推荐系统的定义有不少,但被广泛接受的推荐系统的概念和定义是Resnick和Varain锄在1997年给出的:“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。

简单来说就是起到了一个导购员的作用。

2.2 推荐系统的发展个性化推荐系统作为一个独立的概念提出源于20世纪90年代。

1995年,卡耐基.梅隆大学的RobertArmstrong等人在美国人工智能协会上提出了个性化导航系统Web Watcher;斯坦福大学的MarkoBalabanovic等人在同一会议上推出了个性化推荐系统LIRA;1995年8月,麻省理工学院的Henry Lieberman在国际人工智能联合大会(IJCAI)上提出了个性化导航智能体Letizia;1996年, Yahoo 推出了个性化入口My Yahoo;亚马逊的图书推荐系统成果应用引来学术界的研究热潮。

1997年,AT&T实验室提出了基于协作过滤的个性化推荐系统PHOAKS和Referral Web;1999年,德国 Dresden技术大学的Tanja Joerding实现了个性化电子商务原型系统TELLIM;2000年,NEC研究院的Kurt等人为搜索引擎citeseet 增加了个性化推荐功能;2001年,IBM公司在其电子商务平台Websphere中增加了个性化功能,以便商家开发个性化电子商务网站。

2003年,Google开创了AdWards 盈利模式,通过用户搜索的关键词来提供相关的广告。

AdWords的点击率很高,是Google广告收入的主要来源。

2007年3月开始,Google为AdWords添加了个性化元素。

不仅仅关注单次搜索的关键词,而是对用户一段时间内的搜索历史进行记录和分析,据此了解用户的喜好和需求,更为精确地呈现相关的广告内容。

2008年,开源分布式平台和技术开始渐渐流行,为超大型电子商务网站应用推荐引擎技术奠定了基础。

Hadoop及其子平台Hive、Pig等获得青睐。

专注于分布式推荐系统引擎算法和机器学习算法的apache项目Mahout也在不久后问世。

2.2 推荐系统的体系结构推荐系统有3个重要的模块:用户建模模块、推荐对象建模模块、推荐算法模块。

通用的推荐系统模型流程如图1所示。

推荐系统把用户模型中兴趣需求信息和推荐对象模型中的特征信息匹配,同时使用相应的推荐算法进行计算筛选,找到用户可能感兴趣的推荐对象,然后推荐给用户。

2.3 推荐系统的评价推荐系统性能的优劣也是研究的一个重要方向。

首先预测的准确度是一个重要的评价指标。

其次卖方也希望能够给客户提供新颖的产品,能够给用户惊喜的产品。

人们往往还对推荐系统在算法性能,隐私保护等方面有所要求。

在推荐系统中推荐算法是决定其性能的关键。

下面我将对推荐算法进行较为详细的综述。

三、推荐算法综述推荐算法比较流行的有协同过滤(col—laborative filtering)算法、基于内容的过滤(content based recommendation)算法、基于二部图关系的推荐算法、混合算法。

下面将对这几种算法进行介绍。

3.1 协同过滤(col—laborative filtering)算法协同过滤算法是目前最成功的推荐算法,它于20世纪90年代开始研究并促进了整个推荐系统研究的繁荣。

它的核心思想是用户对一些相似产品的评分比较相似;兴趣爱好相似的用户群对一些产品的评分比较相似。

协同过滤推荐一般分为三类。

基于用户的协同推荐(Userbaed CoIlaborative FiIbering);基于项目的协同推荐(ItemBased coIlaborative FiIbering);基于模型的协同推荐(ModelBased coIlaborative Filtering)。

·Userbased协同过滤推荐是提出的最早的协同过滤算法。

其是根据其他用户的观点产生对目标用户的推荐列表。

它基于这样一个假设:如果用户对一些项的评分比较相似,则他们对其它项的评分也比较相似。

协同过滤推荐系统使用统计技术搜索目标用户的若干最近邻居,然后根据最近邻居对项的评分预测目标用户对未评分项的评分,选择预测评分最高的前若干项作为推荐结果反馈给用户。

User-based协同过滤推荐算法的核心就是通过最近邻居的评分产生最后的推荐结果,当前用户对未评分项的评分通过最近邻居对该项评分的加权平均值逼近。

用户相似性度量、最近邻居查询和预测评分是整个Userbased协同过滤推荐算法的主要工作,相应的,Userbased协同过滤推荐算法可以划分为如下三个阶段:1).数据表示:对用户己经购买过的商品进行建模,从而可以有效度量用户之间的相似性。

2).最近邻查询:搜索当前用户的最近邻居。

3).推荐产生:根据当前用户最近邻居对商品的评分信息预测当前用户对未评分商品的评分,产生TOPn一商品推荐。

数据表示:在Userbased协同过滤推荐中,必须根据不同用户对商品的评分信息产生推荐结果。

用户评分数据可以用一个m’n阶矩阵A(m,n)表示,m行代表m个用户,n 列代表n个项,第i行第j列的元素凡J代表用户i对项j的评分。

用户评分数据矩阵如图3.1所示。

图3.1: 用户评分矩阵最近邻查询:最近邻查询是整个Useobased协同过滤推荐算法的核心部分,其效果和效率很大程度上决定了User一based协同过滤推荐算法的效果和效率。

所谓最近邻居,就是购买行为或评分行为与当前用户比较相似的若干用户。

最近邻查询阶段实质上就是Userbased协同过滤推荐算法的模型建立阶段。

.1). 余弦相似性(Cosine):用户评分看作为n维项空间上的向量,如果用户对项没有进行评分,则将用户对该项的评分设为O,用户间的相似性通过向量间的余弦夹角度量。

设用户i和用户j在n维项空间上的评分分别表示为向量I,j,则用户i和用户j之间的相似性sim(I,j)为:分子为两个用户评分向量的内积,分母为两个用户向量模的乘积。

2).相关相似性(Correlation):设用户i和用户j共同评分过的项集合用寿表示,则用户i和用户j之间的相似性sim(i,j)通过Pearson相关系数度量:Ric表示用户i对项c的评分,Ri和Rj分别表示用户i和用户j的平均评分。

3).修正的余弦相似性(Ad,’ustedcosine):在余弦相似性度量方法中没有考虑不同用户的评分尺度问题,修正的余弦相似性度量方法通过减去用户对项的平均评分上述缺陷,设用户i和用户j共同评分过的项集合用介表示,Ii和寿分别表示用户i和用户j评分过的项集合,则用户i和用户j之间的相似性sim(i,j)为:Ri,j表示用户i对项c的评分,i和j分别表示用户i和用户j的平均评分。

相关主题