毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。
尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得及其它教育机构的学位或学历而使用过的材料。
对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。
作者签名:日期:指导教师签名:日期:使用授权说明本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。
作者签名:日期:学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。
除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。
对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。
本人完全意识到本声明的法律后果由本人承担。
作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。
本人授权大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
涉密论文按学校规定处理。
作者签名:日期:年月日导师签名:日期:年月日注意事项1.设计(论文)的内容包括:1)封面(按教务处制定的标准封面格式制作)2)原创性声明3)中文摘要(300字左右)、关键词4)外文摘要、关键词5)目次页(附件不统一编入)6)论文主体部分:引言(或绪论)、正文、结论7)参考文献8)致谢9)附录(对论文支持必要时)2.论文字数要求:理工类设计(论文)正文字数不少于1万字(不包括图纸、程序清单等),文科类论文正文字数不少于1.2万字。
3.附件包括:任务书、开题报告、外文译文、译文原文(复印件)。
4.文字、图表要求:1)文字通顺,语言流畅,书写字迹工整,打印字体及大小符合要求,无错别字,不准请他人代写2)工程设计类题目的图纸,要求部分用尺规绘制,部分用计算机绘制,所有图纸应符合国家技术标准规范。
图表整洁,布局合理,文字注释必须使用工程字书写,不准用徒手画3)毕业论文须用A4单面打印,论文50页以上的双面打印4)图表应绘制于无格子的页面上5)软件工程类课题应有程序清单,并提供电子文档5.装订顺序1)设计(论文)2)附件:按照任务书、开题报告、外文译文、译文原文(复印件)次序装订教研室(或答辩小组)及教学系意见1绪论本章将对本课题研究的背景和意义进行描述,然后对个性化推荐研究现状进行总结分析,先总结了推荐引擎的现状,然后讨论了推荐引擎使用的最经典的协同过滤推荐算法的现状,最后例举了个性化推荐的应用,说明了各个种类各个领域的个性化推荐的特点。
本章最后对本文的内容和结构做出了叙述,对本课题之后的研究有很好的引导作用。
1.1研究背景与意义随着网络的普及,网络资源不断丰富,网络信息量不断膨胀。
用户要在众多的选择中挑选出自己真正需要的信息好比大海捞针,出现了所谓的“信息过载”的现象。
信息过载是指的是社会信息超过了个人或系统所能接受、处理或有效利用的范围,并导致故障的状况。
个性化推荐系统的出现是为了解决信息过载的问题,帮助消费者在浩如烟海的产品中找到自己需要的产品,为消费者提供个性化的购物体验[1]。
个性化推荐系统日益受到用户的青睐,也受到越来越多的学者和电子商务网站的关注[2]。
个性化推荐可以作为网络营销的一种手段,能为电子商务网站带来巨大的利益。
个性化推荐的目标是根据具有相似偏好的用户的观点向目标用户推荐新的商品[3]。
好的个性化推荐系统能够发掘用户喜欢的商品,并推荐给用户。
可想而知,对于用户而言,如果打开网站的链接并登陆,就能找到自己喜欢的商品,那会省下很多翻看网页的时间和精力,而这样的网站,一定会受到用户的青睐。
一个好的个性化推荐系统可以为用户提供便利,继而,使用户与网站之间有更好的粘合度,提高网站的市场竞争能力。
在众多的个性化推荐算法中,协同过滤被广泛应用,也是最成功的推荐算法[3]。
本课题旨在研究移动互联网环境下个性化推荐引擎算法研究。
同时将算法实现成移动互联网环境下的个性化推荐引擎实体,为具体研究提供了指导。
1.2研究现状1.2.1推荐引擎研究现状目前主流的两种推荐引擎[4]是基于内容过滤的推荐引擎和基于协同过滤的推荐引擎。
基于内容的过滤技术[5]主要包括特征项提取、建模以及相似度计算,由于受商品属性(比如音乐和视频信息等)提取方法的限制,其推荐技术无法取得突破性的进展。
相对而言,基于协同过滤的推荐系统能够处理视频和音乐等复杂的非结构化项目,推荐效果随用户数的增加而提高,成为推荐引擎所采用的最重要的技术之一。
面对互联网中的海量数据,协同过滤推荐算法的研究成为是推荐引擎领域的研究焦点。
当前,研究的内容主要集中在两个方面:(1)推荐质量:推荐引擎最基本也是最重要的要求就是要确保推荐质量。
如果推荐引擎给用户推荐的信息不是用户所感兴趣的,甚至是用户不太喜欢的信息,这样不仅不能吸引用户使用该系统,反而会影响用户对推荐引擎提供的服务质疑,从而不再使用,因此这方面的重点是提高推荐质量。
(2)推荐速度:目前推荐系统基本采用B/S架构,用户在线通过浏览器访问推荐系统,我们需要考虑推荐快速。
然而一个系统通常包含大量的用户量和项目的数据量,面对海里的数据量,如何快速挖掘出用户感兴趣的项目并推荐给用户,并不是一件容易的事情,同时一个系统响应时间太长会影响用户的使用效果,因此减少系统的响应时间是推荐系统要考虑的一个重要方面。
协同过滤推荐引擎如何快速响应用户,准确推荐信息给目标用户,是目前研究的重点和热点,也是本文研究的主要目标。
1.2.2协同过滤研究现状在1992年,Goldberg[6]等学者在研究报告中首次提出协同过滤(Collaboration Filtering,CF)的概念,它基于如下假设:如果用户x和用户y,他们对k个项目的评价或者行为相似,则认为他们对其他项目持相似观点[6-7]。
协同过滤首次应用于Tapestry系统,用于过滤出对用户有用的电子信件,Tapestry系统展示了一种新的推荐思想。
随后协同过滤算法获得了巨大的成功和广泛的应用,建立了大量的协同过滤系统,如Video Recommender[8], WebWatcher[9], GroupLens[10], SiteSeer[11], Let’s Browse[12]和SELECT[13]等。
在2009年,Su [14]对协同过滤算法进行总结,将其主要分为两类:基于记忆的协同过滤和基于模型的协同过滤。
在2011年,姚曜和赵洪利[15]等对协同过滤算法进行总结,将协同过滤算法主要分为三大类:基于记忆的协同过滤方法、基于模型的协同过滤方法和组合协同过滤算法[16]。
基于记忆的协同过滤方法的主要思想是首先找出与目标用户相似的其他所有用户,然后根据相似用户集对目标项目的评分来预测目标用户对目标项目的评分[17]。
基于模型的协同过滤方法的主要思想是通过已知的评分数据来建立学习模型,然后基于模型来预测未知的评分数据。
组合协同过滤算法综合考虑协同过滤技术和其他推荐技术,结合多种技术进行推荐。
按照算法结合方式分为三类:基于内容的协同过滤[18]、多种协同过滤组合[19]和多种协同过滤相互融合[20]。
在构建推荐引擎的应用中,协同过滤常面对巨大且稀疏的数据集,推荐性能面临很多挑战,文献[21]对协同过滤技术及当前存在的问题进行了研究与总结,认为面临的主要问题有:数据稀疏性、缺乏可扩展性、同义词和多义性和用户行为不确定性等问题。
1.2.3个性化推荐应用现状和搜索引擎不同,个性化推荐系统需要依赖用户的行为数据,因此一般都是作为一个应用存在于不同网站之中。
在互联网的各类网站中都可以看到推荐系统的应用,而个性化推荐系统在这些网站中的主要作用是通过分析大量用户行为日志,给不同用户提供不同的个性化页面展示,来提高网站的点击率和转化率。
本节简单介绍推荐系统在互联网的最具代表性的电子商务、个性化广告领域的应用,并且介绍个性化网络电台这一纯粹的个性化推荐系统的代表。
(1)电子商务电子商务网站是个性化推荐系统的一大应用领域。
著名的电子商务网站亚马逊是个性化推荐系统的积极应用者和推广者,其中最主要的应用有个性化商品推荐列表和相关商品的推荐列表。
图1-1提到的个性化推荐列表采用了一种基于物品的推荐算法(item-based method),该算法给用户推荐那些和他们之前喜欢的物品相似的物品。
图1-1 亚马逊的个性化推荐列表除了个性化推荐列表,亚马逊另一个重要的推荐应用就是相关推荐列表。
当你在亚马逊购买一个商品时,它会在商品信息下面展示相关的商品。
亚马逊有两种相关商品列表,一种是包含购买了这个商品的用户也经常购买的其他商品(如图1-2所示),另一种是包含浏览过这个商品的用户经常购买的其他商品(如图1-2所示)。
这两种相关推荐列表的区别就是使用了不同用户行为计算物品的相关性。
此外,相关推荐列表最重要的应用就是打包销售(cross selling )。
当用户在购买某个物品的时候,亚马逊会告知其他用户在购买这个商品的同时也会购买的其他几个商品,然后让用户选择是否要同时购买这些商品。
同时购买会提供一定的折扣(如图1-4所示),这种销售手段是推荐算法最重要的应用,后来被很多电子商务网站作为标准的应用。
图1-2 相关推荐列表,购买过这个商品的用户经常购买的其他商品图1-3 相关推荐列表,浏览过这个商品的用户经常购买的其他商品图1-4 亚马逊的打包销售页面个性化推荐系统对亚马逊的意义,其CEO Jeff Bezos在接受采访时曾经说过,亚马逊相对于其他电子商务网站的最大优势就在于个性化推荐系统,该系统让每个用户都能拥有一个自己的在线商店,并且能在商店中找到自己感兴趣的商品。
(2)个性化广告广告是互联网公司生存的根本。
很多互联网公司的盈利模式都是基于广告的,而广告收入直接决定了很多互联网公司的收入。
目前,很多广告都是随机投放的,即每次用户来了,随机选择一个广告投放给他。
这种投放的效率显然很低。
因此,很多公司都致力于广告定向投放(Ad Targeting )的研究,即如何将广告投放给它的潜在客户群。
个性化广告投放和狭义个性化推荐的区别是,个性化推荐着重于帮助用户找到可能令他们感兴趣的物品,而广告推荐着重于帮助广告找到可能对它们感兴趣的用户,即一个是以用户为核心,而另一个以广告为核心。