学年论文题目:电子商务推荐系统实现方法的分析学院:信息工程学院计算机系专业:电子商务班级:学号:姓名:指导教师:2011 年 5 月15 日电子商务推荐系统基本实现方法的分析电子商务08-01摘要:互联网技术的迅猛发展把我们带进了信息爆炸的时代. 海量信息的同时呈现, 一方面使用户很难从中发现自己感兴趣的部分, 另一方面也使得大量少人问津的信息成为网络中的“暗信息”, 无法被一般用户获取. 个性化推荐系统通过建立用户与信息产品之间的二元关系, 利用已有的选择过程或相似性关系挖掘每个用户潜在感兴趣的对象, 进而进行个性化推荐, 其本质就是信息过滤. 个性化推荐系统不仅在社会经济中具有重要的应用价值, 而且也是一个非常值得研究的科学问题. 事实上, 它是目前解决信息过载问题最有效的工具. 文中根据推荐算法的不同, 分别介绍了协同过滤系统, 基于内容的推荐系统, 混合推荐系统, 以及最近兴起的基于用户—产品二部图网络结构的推荐系统. 并结合这些推荐系统的特点以及存在的缺陷, 提出了改进的方法和未来可能的若干研究方向. 推荐系统的研究受到了信息科学、计算数学、统计物理学、认知科学等多学科的关注, 它与管理科学、消费行为等研究也密切相关. 能够为不同学科领域的科研工作者研究推荐系统提供借鉴, 有助于我国学者了解该领域的主要进展.关键词:协同过滤推荐算法;皮尔逊相关度;欧几里得距离评价;卓越亚马逊目录1、概述 (1)1.1研究背景 (1)1.2定义 (1)2、推荐系统历史 (1)2.1个性化推荐系统的发展历程 (1)3、电子商务推荐系统的基本实现方法分析 (2)3.1电子商务推荐系统的分类 (2)3.2电子商务推荐系统的基本算法: (3)3.2.1基于关联规则的推荐算法 (3)3.2.2基于内容的推荐算法 (3)3.2.3协同过滤推荐算法(Collaborative Filtering Recommendation) (3)4、电子商务推荐系统的工作流程 (4)4.1数据采集 (4)4.2数据预处理 (4)4.2.1欧几里得距离评价: (5)4.2.2皮尔逊相关度: (5)4.3形成推荐 (6)4.4结果显示 (8)4.4.1卓越亚马逊的推荐系统分析 (8)4.4.2豆瓣网的推荐系统分析 (8)5、电子商务推荐系统的作用 (10)6、总结 (10)参考文献 (10)附录1 (12)1、概述1.1研究背景与传统的商务活动相比,电子商务具有不可比拟的优势,如降低企业成本、提高效率、提高企业的竞争力、提供给用户更多的选择等。
如今,电子商务的效益日益明显,通过Internet建立自己的网上商店进行商务活动的企业越来越多,但这些虚拟的商店并没有配备相应的销售人员来引导用户购物。
随着电子商务网站规模的不断扩大,网上商品越来越丰富,虽然用户有了更大的选择空间,但同时也增加了用户购买所需商品的难度,用户在找到自己需要的商品之前,往往需要浏览大量的无关信息。
为了解决这个问题,有效地指导用户在电子商务网站中购物,人们提出了电子商务推荐系统。
1.2定义电子商务推荐系统(Recommendation Systems for E-Commerce)定义是:“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。
推荐系统面对的是用户(user),任务是为用户提供对项目(item)的推荐。
用户是指推荐系统的使用者,也就是电子商务活动中的客户。
项目是被推荐的对象,是指电子商务活动中提供给客户选择的产品和服务,也就是最终推荐系统返回给用户的推荐内容。
在一个电子商务活动中,用户数和项目数是非常多的。
推荐系统面对的当前用户,称为目标用户或者活动用户。
推荐系统的当前工作,就是为根据一定的算法,给出对目标用户的推荐项目。
2、推荐系统历史2.1个性化推荐系统的发展历程1995年3月,卡耐基.梅隆大学的RobertArmstrong等人在美国人工智能协会上提出了个性化导航系统Web Watcher; 斯坦福大学的MarkoBalabanovic等人在同一会议上推出了个性化推荐系统LIRA;1995年8月,麻省理工学院的Henry Lieberman在国际人工智能联合大会(IJCAI)上提出了个性化导航智能体Litizia;1996年, Yahoo 推出了个性化入口My Yahoo;1997年,AT&T实验室提出了基于协作过滤的个性化推荐系统PHOAKS和Referral Web;1999年,德国Dresden技术大学的Tanja Joerding实现了个性化电子商务原型系统TELLIM;2000年,NEC研究院的Kurt等人为搜索引擎CiteSeer增加了个性化推荐功能;2001年,纽约大学的Gediminas Adoavicius和Alexander Tuzhilin实现了个性化电子商务网站的用户建模系统1:1Pro;2001年,IBM公司在其电子商务平台Websphere中增加了个性化功能,以便商家开发个性化电子商务网站。
3、电子商务推荐系统的基本实现方法分析3.1电子商务推荐系统的分类目前,电子商务推荐系统的分类方法存在多种,根据推荐的自动化和持久性程度,可以将电子商务推荐系统分为非个性化电子商务推荐系统、基于属性的电子商务推荐系统、用户相关性推荐系统和商品相关性推荐系统。
(1)非个性化电子商务推荐系统:是基于其他用户对商品的综合评价,或是基于电子商务系统的销售排行,或是基于电子商务系统的编辑推荐,向当前用户提供推荐信息(2)基于属性的电子商务推荐系统:是根据商品的属性特征向用户产生推荐列表(3)用户相关性推荐系统:首先搜索当前用户的最近邻居,然后根据最近邻居的购买历史或评分信息向当前用户产生推荐(4)商品相关性推荐系统:主要根据商品之间的相关性向用户产生相应的推荐信息。
根据所采用的推荐技术可以将电子商务推荐系统分为以下几种类型:(1)协同过滤推荐系统:协同过滤系统是第一代被提出并得到广泛应用的推荐系统。
其核心思想可以分为两部分:首先是利用用户的历史信息计算用户之间的相似性;然后,利用与目标用户相似性较高的邻居对其他产品的评价郁卒目标用户对特定产品的喜爱程度。
系统根据这一喜好程度来对目标用户进行推荐。
协同过滤推荐系统最大的有点是对推荐对象没有特殊的要求,能处理音乐、电影等难以进行文本结构化表示的对象。
(2)基于内容过滤的推荐:历史上, 最初的基于内容的推荐(content2basedrecommendation)你是协同过滤技术的延续与发展,它不需要依据用户对项目的评价意见, 而是依据用户已选择的产品内容信息计算用户之间的相似性, 进而进行相应的推荐. 随着机器学习等技术的完善, 当前的基于内容的推荐系统可以分别对用户和产品建立配置文件, 通过分析已经购买(或浏览)过的内容, 建立或更新用户的配置文件. 系统可以比较用户与产品配置文件的相似度, 并直接向用户推荐与其配置文件最相似的产品。
(3)基于关联规则的推荐(4)基于用户统计信息的推荐(5)基于效用的推荐和基于知识的推荐等。
3.2电子商务推荐系统的基本算法:3.2.1基于关联规则的推荐算法3.2.2基于内容的推荐算法 Content-based Recommendation内容过滤主要采用自然语言处理、人工智能、概率统计和机器学习等技术进行过滤。
通过相关特征的属性来定义项目或对象,系统基于用户评价对象的特征学习用户的兴趣,依据用户资料与待预测项目的匹配程度进行推荐,努力向客户推荐与其以前喜欢的产品相似的产品。
如新闻组过滤系统News Weeder 。
基于内容过滤的系统其优点是简单、有效。
其缺点是特征提取的能力有限,过分细化,纯基于内容的推荐系统不能为客户发现新的感兴趣的资源,只能发现和客户已有兴趣相似的资源。
这种方法通常被限制在容易分析内容的商品的推荐,而对于一些较难提取出内容的商品,如音乐CD 、电影等就不能产生满意的推荐效果。
3.2.3协同过滤推荐算法(Collaborative Filtering Recommendation)协同过滤推荐系统的算法可以分为两类: 基于记忆(memory2based) [13 —15] 的和基于模型的(model2based)的算法。
基于记忆的算法根据系统中所有被打过分的产品信息进行预测. 设C = { c 1 , c 2 , ⋯, cN } 为用户集合, S = { s 1 , s 2 , ⋯, sM } 为所有的产品集合.设rc, s 为用户c 对产品s 的打分, 这个打分是不知道的, 需要通过算法去预测. 在协同过滤系统中, 用户c 对产品s 的打分rc , s 通过其他用户对s 的打分计算而得到. 设C 为与用户c 相似度比较高的用户集, 预测rc, s 的函数形式有: ∑∧∧∈=ct s c s c rN r ,,1 (1)∑∧∈∙=cc sc s c r c c sim k r ,,),( (2))(),(,,c s c cc c s c r r c c sim k r r -∙+=∑∧∈ (3)与传统文本过滤相比,协同过滤有下列优点:(1)能够过滤难以进行机器自动基于内容分析的信息。
如艺术品、音乐;(2)能够基于一些复杂的,难以表达的概念(信息质量、品位)进行过滤;(3)推荐的新颖性。
正因为如此,协同过滤在商业应用上也取得了不错的成绩。
Amazon ,CDNow ,MovieFinder ,都采用了协同过滤的技术来提高服务质量。
缺点是:(1)用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不准确(即稀疏性问题);(2)随着用户和商品的增多,系统的性能会越来越低(即可扩展性问题);(3)如果从来没有用户对某一商品加以评价,则这个商品就不可能被推荐(即最初评价问题)。
因此,现在的电子商务推荐系统都采用了几种技术相结合的推荐技术。
4、电子商务推荐系统的工作流程虽然电子商务推荐系统的种类很多,所采用的推荐技术也不尽相同,但各种推荐系统的工作流程基本相同,主要包括数据采集、数据预处理、形成推荐和结果显示等环节。
4.1数据采集数据采集方式主要有两种类型:显式采集和隐式采集。
其中,显式采集方式是指推荐系统需要用户显式地输入形成推荐所需要的信息,包括用户信息、用户对商品的评价等;隐式采集方式是指推荐系统根据电子商务系统在用户的购物过程中自动记录的信息形成推荐,比如用户浏览或者购买了哪些商品,以此来分析用户的行为特性,不需要用户输入任何信息。
显式方式获得的数据通常比较准确,但需要用户显式地输入信息,数据采集比较困难。