电商数据挖掘分析报告
该数据集为某跨国电商交易数据集,交易发生时间段为 2010.12.01-2011.12.09。该公司主要销售礼品,并且大 部分客户是批发商。
行业背景与现状
行业背景分析
零售业是实现各种商品的价值和使用的 重要途径,是反映一个国家物质文明和 精神文明建设成果的重要窗口,并担负 着促进生产,繁荣市场和满足人民生活 多方面需要的重要任务。中国零售企业 的发展历程,同时是信息技术在零售业 中应用范围不断扩大的的历程。但总的 说来,中国还处在一个很不成熟的阶段, 交易规模远低于发达国家水平。而且, 网民参与网上交易的比例与发达国家相 比也有一定的距离。我国零售电子商务 企业的服务质量还有待提高。
05 基于精准营销策略的商品推荐系统
基于精准营销策略的商品推荐系统
用户画像
1 选取订单成功数据
流程
2 离散数据读热编码
3 构建用户行为表 4 归一化
基于精准营销策略的商品推荐系统
K-means聚类
SSE系数观察
轮廓系数分析
➢ Y轴均表示聚类的K值变化。为选择最优K值进行拟合,对K值变化下的SSE系数和轮廓系数进行对比分析。模型应兼 顾SSE最小且轮廓系数较大,因此选择K值为10进行重新聚类。 ➢ 通过重新进行聚类分析后,得到相似用户分类情况表。
05 基于精准营销策略的商品推荐系统
数据预处理
数据预处理流程
数据 清洗
R
M
D
数据读入
•读入Online Retail.xlsx
缺失值处理
•用户编号缺失处理
重复值删除
•订单记录重复值删除
E
异常值处理
•购买数量异常分析 •客户编号类型转换 •时间变量处理
01 行业背景与现状
02 数据预处理
contents
基于精准营销策略的商品推荐系统
推荐系统建立
1.用户购买表
2.用户-未购买商品表
3.未购买商品—类别—用户
➢ 通过构建用户购买表、 用户-未购买商品表、未购 买商品-类别-用户表,形成 最终推荐表。
最终推荐表
➢ 针对订单成功的记录,对离散型数据(产品、国家)进行 独热编码,构建用户行为表。通过Kmeans聚类的方式,对相 似用户进行归类,为推荐系统做初步准备。根据相似用户购 买行为,构建不同产品的推荐指数,为用户提供未购买产品 的推荐指数。
结论
总结
➢ 英国是主要的客户来源地区,而德国、法国、荷兰、爱尔兰和澳大利亚成交金额表 现不错,可以作为重要发展对象,可以适当进行推广、促销活动,争取提升为重要客 户。 ➢ 一般发展客户较多说明近期的营销策略很好,引入了不少流量。同时流失客户也不 少,但是推广见效了。而一般价值和一般保持客户虽然消费频次高,但是比例占少数, 对于公司来讲运费成本高,收益少。 ➢ 由于大部分客户是批发商,购买数量和金额较大;用户消费次数越多,消费金额越 大,可以每隔一段时间对用户进行召回。
01 行业背景与现状
02 数据预处理
contents
目
03 可视化及描述性分析
录
04 基于RFM模型的用户价值分类
05 基于精准营销策略的商品推荐系统
行业背景与现状
背景分析
方 面 数据
背景
零售业是实现各种商品的价值和使用的重要途径,是反 映一个国家物质文明和精神文明建设成果的重要窗口。
总的说来,中国还处在一个很不成熟的阶段,交易规 模远低于发达国家水平。而且,网民参与网上交易的 比例与发达国家相比也有一定的距离。
iiMedia Research(艾媒咨询)数据显示,2019年上半年,中国的网络零售总额已达到195209.7亿元,占社会 零售总额的24.7%,截至2019年,中国移动电商用户规模将突破7亿人。
01 行业背景与现状
02 数据预处理
contents
目
03 可视化及描述性分析
录
04 基于RFM模型的用户价值分类
复购率
01 行业背景与现状
02 数据预处理
contents
目
03 可视化及描述性分析
录
04 基于RFM模型的用户价值分类
05 基于精准营销策略的商品推荐系统
基于RFM模型的用户价值分类
RFM模型建立
R 用户交易最近的日 期间隔天数
模型 建立
F 客户消费金额统计
M 消费频次统计基于RFM模型的用源自价值分类可视化及描述性分析
产品维度
退款率随时间不断 下降,是一个很好的 状 态 。 11 月 份 销 售 额 非常高,退单数也很 高,但是退单率却很 低。
可视化及描述性分析
复购率 每月有2次消费记录的次数
每月有3次及以上消费记录的次数
通过复购率,有助于我们根据客 户的重复购买行为及时地作出调整, 从图中可以看到12月份复购率大幅度 下跌,推测在促销活动后便没有后续 活动或批发商大批量已在11月份大批 量进货,为圣诞促销做准备,致使12 月货源充沛无需进货。总体来看复购 率较为稳定。
综合分析
建 立 RFM 模 型 , 通 过 RFM 模 型 对 用 户价值进行分类, 不同价值用户采取 不同的业务决策。 购买力偏态严重, 大部分是经销商进 货产生的大金额订 单,多多利用这些 渠道。
01 行业背景与现状
02 数据预处理
contents
目
03 可视化及描述性分析
录
04 基于RFM模型的用户价值分类
THANKS!
恳请各位老师和同学批评指正!
销额影响因素
月订单金额和 月购买数量的趋势 相近,再结合客单 价可以看到四月份 环比急剧下降的原 因,客单价跌至低 谷。
从时间的维度 发现,客户更喜欢 在中午10点到14点 间进行购物,12点 是购物的高峰期, 期间可以进行线上 推广。
可视化及描述性分析
各国订单金额统计
从国家维度发现,前六 的国家在购买数量,金额, 订单数量上都比较稳定,属 于重要价值客户。英国在三 个维度下都远远领先于其他 国家,属于重要价值客户, 次要客户作为重点发展对象, 可以适当进行推广、促销活 动,争取提升为重要客户。
目
03 可视化及描述性分析
录
04 基于RFM模型的用户价值分类
05 基于精准营销策略的商品推荐系统
可视化及描述性分析
月销额环比
月销售金额通过可以 看到也在稳步上升。 由于数据集中只有成 交信息、产品信息、 地区和时间,具体变 化原因没办法具体判 断,推测可能是年底 的促销活动引起的。
可视化及描述性分析