当前位置:文档之家› 电商数据挖掘分析报告

电商数据挖掘分析报告

该数据集为某跨国电商交易数据集,交易发生时间段为 2010.12.01-2011.12.09。该公司主要销售礼品,并且大 部分客户是批发商。
行业背景与现状
行业背景分析
零售业是实现各种商品的价值和使用的 重要途径,是反映一个国家物质文明和 精神文明建设成果的重要窗口,并担负 着促进生产,繁荣市场和满足人民生活 多方面需要的重要任务。中国零售企业 的发展历程,同时是信息技术在零售业 中应用范围不断扩大的的历程。但总的 说来,中国还处在一个很不成熟的阶段, 交易规模远低于发达国家水平。而且, 网民参与网上交易的比例与发达国家相 比也有一定的距离。我国零售电子商务 企业的服务质量还有待提高。
05 基于精准营销策略的商品推荐系统
基于精准营销策略的商品推荐系统
用户画像
1 选取订单成功数据
流程
2 离散数据读热编码
3 构建用户行为表 4 归一化
基于精准营销策略的商品推荐系统
K-means聚类
SSE系数观察
轮廓系数分析
➢ Y轴均表示聚类的K值变化。为选择最优K值进行拟合,对K值变化下的SSE系数和轮廓系数进行对比分析。模型应兼 顾SSE最小且轮廓系数较大,因此选择K值为10进行重新聚类。 ➢ 通过重新进行聚类分析后,得到相似用户分类情况表。
05 基于精准营销策略的商品推荐系统
数据预处理
数据预处理流程
数据 清洗
R
M
D
数据读入
•读入Online Retail.xlsx
缺失值处理
•用户编号缺失处理
重复值删除
•订单记录重复值删除
E
异常值处理
•购买数量异常分析 •客户编号类型转换 •时间变量处理
01 行业背景与现状
02 数据预处理
contents
基于精准营销策略的商品推荐系统
推荐系统建立
1.用户购买表
2.用户-未购买商品表
3.未购买商品—类别—用户
➢ 通过构建用户购买表、 用户-未购买商品表、未购 买商品-类别-用户表,形成 最终推荐表。
最终推荐表
➢ 针对订单成功的记录,对离散型数据(产品、国家)进行 独热编码,构建用户行为表。通过Kmeans聚类的方式,对相 似用户进行归类,为推荐系统做初步准备。根据相似用户购 买行为,构建不同产品的推荐指数,为用户提供未购买产品 的推荐指数。
结论
总结
➢ 英国是主要的客户来源地区,而德国、法国、荷兰、爱尔兰和澳大利亚成交金额表 现不错,可以作为重要发展对象,可以适当进行推广、促销活动,争取提升为重要客 户。 ➢ 一般发展客户较多说明近期的营销策略很好,引入了不少流量。同时流失客户也不 少,但是推广见效了。而一般价值和一般保持客户虽然消费频次高,但是比例占少数, 对于公司来讲运费成本高,收益少。 ➢ 由于大部分客户是批发商,购买数量和金额较大;用户消费次数越多,消费金额越 大,可以每隔一段时间对用户进行召回。
01 行业背景与现状
02 数据预处理
contents

03 可视化及描述性分析

04 基于RFM模型的用户价值分类
05 基于精准营销策略的商品推荐系统
行业背景与现状
背景分析
方 面 数据
背景
零售业是实现各种商品的价值和使用的重要途径,是反 映一个国家物质文明和精神文明建设成果的重要窗口。
总的说来,中国还处在一个很不成熟的阶段,交易规 模远低于发达国家水平。而且,网民参与网上交易的 比例与发达国家相比也有一定的距离。
iiMedia Research(艾媒咨询)数据显示,2019年上半年,中国的网络零售总额已达到195209.7亿元,占社会 零售总额的24.7%,截至2019年,中国移动电商用户规模将突破7亿人。
01 行业背景与现状
02 数据预处理
contents

03 可视化及描述性分析

04 基于RFM模型的用户价值分类
复购率
01 行业背景与现状
02 数据预处理
contents

03 可视化及描述性分析

04 基于RFM模型的用户价值分类
05 基于精准营销策略的商品推荐系统
基于RFM模型的用户价值分类
RFM模型建立
R 用户交易最近的日 期间隔天数
模型 建立
F 客户消费金额统计
M 消费频次统计基于RFM模型的用源自价值分类可视化及描述性分析
产品维度
退款率随时间不断 下降,是一个很好的 状 态 。 11 月 份 销 售 额 非常高,退单数也很 高,但是退单率却很 低。
可视化及描述性分析
复购率 每月有2次消费记录的次数
每月有3次及以上消费记录的次数
通过复购率,有助于我们根据客 户的重复购买行为及时地作出调整, 从图中可以看到12月份复购率大幅度 下跌,推测在促销活动后便没有后续 活动或批发商大批量已在11月份大批 量进货,为圣诞促销做准备,致使12 月货源充沛无需进货。总体来看复购 率较为稳定。
综合分析
建 立 RFM 模 型 , 通 过 RFM 模 型 对 用 户价值进行分类, 不同价值用户采取 不同的业务决策。 购买力偏态严重, 大部分是经销商进 货产生的大金额订 单,多多利用这些 渠道。
01 行业背景与现状
02 数据预处理
contents

03 可视化及描述性分析

04 基于RFM模型的用户价值分类
THANKS!
恳请各位老师和同学批评指正!
销额影响因素
月订单金额和 月购买数量的趋势 相近,再结合客单 价可以看到四月份 环比急剧下降的原 因,客单价跌至低 谷。
从时间的维度 发现,客户更喜欢 在中午10点到14点 间进行购物,12点 是购物的高峰期, 期间可以进行线上 推广。
可视化及描述性分析
各国订单金额统计
从国家维度发现,前六 的国家在购买数量,金额, 订单数量上都比较稳定,属 于重要价值客户。英国在三 个维度下都远远领先于其他 国家,属于重要价值客户, 次要客户作为重点发展对象, 可以适当进行推广、促销活 动,争取提升为重要客户。

03 可视化及描述性分析

04 基于RFM模型的用户价值分类
05 基于精准营销策略的商品推荐系统
可视化及描述性分析
月销额环比
月销售金额通过可以 看到也在稳步上升。 由于数据集中只有成 交信息、产品信息、 地区和时间,具体变 化原因没办法具体判 断,推测可能是年底 的促销活动引起的。
可视化及描述性分析
相关主题