用户细分模型原理讲解
Spss提供的聚类方法
系统聚类的过程: 将每个样本看成一类,比较每个类之间的 距离,将最小的两个点合并成一个类 计算新类和其他类之间的距离 如果只有一类,那么停止,否则继续合并 类
K-means聚类方法
Spss要求事先给定将样本聚合成几类 允许自设或者默认方式选定一些样本做为 初始点,将其他每个样本看成一类 计算初始聚类点与其他类之间的距离 选出最小的距离,初始点与最小距离点的 中间点作为新的聚类点 重复上述过程直到合并成指定类
用户细分模型原理和注意事项
2013-3-4
目录
用户细分的原理 在携程的用户细分举例 用户细分的注意事项
用户细分原理
用户细分使用的模型
在统计模型中适合做用户细分的模型是聚 类分析,(而且是Q型聚类,即观测对象聚 类) 聚类的含义: 将数据分组成为多个类。在同一个类内对 象之间的具有较高的相似度,不同类之间 的对象差别较大
实际应用
首先将字段进行标准化处理 然后通过系统聚类模型做出谱系图 依据谱系图和具体业务内容,用k-means模 型将用户分成4类 高端出游型:消费金额高,周期短,频率 低,酒店星级高 积极旅游型:消费金额中等,季节性明显, 频率高,酒店星级中等
商务型:是商旅客户,无明显季节性,不 关注热门目的地,消费金额没有季节变化 低端自助型:消费金额低,季节性明显, 酒店是3及其以下,关注热门目的地
聚类分析原理
看样本之间的相似程度,通过统计量将他 们划分成不同类 将每个观测对象,也就是样本看成多维空 间中的一个点,通过比较每个点之间的空 间距离,来做聚类依据 每个样本有一些维度,比如;币种,存款 额,产品等级等 根据维度特征和样本数量来确定具体使用 什么方法来聚类
聚类分析原理(官方)
聚类原理: 聚类分析的基本思想是在样品之间定义距离, 在样品之间定义相似系数,距离或相似系数代表 样品或者变量之间的相似程度。按相似程度的大 小,将样品(或变量)逐一归类,关系密切的类 聚集到一个小的分类单位,然后逐步扩大,使得 关系疏远的聚合到一个大的分类单位,直到所有 的样品(或变量)都聚集完毕,形成一个表示亲 疏关系的谱系图,依次按照某些要求对样品(或 变量)进行分类.
营销方案: 针对高端客户,制作目的地优势显著的度 假游,增加新项目,比如:潜水类
针对积极旅游型:选择更多合作酒店,提 供度假抵用券,增加客户粘性 针对商务型:不促销 针对低端自助型:提供非热门景点自助游
用户细分注意事项
注意事项
必须有明确目标作为分类基础 如果营销分析,那么不要加入用户自身的 属性 比如男女,年龄等 聚类分析模型中无意义字段或者非显著影 响目标的字段会对聚类结果产生影响,导 致分类不准的问题出现 聚类分析开始之前必须做数据标准化,不 然后出现大数据“吃掉”小数据
两步聚类方法
除了用传统的欧氏距离之外,增加似然距 离测度 第一步是考察每个样本,确定类中心。这 个过程是构建一个特征树 第二步是使用凝聚算法对特征数的枝节点 分组,产生一个结果范围 一般这个模型针对样本的变量里有连续型 和分类型变量
空间距离的计算方法
空间距离的计算方法
空间距离的计算方法
空间距离的计算方法
在携程的聚类举例
实际应用
在携程做用户细分时,比如对用户做春季 度假游促销 选取一段时间内的:用户ID,星级,用户 最后一次消费行为,度假游金额,出发时 间,返回时间,目的地,出行人数,入住 酒店星级,房间类型,间夜数,是否是商 旅客户,是否拒绝邮件,去年同期是否有 春季游的相关度假项目,是否是催眠唤醒 客户……