Python数据分析与应用- 客户价值分析航空公司客户价值分析目录;航空公司现状分析;民航行业的竞争;除了三大航空公司之间的竞争,它还将加入各种新兴的小型航空公司、私人航空公司,甚至外国航空巨头。
航空产品生产过剩的同质性越来越明显,航空公司逐渐从价格、服务的竞争转向客户的竞争。
航空公司现状分析;行业外的竞争;随着高铁、子弹头列车等铁路运输的建设,航空公司受到了极大的冲击。
目前,航空公司已经积累了大量的会员档案信息和航班记录。
对于结束时间,选择宽度为两年的时间段作为分析观察窗口,以提取所有客户的详细数据,这些客户利用观察窗口中的记录机会,形成总共4个历史数据特征。
右表显示了数据特征及其描述。
分析航空公司的现状、航空公司数据、特征、描述、特征、名称、特征、客户基本信息、会员编号、会员时间、首飞日期、首飞日期、性别、会员卡级别、工作城市、工作国家的工作提供情况,年龄年份年龄航空公司客户数据描述表名称特征名称特征描述航班信息飞行时间计数观察窗结束时间装货时间观察窗结束时间最后一次飞行时间观察窗结束时间A VGDISCOUNT平均折扣率票价收入SUMYR观察窗SEGMSUM总飞行公里数SEGMSUM观察窗最后一次飞行日期A VGINTERV AL平均飞行时间间隔MAXINTERV AL最大飞行间隔点信息交换点交换点交换号EPSUM总精英点PROMOPTIVESUM PARTNERSUM总累积点不飞行非飞行点改变号BPSUM总基本点连续表原始我们应该如何处理这些特性?我们应该从什么开始?考虑用航空公司客户数据对客户进行分类。
分析不同类型客户的特征,比较不同类型客户的客户价值。
为不同价值的客户类别提供个性化服务,并制定相应的营销策略。
项目目标可以结合当前的航空公司数据实现以下目标。
该公司的收入来自顶级客户。
我们客户的利润率。
上述收入来自现有客户。
大部分营销预算通常花在不存在的客户身上。
客户金字塔中有升级潜力的客户。
客户金字塔中的客户升级意味着销售收入的增加和利润的增加。
这些经验可能不完全准确,但它揭示了新时代的客户差异化趋势,说明了客户价值分析的紧迫性和必要性。
JayAdamCurry是客户营销战略的倡导者,了解客户价值分析,他从数百家外国公司实施客户营销的经验中提炼出以下经验。
熟悉航空客户价值分析的步骤和流程。
航空客户价值分析项目的整体流程如图所示。
通过观察数据,目录发现原始数据中有这样的记录:票价为空,最低价格为折扣率,最低价格大于总飞行公里数。
机票价格为空的数据可能是由于缺少客户的航班记录造成的。
处理方法:放弃机票价格为空的记录。
其他数据可能是由于客户购买折扣券或兑换积分而导致的。
由于原始数据量很大,这种数据的小部分对问题影响很小,所以被丢弃。
处理方法:放弃平均折扣率不大于飞行公里总数的记录。
处理数据缺失和异常值在航空公司客户的原始数据中有少量缺失和异常值需要清除,然后才能用于分析。
本项目的目标是客户价值分析,即通过航空公司客户数据识别具有不同价值的客户。
最广泛使用的模型是RFM模型。
R(最近)是指最近消费时间和截止日期之间的间隔。
一般来说,最近消费时间和最后期限之间的间隔越短,他们就越有可能对立即提供的商品或服务感兴趣。
f(频率)是指客户在一定时间内花费的次数。
可以说,消费频率较高的顾客也是满意度较高的顾客,忠诚度越高,顾客价值越大。
m(货币)指的是客户在一定时期内花费的钱数。
消费量越大,消费者的消费能力就越强。
这就是所谓的顾客贡献销售的“28条规则”。
为航空客户价值分析建立关键功能的RFM模型简介RFM模型包括三个功能,使用三维坐标系显示,如图所示。
x轴代表最近y轴代表频率z轴代表货币。
每个轴通常被分成多个阶段,表示程度从最小到最大。
构建航空公司客户价值分析的关键特征RFM模型结果解释在RFM模型中,消费金额代表客户在一段时间内购买企业产品的金额之和。
由于机票价格受运输距离、舱位等级等多种因素的影响,同一消费金额的不同乘客对航空公司的价值不同,因此该特征不适合航空公司客户价值分析。
建立航空客户价值分析的关键特征是航空行业传统RFM模型的缺陷。
在该项目中,选择客户在某段时间内的累计飞行里程m 和客户在某段时间内的出行空间所对应的折扣系数的平均值c来代替消费金额。
此外,航空公司成员的会员时间长度会在一定程度上影响顾客价值,因此在模型中加入顾客关系长度L作为区分顾客的另一个特征。
在本项目中,客户关系长度L、消费时间间隔R、消费频率F、飞行里程M和折扣系数平均值C作为航空公司识别客户价值的关键特征(如表所示),并记录为LRFMC模型。
建立航空公司客户价值分析LRFMC模型的关键特征为航空公司客户价值分析LRFMC航空公司LRFMC模型成员时间从观察窗口结束的月数从观察窗口结束的月数客户在观察窗口中乘坐公司飞机的次数客户在观察窗口中乘坐公司飞机的次数折扣系数的平均值对应于客舱在五个特征构建完成后的观察窗口,分析每个特征的数据分布,数据的取值范围如表所示。
从表中的数据可以发现,这五个特征的值相差很大。
为了消除数量级数据带来的影响,需要对数据进行标准化。
标准化LRFMC五个特征名称LRFMC最小值最大值loadtimeffpdatelastoendflightcountsgmsummavgdiscount标准化LRFMC 五个特征L、R、F、M和c五个特征数据示例上图是原始数据,下图是标准偏差标准化后的数据。
LRFMC目录KMeans聚类算法是一种基于质心的划分方法,它输入聚类数k,并输出满足包含n个数据对象的数据库的误差平方和最小标准的k个聚类。
算法步骤如下。
从n个样本数据中随机选择k个对象作为初始聚类中心。
从每个样本到每个聚类的质心的距离是单独计算的,并且样本被分配到彼此最接近的聚类中心类别。
在所有样本被分布之后,K个聚类的中心被重新计算。
与前一次计算的K个聚类中心相比,如果聚类中心发生变化,则转动()或转动()。
质心不变时停止并输出聚类结果。
为了理解K-均值聚类算法的基本概念,在数值型数据的基础上研究了K-均值聚类算法。
然而,数据分析的样本复杂多样。
因此,不仅需要分析数值型数据,还需要适应数据类型的变化,对不同的特征进行不同的变换,以满足算法的要求。
理解K-means聚类算法的数据类型K-means算法在R语言中实现的核心功能是K-means来自统计软件包,其基本语法如下。
表中显示了k均值(x,centers,itermax =,nstart =,algorithm = c (hartiganwong,Lloyd,forge,macqueen)的常用参数和描述。
了解kmeans聚类算法,KMeans函数及其参数介绍参数名称描述x接收矩阵或数据帧。
表示用于聚类分析的数据集。
无违约。
中心接收int。
指示初始类的数量或初始类的中心。
无违约。
Itermax接收int。
指示最大迭代次数。
默认值为。
Nstart接收int。
指示随机起始中心点被选择的次数。
默认值为。
算法接收特定字符(hartiganwong、lloyd、forgy、macqueen)。
默认值为HartiganWong。
在KMeans模型建立之后,可以通过表中所示的属性查看不同的信息。
了解kmeans聚类算法KMeans函数及其参数引入属性表明,聚类返回int。
指示每个点被分配到的群集。
中心返回数字。
表示聚类中心矩阵。
Totss返回int。
指示生成的聚类的总距离的平方和。
Withinss返回num。
指示每个集群内距离的平方和。
nss之间返回num。
指示每个群集之间距离的平方和。
Size返回整数。
指示每个群集中的数字。
分析聚类结果并对数据进行聚类,结果如表所示。
聚类类别聚类编号聚类中心LRFMC客户群客户群客户群客户群分析聚类结果聚类结果的特征分析如图所示。
分析和聚类结果与业务分析相结合,通过比较各组之间每个特征的大小来评价和分析某个组的特征,从而总结出每个组的优缺点。
具体结果见下表。
集团类别优势特征弱特征客户群FMR客户群CRFM客户群FML客户群LC客户群FMR基于特征描述的分析聚类结果该项目定义了五个级别的客户类别:重要的维护客户、重要的发展客户、重要的保留客户、一般客户、低价值客户。
每个客户类别的特征如图所示。
会员的晋升和降级:航空公司可以给予适当的提醒,甚至采取一些促销活动,鼓励接近但尚未达到要求的高层次客户在会员晋升或降级评估时间点之前通过消费达到相应的标准。
这样,我们不仅可以获得利润,还可以提高客户满意度,增加公司的精英成员。
第一次交换:所采取的措施是从数据库中抽取接近但尚未达到第一次交换标准的成员,并提醒或促进他们通过消费达到标准。
一旦实现了第一次交换,客户在本公司进行另一次消费交换就比在其他公司容易得多,这相当于在某种程度上提高了转移成本。
交叉销售:通过发行联名卡等与非航空企业的合作,客户可以在其他企业的消费过程中获得公司积分,加强与公司的联系,提高忠诚度。
在分析各客户群特点的基础上,模型应用采用了以下营销方法和策略,为航空公司的价值客户群管理提供参考。
本项目以航空公司客户价值分析为例,重点介绍了KMeans 聚类算法在客户价值分析中的应用。
针对RFM客户价值分析模型的不足,利用KMeans算法构建了航空客户价值分析的LRFMC模型,并详细描述了数据分析的全过程。
摘要。