读书笔记|《数据分析思维:分析方法和业务知识》● 笔记●第1篇方法●第1章业务指标●如何理解数据●弄清楚每一列的含义●对数据进行分类●用户数据:我是谁●性别●年龄●地区●行为数据:我做了什么●点击某个菜单的次数●分享量●收藏数●产品数据:卖什么●文章标题●日期●阅读量●常用的指标●用户数据指标●日新增用户数●一个产品如果没有用户增长,,用户就会慢慢减少●活跃率●= 活跃用户数/总用户数●日活跃用户数●周活跃用户数●月活跃用户数●注意:统计人数要去掉重复的数据,同一个人在一个区间里面只计算一次●留存率●= 第1天新增用户中,在第N天使用过产品的用户数/第1天使用过产品的用户数●次日留存率(N=2)●第7日留存率(N=7)●第30天留存率(N=30)●为什么关注留存●留存可以评估产品功能对用户的粘性●留存低 - 粘性小 - 就要找到用户流失的原因●行为数据指标●PV - Page View 访问次数●UV - Unique View 访问人数●转发率●= 转发某功能的用户数/看到该功能的用户数●转化率●店铺转化率= 购买产品的人数/到店铺的人数●广告转化率= 点击广告的人数/看到广告的人数●K因子 - K factor●平均每个用户向多少人发出邀请*接收到邀请到人转化为新用户的转化率●当K>1时 - 新增用户数就会像雪球一样增大●当K<1时 - 新增用户数到某个规模时就会停止通过自传播增长●产品数据指标●总量●成交总量●成交数量●成交总额GMV - Gross merchandise volume - 流水●= 销售额+取消订单金额+拒收订单金额+退货订单金额●访问时长●人均●人均付费(ARPU 或客单价)= 总收入/总用户数●ARPU - Average revenue per user●付费用户人均付费(ARPPU) = 总收入/付费人数●ARPPU = Average revenue per paying user●人均访问时长 = 总时长/总用户数●付费●付费率●= 付费人数/总用户数●复购率●=消费两次以上的人数/付费人数●产品●热销产品数 Top N●好评产品数 Top N●差评产品数 Top N●推广付费指标●展示位广告出现在网站或手机APP的顶部、APP开屏等●按展示次数付费(CPM)●CPM - Cost Per Mille - 千人展现成本●per Mille 每千●即有多少人看了该广告●搜索广告●按点击次数付费(CPC)●Cost Per Click●即有多少人点击了该广告●信息流广告●按点击次数(CPC)●或按投放效果(CPA)●CPA - Click Per Action - 按投放数据效果付费●CPD - Cost Per Download●一般推广新的产品选CPD●CPI - Cost Per Install●CPS - Cost Per Sales●如何选择指标●好的数据指标应该是比例●根据现在的业务重点找到北极星指标●北极星指标 - 衡量业务的核心指标●指标体系和报表●什么是指标体系●指标体系是从不同纬度梳理业务,把指标有系统地组织起来。
●指标体系有什么用●监控业务情况●通过拆解指标寻找当前的业务问题●评估业务可改进的地方,找出下一步工作的方向●如何建立指标体系●步骤●1.明确部门KPI,找到一级指标●往往是业务流程最终结果●2.了解业务运营情况,找到二级指标●3.梳理业务流程,找到三级指标●每个指标可以从3个方面确定统计口径●指标业务含义●指标定义●数据来源●4. 通过报表监控指标,不断更新指标体系●报表制作步骤●需求分析●建立指标体系●设计展现形式●编写需求文档报表开发●例子●一级指标●积分抵扣金额●二级指标●积分抵扣的订单数●平均订单抵扣金额●积分抵扣的会员数●人均抵扣金额●三级指标●酒店订单数●机票订单数●跟团游订单数●自由行订单数●LV1级会员数●LV2级会员数 ...●建立指标体系有哪些注意事项●没有一级指标,抓不住重点●指标之间没有逻辑关系●拆解的指标没有意义●一个人就完成了指标体系和报表,也不和业务部门沟通●第2章分析方法●5W2H分析方法●是什么 - 追问5个问题●what●when●where●why●who●how●how much●有什么用●解决简单的问题,但复杂的商业问题解决不了●逻辑树分析方法 - 将复杂问题变简单由科学家费米提出●把复杂问题拆解成若干个简单的字问题,然后像树枝那样逐步展开●注意:逻辑树分析方法通常会融合在其他分析方法里面,辅助解决问题,而不是单独存在的。
●PEST分析方法 - 行业分析●概念●是对公司发展宏观环境的分析,通常是从政策、经济、社会和技术这数据方面来分析的●方法●P - 政策(policy)●E - 经济(economy)●S - 社会(society)●T - 技术(technology)●多维度拆解分析方法 - 多角度思考●概念●理解两个关键词:纬度(不同的角度)、拆解(多个维度的加法)●多维度拆解可以避免辛普森悖论●辛普森悖论(Simpson's Paradox)●在有些情况下,考察数据整体和考察数据的不同部分,会得到相反的结论。
●作用●整体拆解成部分可以看到内部的差异●将负责问题拆解成简单问题●方法●从指标构成来拆解●例如●销售=新客户销售额+老客户销售额●老客户销售额= 老客户数*复购率*老用户客单价●新用户销售额= 新用户数*转化率*新用户客单价●从业务流程来拆解●例如:用户购买的业务流程●看到渠道广告●被广告吸引入店铺●在店铺选择感兴趣的商品●最终决定购买●对比分析方法 - 对比●作用●价格锚定●例如杂志预定案例中设置一个别人绝对不会选的价格项,以让顾客选择更高的预定额●追踪业务是否有问题●A/B测试●方法●和谁比●自己●行业●如何比较●数据整体大小●平均值●中位数●数据整体波动●变异系数●趋势变化●时间折线图●环比●同比●注意事项:比较对象规模要一致●假设检验分析方法 - 如何分析原因●步骤●提出假设●客观提出假设●从三个维度提出●用户●产品●竞品●4P营销理论●产品 - Product●产品●品牌●包装●样式●服务●技术●价格 - Price●基本价格●折扣价格●付款期限●定价方法●定价技巧●渠道 - Place●促销 - Promotion●广告●人员推销●营业推广●从业务流程提出假设●收集证据●得出结论●作用●提高逻辑思维能力●分析问题发生的原因(归因分析)●注意●得出的结论要靠证据证明●不断重复假设分析的过程,直到找到问题●可以靠假设检验分析图将问题、假设、数据从事国内至下连起来●相关分析方法 - A和B有什么关系●作用●研究两种或两种以上数据之间的关系或影响●扩大思路●通俗易懂●方法●相关系数●数值的大小可以表示两种数据的相关性●数值的正负可以反映两种数据之间的相关方向●相关关系类型●完全正相关(相关系数= 1)●两种数据是同方向变化●完全负相关(相关系数= -1)●另种数据是反方向变化●非线性相关(相关系数=0)●不是线性相关,但有可能是其他方式的相关(例曲线方式)●正相关(相关系数>0)●负相关(相关系数<0)●相关关系判断●低度相关:相关系数绝对值中0-0.3●中度相关:相关系数绝对值在0.3-0.6●高度相关:相关系数绝对值在0.6-0.1●相关系数绝对值越大,说明来给你种数据的相关成都越高●相关系数正负,可以反映两种数据之间的相关方向●用excel实现相关分析●相关分析工具●加载‘分析工具库‘●选择‘相关系数’分析●绘制散点图●注意事项●相关关系不等于因果关系●如何判断两种数据之间是相关关系,还是因果关系●使用‘单变量控制法’●也就是,控制其他因素不变,只改变其中一个因素,然后观察这个因素对实验结果的影响●群组分析方法 - 留存和流失分析●概念●也叫同期群分析方法,按某个特征,将数据分为不同组,然后比较各组数据,也就是分组对比。
●方法●先使用群组分析方法,找到留存率低或留存率高的组;●然后使用假设检验、相关分析等方法,研究为什么这些组留存率低或留存率高。
●找到原因以后,就可以对应地优化产品。
●当群组分析表格里的数据比较多的时候,直接分析起来比较困难,这时可以把数据绘制成折线图,这样就可以很容易地发现数据发现了哪些变化。
●案例 - 留存率●1. 使用群组分析方法,找到留存率低/高的组●2.分析为什么这个组留存率低/高,可以使用假设检验、相关分析等方法进一步研究●图●案例 - 金融逾期●风控提高后产品逾期率的变化,以便查看风控是否有效●注意●除了按时间分组,还可以根据具体的业务场景来确定。
●RFM分析方法 - 用户价值分类●概念●消费时间间隔 R (Recency)●对于最近1次消费时间间隔(R),上一次消费离得越近,也就是R的值越小,用户价值越高。
●消费频率 F (Frequency)●对于消费频率(F),购买频率越高,也就是F的值越大,用户价值越高。
●消费金额 M (Monetary)●对于消费金额(M),消费金额越高,也就是M的值越大,用户价值越高。
●通过这三个指标对用户分类的方法称为RFM方法●用户分类●作用●精细化运营,针对不同的用户实行不同的运营策略●RFM分析方法步骤●第1步:计算R、F、M的值。
●要得到R、F、M这3个指标,一般需要数据的3个字段:用户ID或者用户名称、消费时间、消费金额。
从这3个字段可以计算出R、F、M这3个指标●第2步:给R、F、M值按价值打分(图2-135)。
●注意这里是按指标的价值打分,不是按指标数值大小打分。
对于最近1次消费时间间隔(R),上一次消费离得越近,也就是R的值越小,用户价值越高。
●将R、F、M 3个指标分别按价值从小到大分为1~5分。
●第3步:计算价值平均值。
●分别计算出R值打分、F值打分、M值打分这3列的平均值●第4步:和用户分类规则表比较,得出用户分类●在表格里增加3列,分别用于记录R、F、M 3个值是高于平均值,还是低于平均值。
●如果一行里的R值打分大于平均值,就在R值高低列里记录为“高”,否则记录为“低”。
F值、M值也这样比较,最终得到了表2-20里的值。
●精细化运营策略●1)重要价值用户,RFM三个值都很高,要提供VIP服务;●(2)重要发展用户,消费频率低,但是其他两个值很高,要想办法提高他的消费频率;●(3)重要保持用户,最近消费时间距离现在较远,也就是R值低,但是消费频率和消费金额高。
这种用户,是一段时间没来的忠实客户。
应该主动和客户保持联系,提高复购率;●(4)重要挽留客户,最近消费时间距离现在较远,消费频率低,但消费金额高。