商业数据分析与挖掘
进 行 有 意 义 的 分 析
SPSS
在运用统计分析软件进行分析之前,首先要进行数据的前期纯 化和处理。我们的市场调研报告中的常见指标多为本期销售额/利 润、同期销售额/利润、同比上升或下降%,属于描述性分析,分 析工具落后,结论较浅显,没有挖掘出数据背后的秘密。
SPSS 提 供 可 行 动 的 结 果
CPI数据说明通胀预期加大,但当前的物 价上涨仍然是结构性上涨,主要因为食 品及其居住类价格(注:不包括住房价 格)上涨导致,这部分贡献率达90%左 右。除食品外,衣着类、家庭设备用品 类价格是下降的。
我们正面临数据信息的挑战
为什么现在需要数据挖掘?
数据正在形成数据仓库、管理精准性的需要、 商业数据挖掘软件的成熟。 本期销售/毛利、同期销售/毛利、同比上升或 下降%。这些均属于浅层次数据对比,缺乏深 层次数据挖掘与商业Байду номын сангаас用。 数据挖掘是从大量的、不完整的、有噪声的、 随机的模糊数据中提取潜在的、有价值的信息 和知识的过程。 数据挖掘的主要任务:分类、估计、预测、关 联分组、聚类和建立简档。
分析某一现象 的内部结构及 其各组成部分 的功能,进而 认识这一现象 本质的分析方 法。
常用且实用的定量分析方法
聚类分析 判别分析 关联分析 主成份分析、因子分析 回归分析
决策树
神经网络
购物篮分析
决策树
• 问题描述:预测信用水平是好还是差,银行据此决定是
否向客户发放贷款以及发放多少
不论采用什么分析技术,最终目的是要据此采取行动。如果不能 清晰地向决策者表达和发布分析结果,分析的价值就会大打折扣。预 测分析非常重要,分析报告如果包括预测受访者未来行为的信息,分 析结果的含金量更高。
做好商业数据挖掘面临的难题
(一)数据质量问题 数据缺值与噪声 数据的连续性与动态变化 (二)专业人员的缺乏与模型的可理解性 (三)隐私保护与数据安全 在收集任何客户数据时,需要向客户提供以下三种选择: ①不允许对这些数据进行任何挖掘 ②只允许在组织内部对这些数据进行挖掘 ③允许在组织内部和外部对数据进行挖掘
数据挖掘可以为利群带来什么?
抢先联络高风险、高价值客户,并适时 提供优惠待遇,改善客户持久力 解析忠诚客户的忠诚要素 预测未来数月的客户群体状况与销售热 点 修正使客户流失的不足之处 ……
A-数据挖掘在客户关系管理中的应用
对客户群体进行分类 比如:体验型消费者比保守型消费者更愿意选 择具有较高风险的购买方式来获得更多顾客价 值。同时在此过程中体验型消费者希望他们选 择的购买方式能获得社会群体的认可。(聚类 分析结果) 进行客户盈利能力分析 客户获取与保持 客户满意度分析
③促销分析
通过对促销活动方式与广告销售量变化的分析, 有效评估促销活动,同时结合客户群分析,得 出针对不同客户(地区)应采取的合适促销方 式,并预测优惠策略实施的效果,从而及时调 整促销策略,使企业收益最大化。(哪些商品 属于敏感品类?) 例:交叉销售模型:用来预测现有客户在同一 公司购买不同产品或服务的可能性。提升销售 模型:用来预测客户购买更多同样产品或服务 的可能性或价值。
结束!
祝愉快!
SPSS:统计分析软件包(为例) SAS:统计分析系统 GAUSS:一种为矩阵运算而设计的计算机语言 STATA:经济统计软件 S-Plus&R软件 Excel,Eviews,Tsp软件 Matlab,Minitab,Microfit,DPS,Winrats, Lingo
确 定 样 本 大 小
基本假定:消费者过去的行为是其未来 消费倾向的最好说明 预测消费行为 定向营销 应用范围:①客户分析 ②产品分析 ③促销分析 ④改进企业市场预测机制
②产品分析
发现产品间的关联规则。通过关联规则找出顾 客购买行为模式,从而应用于商品货架设计、 货存安排以及根据购买模式对用户进行分类。 市场预警分析。发现某产品在某地区的销售异 常或对某客户购买异常提出警告信息。 进行描述式数据分析。根据历史数据,分析不 同时期不同地区各产品需求的变化,特别是五 一、十一、春节等黄金周期间各种产品的需求 增长率的分析,便于企业组织或调度货源。
商业数据分析与挖掘
中国海洋大学管理学院 张樨樨
数据的商业理解
数字谎言—平均数说明了什么?(算术 平均数、中位数、众数(出现频率最高的 值)如何选用?) 统计谎言—CPI数据 啤酒与尿布——数据挖掘的价值
5月份CPI上涨3.1%,增幅已突破3% 的“红线”,PPI同比上涨7.1%
统计局的官方解释
购买芭比娃娃的客户有60%的可能购买 三种类型的糖果之一。——《财富(福 布斯)》杂志 糖果是附加于芭比娃娃之上的刺激购物 思考:零售商能够利用这一信息做什么?
因子分析 问题描述:如何从17个价值观指标中提取核心因子
诚实可信 可靠和可信赖 才智和思考 合理和一贯 胜任和有效 依靠自己和自给自足 努力工作 勇气和创作性 丰富情感 清心快乐 原谅他人 思想开明 为他人着想 干净利索 纪律约束 礼貌休养 忠实和顺从
强干
慷慨
修养
价值系统描述 强干
强干因素的价值系统
努力工作 才智和思考 可靠和可信赖 合理和一贯 胜任和有效 依靠自己和自给自足 诚实可信
0.58 0.60 0.62 0.64
价值系统描述 慷慨
慷慨因素的价值系统
思想开明 理解他人 清心快乐 丰富情感 勇气和创造性
0.40 0.60 0.80
价值系统描述
收入大于5万元/年 是 否
是否房主 是 否
有无储蓄帐户 无 有
批准
不批准
批准
神经网络
• 问题描述:根据客户全方位信息,预测客户流失的概率
男
输
29 3000元/月 流失概率 (0.87)
输
入
已婚,一孩 每月食品支出 …………
出
Web图(关联分析)
• 问题描述:如何调整超市中商品的摆放来增加销售额
关联规则
客户满意度评价准则指标体系
客户满意度是由企业行为决定的客户心 理反映。利用数据挖掘技术和企业数据 仓库中关于客户购买、维修、反馈意见、 建议投诉等信息,对客户满意度进行深 度分析,找出客户不满意的原因并有针 对性的制定相应策略,提高客户忠诚度, 增加企业利润。
B-数据挖掘在市场营销中的应用
客户价值矩阵
例:客户流失分析
研究流失是重要的,因为失去的客户必须由新客户补 上来,并且获得新客户的代价昂贵,在短期内新客户 往往比老客户带来的收益少。在市场已经饱和的成熟 市场尤其如此。
上图说明当市场变得饱和时,获取活动的响应率下降, 获取新客户的成本上升。与期花费高成本吸引新客户 不如留住现有客户更有意义。 构建流失模型的作用:①预测谁将离去(按流失可能 性对客户分级的分值)②预测客户将要停留多久(对 客户剩余生存期进行估计,该值是客户忠诚度分值的 基础。通过发现那些较早获取的长期客户具有的特征 来直接估计客户保有期) 建模数据的获取与积累:公司应从客户第一次作出响 应时存储相关信息,并进行追踪调查,获取连续的历 史数据(便于比较和规律提取),而不仅仅是横截面 数据。 运用SPSS、SAS软件可以方便地建立客户流失模型
教养
修养因素的价值系统
为他人着想 整洁利索 纪律和约束 礼貌和教养 忠实和顺从
0.30 0.50 0.70 0.90
聚类分析
• 问题描述:如何对客户进行细分,使产品满足最有价值
客户
稳 健 型 、 实 际 型 、 冒 险 型
回归分析
• 问题描述:如何从众多申请经费或者纳税中发现欺诈
常用统计分析软件
SamplePower
SPSS Sample Power可以在统计显著性和样本大小之间找到一个平衡 点,帮您确定合适的样本大小。 如果样本太小,可能得不到任何有价值信息,白白浪费时间;而样本太 大,又会造成时间和资金的浪费。
方 便 地 建 立 调 查 问 卷
Data Entry Builder 拖放:从工具面板中拖到问卷,并可定制 布局:全面的布局和格式选项,包括单选、多选„ 类型:多种问题类型,单选、多选、开放题、矩阵„ 问题库:标准问题或效度高的问题可以保存在问题库 中,方便以后调用
常用的定性分析方法
归纳法 演绎法 比较法 结构法
以调查的分组 资料为中心, 经过归纳概括 出一些理论观 点。
把调查资料的 整体分解为因 素,形成分类 资料,并通过 这些分类资料 的研究分别把 握事物的特征 与本质。
把两个或两类 资料相比较, 确定它们之间 的相同点和不 同点的一种逻 辑分析方法。 需要选择一定 的参照系。