数据分析基本概念
预测的基础在于丰富而稳定的数据收集系统
数据分析社会化目前已实现
优化 • 变化无时无刻 • 分析无所不在 消费者 • 客户信息异常丰富 • 数据分析推进业务发展
业务 • 业务嵌入逐渐丰富 • 新的数据应用范例
数据量呈指数增长
全球每年产生的数据总量(单位:ZB) 2020
当今
2010 IT
• • BI项目以IT为主 科技在业务之前发展
大数据在客户群体识别中的应用
社交网络
通过客户关联关系,深层次 了解其生活状态并获知其强 需求。
大数据在信用风险中的应用
担保关联
通过分析客户担保关系,及 早发现信贷担保中的不稳定 因素。
大数据在交易欺诈检测中的运用
高
组合的策略管理手段 关联分析 评分模型
低
欺 诈 侦 测 率
已知风险
规则判断
欺 诈 误 报 率
客户生命周期
使用频率低 想尝试其他产品 客户流失预测 客户挽留
利润
客户激活 交叉 / 提升销售
对现有服务不满意 受到其 恢复服务 对新的品牌缺乏了解 处于观望状态 忠诚度低 客户获取
利润
客户行为分析 客户利润分析
损失
中止客户关系
时间
起始
发展
成熟
终止
海量异构 数据
我利用大数据平台 和其他工具进行数 据的收集、存储和 清洗。同时与数据 挖掘人员、报表制 作人员、业务统计 分析师合作完成工 作。
业务支持
报表制作人员
数据管理人员
数据架构人员
平台架构人员
我利用图形用户界 面获取现有数据, 并且创建业务报表 或进行业务分析。
我通过编写程序查 询并生成报表。
•信用风险 •欺诈识别与防范 •市场与流动性风险 •操作风险 •客户获取与挽留 •客户细分与透视 •交叉销售/提升销售与 事件触发 •客户流失与防范
风险 智能 财务 智能
•预算与计划 •资产负债管理 •作业成本管理
客户 智能 运营 智能
•战略绩效管理与KPIs •库存管理与渠道优化 •现金管理与优化 •人力资源计划与管理 • IT管理
低 有限识别 基于简单交易 单一账户
未知风险
精准识别
高
基于复杂行为 关联组合
1.5 商业数据挖掘通用方法论
什么是数据分析/挖掘
数据挖掘是一个发现和解释数据中的模式,并用于解决问题的过程
维 度 分 析
建 模 分 析
业 务 目 标
数据
+主题
信息
+规则
知识
+业务经验
决策和行动
分析数据 建立模型 分析建模人员
细分 3
细分 4
高瞻远瞩—发现战略焦点和业务 发展方向
大数据在客户价值提升中的应用
交叉销售
解决客户对产品了解不足的问题,主 动为客户提供一篮子产品。
购买了基金(28%)的客户,还购买下列产品的可能性
0 集合资产管理计划 黄金 国债 第三方存管 1.93 1.56 0.1 0.2 lift=2.26 2.13 0.3 0.4 0.5
预测未来可能 发生的
了解现在正在 发生的
描述过去已经 发生的
数据分析/挖掘的层次
数据分析/挖掘的层次
24
1.4 大数据在客户智能方面的运用
商业数据的外延在迅速增加
商业数据的内涵逐渐明晰 提供客户的信息全 貌,为从理解客户、 营销策划到客户交 互等闭环营销活动 提供数据基础和支 撑。
大数据在商业中的应用
供职于企划部的pierre wack成功预测1973年第 一次石油危机。使得壳牌 集团成功处理了原油价格 上涨的压力。
预测能力的获取
预测能力
对预测的 信心 信息获 取制度 分析的 能力
建于公园前6世纪的德尔菲的阿波 罗神庙,那里的巫女皮提亚向信徒 传达来自”阿波罗的预言”。
预测的渴望源于世界改变的步伐在加快
大数据分析师:能根 据业务目标和数据特 点,选择合适的大数 据产品与分析算法, 并组织好数据清洗、 建模、展示的大数据 分析流程。
带领数据团队,能够 将企业的数据资产进 行有效的整合和管理, 建立内外部数据的连 接;具有数据规划的 能力。
1.3 商业数据分析的阶段与行业运用
数据分析能力的演进
数据分析是业务提升的发动机(答疑解惑) 从数据到信息和智能,发挥价值的过程
1.2 商业数据分析中心建设
从价值链看数据分析对增长的贡献
索洛经济增长模型:
战略企划
营运管理
人力资源管理
市场分析与客户关系 产品研究与开发
进 料 后 勤
生 产
发 货 后 勤
销 售
售 后 服 务
商业分析成熟度模型
商业分析成熟度,是根据企业内对分析技术的使用强度进行评估的,它反映了技术、 组织架构、流程和绩效管理等环节的互相配合,是否能将分析技术、数据以及最终 用户紧密联系起来。 领 先
1791年-2013年美国10年期国债收益率
Ulrich Beck,于20世 纪80年代提出风险 社会概念
"在未来的社会中,不能正确预测趋势将导致企业100% 的失败"。 1985年-2015年美国政策不确定性指数 ——Peter F.Drucker
来源:华尔街见闻
来源: /
客户关系(CRM)管理方面与数据挖掘运用场景
潜在客户
利 润 新 客 户 响应客户
既得客户 低价值 客户
流失客户
被动离开
潜在 客户
响应 客户
普通 客户 高价值 客户 保 持
主动离开
时间 客户分群(市场细分) 交叉销售 产品精准营销 行为信用评分 欺诈侦测 客户保留 客户关系网
发掘潜 在客户
R数据分析:商业数据分析全景之 数据分析基本概念
常国珍 博士
主要内容
•商业数据分析的本质 •商业数据分析中心建设 •商业数据分析的阶段 •大数据数据分析在商业中的运用 •商业数据挖掘通用方法论
2/65
1.1 商业数据分析的本质
商业数据分析=预测 商业数据分析是什么?
预测是回报率很高的投资
在《隆中对》中, 诸葛孔明对未来形 势的预测促成了刘 备三分天下的霸业。
商业数据分析中心的组织架构形式
侧重IT 1) 技术型 - 隶属于IT部门
CIO
2) 虚拟型 – 分散在各部门,虚线表示汇报
财务 运营 研发
IT部门
分析中心
IT部门
集 中 化
分析中心
3) 战略型 – 顶层组织,纵览全局
CEO/CDO 分析中心
4) 分散型 – 完全散布在各个部门
企业
分 散 化
财务 财务 运营
整个企业广泛接受 分析技术 商业分析上升到战 略层面
部分高管开始认识 到分析的价值 开始接受数据与分 析整合的思想 衡量指标:开始考 虑未来的绩效和市 场价值
局部的零星分析 只影响单个或少数业 务活动
利用分析技术实现 创新和差异化优势
衡量指标:数据分 析已经成为企业绩 效和价值的关键驱 动力
衡量指标:非正式的 投资回报率(ROI)
发现: 找出隐藏在数据背后的模式,这些 模式能把数据转化为知识
已发现的知识
模型
把模型用在实际数据上 预测未来的行为 业务用户
应用已发现的知识达成实用的目的 – 例如: 预测
部署:
数据挖掘方法论:CRISP-DM
38
数据挖掘方法论:CRISP-DM
39
数据挖掘方法论:SEMMA
40
统计分析与 商业智能
我是政府、金融、电信、零售、 互联网、电商、医学等行业专门 从事数据分析与云端大数据的人 员。 我利用大数据平台和其他工具进 行数据的收集、存储和清洗。同 时与数据挖掘人员、报表制作人 员、业务统计分析人员合作完成 工作。
• 方差分析、线性回归 • 逻辑回归、多元统计 • 数据可视化
我是政府、金融、电信、零售、互 联网、电商、医学等行业专门从事 数据分析与数据挖掘的人员。 我一般具有工科背景,熟悉各类数 据挖掘算法。可以进行深层次的客 户识别、画像,以满足营销和风险 控制方面的需要。
大数据分析师的发展路径
• Java和SQL 大数据生态 • hadoop生态组件 系统与编程 • nosql数据库的原理及特征 能力 • spark大数据分析框架
* 按照Tom Davenport对业务分析阶段的定义,用来衡量业务分析成熟度的四大支柱包括:出众 的分析能力、受到整个企业的广泛接受、高管的大力支持、远大的发展志向。
商业数据分析中心的功能
数据分析 规划 培训 分析平台建 设
商业数据 分析中心
数据挖掘与 知识积累 业务支持分 析与结果交 付 数据获取与 管理
目前我们所处数据科学的伽利略时代
Nicolaus Copernicus(尼古拉· 哥白尼) 1473—1543
收集了客观的数据,但是理论内容较 少
Galileo Galilei(伽利略· 伽利雷) 1564-1642 数据爆炸式发展,理论开始逐步 涌现,但是理论之间缺乏联系
Isaac Newton(艾萨克· 牛顿 ) 1643—1727 理论的大综合
• 方差分析、线性回归 • 逻辑回归、多元统计 • 时间序列预测
商业 智能
• 报表系统设 计 • 数据可视化
数据挖掘建模师的发展路径
编程能 力 • SAS(或者R、Python、 SPSS Modeler)和SQL 统计分 • 方差分析,线性回归 析 • 逻辑回归,多元统计 • 机器学习 数据挖 • 深度学习 掘 • 复杂网络分析 客户行 •心理学 为分析 •营销理论 •风险理论
我在确保数据安全 的前提下为有需求 的人员提供便捷的 数据访问服务。