当前位置:
文档之家› 大数据金融行业大数据变现__明略实战分享案例
大数据金融行业大数据变现__明略实战分享案例
产品组合利润率(假定1:1) 星级标志
12%
★11%★源自5%4%9%
★
3%
14%
7%
……
……
买的可能性越大。 2、产品组合利润率指用户同时购 买组合产品时商户所获得的利润率。 以两种产品等重为前提。 3、标星的产品组合是银联商务向 商户推荐的产品促销组合。
银联商务——品类促销分析
2014年X月 分店选择▼
大数据与互联网金融
风
互联网资产交易平台
精
险 定
互联网财富管理
准 营
价
互联网保险
销
征信
大数据
超级 支付
互联网金融 业务板块
互联网金融 基础设施
金融行业大数据建设方法论
针对具体的、明确的新业务和新产品 进行快速落地和创新实现。用互联网模式进 行快速迭代,孵化出全新的业务应用。
获取、丰富数据; 整合外部数据;打通外部数据; 完成 多层次、多维度的360度客户视图的完善和补充, 其中 技术实现如模型和算法的提升、自动化和具备前瞻性。
理财产品也收到消费者热议,其收益率表现 是普遍关注点。
备注:数据周期为2015年7月20日-7月26日,南京银行总声量为2,733,江苏银行总声量为1,608。
热词云图
• 江苏银行与招商银行、平安银行、民生银行等共同提及率较高。 • 其房贷首付六折政策在新闻平台上传播较广。 • 消费者对信用卡和理财产品最为关注。
金融业大数据驱动 业务创新实践分享
周卫天 明略数据
新一代金融服务:需要?
连接 降维
一把手工程 数据科学家
公司介绍
账户管理
证券
投资理财系统
贷款服务
风险管理
打 造 互 联 网 金 融
银行
中间业务
保险
各类生活应用 (出行 购物 医疗服务)
积分管理 流量管理
卡业务
三方存托管
商业票据系统
银 之 杰 生 态 圈
精准预测 个性化推荐 联合营销
舆情声量概览
• 从上一周的声量表现来看,南京银行声量略高于江苏银行。 • 从声量平台分布来看,南京银行在新闻、论坛和博客上产生的声量远高于江苏银行。
一周总声量
声量平台分布
备注:数据周期为2015年7月20日-7月26日,南京银行总声量为2,733,江苏银行总声量为1,608。
- 可控的 - 好用的 - 数据一致的 - 反应及时的 - 弹性可扩展的
存量客户梳理统一视图结果图
第二阶段:引入外部数据…
银行已有数据资产:客户关系CRM系统, ECIF系统中的数据….
外部数据 == 不同特征、不同维度的数据使用场景 (应景弹性变化 的数据);
➢ 客户准入: 直接验证 (手机# 姓名 证件#) ➢ 规则: 过去的信贷历史 (增值服务平台如短信) ➢ 风险级别: 不同程度的审核审查; 客户风险的综合评价、各 种模型 进行定价; ➢ 精准获客(广告的精准投放) ➢ 贷款人预筛选、预审批 (如白名单); ➢ 逾期管理: 催收的策略和催收的手段(催缴公司黑名单);
需求(和数据平台支撑 相关)调研并确定最优 先业务
循环调研分析和输出物讨 论,螺旋式不断完善……
数据治理和规范标准
- 目前数据质量分析 - 数据治理重点领域规划 - 数据标准和规范机制规划
和执行计划
客户统一视图
客户基本信息 客户联系信息 客户关系信息 客户服务和互动信息 客户VIP分析 …
大数据平台
• 每促销一单位的产品Z ▼ (默认金额最高的产品,此处可对其它品类进行选择)对其它产品的影响
对刷卡笔数笔数的影响
对刷卡金额金额的影响
对刷卡收入的影响
对刷卡收益的影响
美国互联网金融公司ZestFinance
• ZestFinance(原名ZestCash)新兴的互联网金融公司 使用机器学习的方式评估个人贷款的信贷风险指数。研发主要团队有数 据科学家、数学家和计算机科学家组成。
第三阶段: 建设大数据平台路线演进图
现有系统-业务体系 柜台业务
ATM/电子银行
POS/商易通
数据分析体系 业务提醒
管理、统计报表
决策分析
各业务条线 系统
财务系统
会计系统
支撑系统【如客管系统】
银行集中的数据中心
通知预警 平台
自定义查询 平台
报表生成 平台
风险控制 综合营销 绩效考核 报表统计
大数据平台
大数据在国际银行业的主要应用
大数据在国内银行业的主要应用
2运营 优化
快速(极速)放贷 产品组合优化
舆情分析 服务升级(个性化、多样化服务)
批量获客 跨界融合 整合资源与产业升级
5业务 创新
1客户 画像
个人画像;企业画像
3风险 管控
反欺诈应用(申请欺诈;交易欺诈) 小微企业贷款评估 P2P平台
4精准 营销
优质客户&不良客户特征分析
存量客户分析结果样例
优质客户&不良客户特征分析
存量客户分析结果样例
数据+平台+应用“三位一体”方法论
26
第一阶段:存量客户统一视图实施路线
业务指标摸底
- 业务部门 - 信科部 - 数据源头摸底系
统化调查、记录 、整理
数据现状调研和分析
- 总行数据库平台 - 省行数据下载平台 - 业务分析和业务发展
大数据平台的建设。首先应该规整、规范、统一和梳理行内已有数 据。对已有的客户综合视图,产品视图和账户视图进行完整和统一 的梳理;能够完全兼容并提高现有查询等。 这是基础。
大数据就在你我身边……
优衣库 线上线下打通 促进 服务提升 店面选址APP应 用舆情分析
俱乐部式高档酒店大数据分 析客户历史数据和酒店就餐 和运动及活动数据
情感表现
• 由于声量来源以新闻为主,因此带有情感倾向的消费者讨论声量非常小。其中,南京银行的口碑优于负面口碑。 • 南京银行由于股票未跌停以及没有手续费收到好评,然后消费者也对其报表持不信任态度。 • 江苏银行的正面声量主要来源于对其银行的崇拜和公益活动的称赞,负面声量较为含糊,未明确为指出原因。
声量情感表现
例举
情感表现 正面 中立 负面
南京银行 9
2,723 1
江苏银行 4
1,598 6
备注:数据周期为2015年7月20日-7月26日,南京 银行总声量为2,733,江苏银行总声量为1,608。
正面声量举例
✓ 而我买的 南京银行 是银行里唯一涨得还 是很欣慰的。...
✓ 银行板块也普遍下跌,仅 南京银行 一只 股票在涨。...
识别结果
存量客户分析的一些基本算法
#1、基于经验规则标注种子
#2、K-近邻算法补充
#4、最终结果
#3、信贷经理标注验证
存量客户分析的算法和模型优化
优质客户&不良客户特征分析
共发现客户92万多个特征
其中有效区分优质不良客户的特征 9000多个
存量客户分析结果样例
优质客户&不良客户统计
存量客户分析结果样例
负面声量举例
✓ 江苏银行 是不是倒闭了啊,没有听到动静 ✓ 跑了好几站路,发现一家 江苏银行 ,结果不能办 ✓ 现在坐车去浦发银行看看……..
传统客户视图
大数据客户画像
- 数据 +模型 =用户画像 - 立体 多维度 深层次 细颗粒度 对应的不同的业务和多样的应用场景
- 快速识别白名单和黑名单;提高自动核准率, 从而提升效率
1. 银行在使用的数据
“银行内部可用信息的使用率仅仅是1/3, 仍然有大片数据荒地, 价值有待挖掘”
-信用卡交易记录 -用户交易往来记录 -用户贷款还款数据 --客户基本信息 --基本评分数据
2. 尚未有效 使用的数据
- 银行网站互动信息和使用行为信息 - 社交媒体公众号信息 - 呼叫中心录音数据 - 移动银行用户定位和行为数据 - 监控视频
逾期
y
退货
y
统计指标
短信数量 高频词
y y y y y y
高频词(多个)
频次 频次 频次 频次 频次 置信度 频次 频次 短信数量 频次(多个)
存量客户精耕细作 – 优质分析
优质客户特征分析- 模型流程
数据清洗
个人信贷数据
特征处理
基于经验 规则标注
特征降维
K-近邻算法补充
信贷经理 标注
新客户
优质/不良客 户识别模型
- 精准营销;征信评级; 反欺诈; 动态调整级别和监控 (增收和降低 坏账率)、快速放贷运营提升 和 服务提升 。
- 这里需要刻画用户, 不同特征, 不同地区…往往涉及到基本自然属性、 兴趣爱好、购物行为和爱好。 用户画像vs 打标签 (标签的组合,标 签 派生特征, 标签关联关系…)
银行的数据 + 外部数据
江苏银行热词云图
江苏银行与招商银行、平安银行、民生银行、 南京银行、汇丰银行、光大银行、交通银行、 兴业银行和宁波银行等共同提及率较高。
江苏银行实行房贷首付六折政策,相关新闻报 道较多。
信用卡和理财产品是消费者较为关注的话题。
备注:数据周期为2015年7月20日-7月26日,南京银行总声量为2,733,江苏银行总声量为1,608。
职业 地域
标签取值
置信度 置信度 0表示女,100表示男 置信度 置信度 置信度 置信度 置信度 0表示无,100表示有 0表示无,100表示有 0表示无,100表示有 0表示无,100表示有 频次 频次 频次 置信度
大数据客户画像实战模型 -
航空出行
y
租车
y
旅游
y
信用卡
y
自定义
P2P
y