科技赋能保险
大数据及人工智能在保险行业的应用
01
大数据整体应用框架
大数据整体应用框架
数据产品:
将数据、规则、模型,与具体金融业务场景进行结合,开发相应产品
数据系统:
保险营销系统、数据决策引擎等
数据处理:
标准化:清洗、驱虫、分析、汇总特征工程:衍生、降维
数据存储:
多维度海量数据,为后续数据标签、模型、产品提供基础
数据模型
•营销、风控模型,覆盖多种业务场景
•客制化规则集,个性化数据模型服务
数据产品
•两核风险筛查•智能语音机器人……
数据标签
•底层800+个模块,超过10,000个字段,覆盖全国超过8亿人口•涵盖个人资质、消费、黑灰名单等多种维度•底层数据实时更新
模型支撑–大数据+模型算法+AI
800+模块,涵盖个人资质、消费、
黑灰名单等多种维度
外部大数据
聚类、LDA 、CDA 等。
根据用户特征进行分群。
同一客群内部具有相同特征。
无监督学习
集成学习、神经网络、深度学习等。
掌握多种算法,支持定制化模型。
监督学习
保单数据、代理人信息数据等
商保公司自有数据
•客户异常风险提示
•客户群体反欺诈•反欺诈规则
•用户画像……
评分/规则/模型产品
模型支撑–整体建模流程简介•缺失值填充
•极端值处理
•标准变量衍生
•业务变量衍生
数据准备:
去伪存真•信息值(IV)筛选
•基尼(Gini)值筛选
•单变量分析
数据初步筛选:
化繁为简
•相关性(Correlation)检验
•共线性(Multi-
Collinarity)检验
变量检验:
减少对模型的干扰
•粗分箱
•根据业务调整分箱
•连续型/类别型变量值转
化(WOE转化)
数据分段:
体现变量价值
•优先选择业务变量
•清理解释性差变量
•通过逐步回归筛选
•评估与调整
模型产生与调整
模型建立主要分为:数据准备、初步筛选、变量检验、数据分段、模型产生和调整五大步骤
02
大数据寿险两核风控
寿险两核风控整体应用框架
12
3
基于海量数据集,对个人存在的投保过程中存在的问题进行有效定位:
个人有效定位
•个人投保反欺诈筛查
•个人投保财务筛查
•个人信息核验
•综合海量数据与保险机构内部数据,构建两核风
险评分模型
两核风险评分
运用两核标签数据集,形成:
•个人财务画像
•个人健康画像
个人两核画像
两核风险筛查–总体应用流程
客户身份核验
反欺诈核验两核风险评分
通过
人工
预警
结案、归档
投保/理赔
客户身份核验反欺诈核查
2
两核风险评分
3
YES
YES
NO
NO
YES
NO
多维度考察客户,控制投保
风险流程化核保程序,输出核保
评分,辅助人工核保两核风控模型
初步身份、信息真实性校验
身份证二要素验证运营商三要素
验证银行卡三/四要素验证
身份证有效期验证(活体检验)地址信息核查单位验证银行卡多笔交易
校验身份证/银行卡OCR识别
03
车险风险评分
传统车险精选模型
传统精算模型从人因子缺乏
从车因子主导
历史赔付推测
¥
信用评分
社交关系
收支等级
出行频率
个性化
精准化
从人因子
电商消费
车险风险评分优势–数据来源丰富
结合第三方大数据平台,能够基于海量用户的电商消费,财务信用,信贷申请,黑灰名单等方面的数据积累,帮助车险公司主动定价,合理控制风险保费
信用风险数据
•银行/非银机构借贷记录•借贷黑名单•公安不良记录•法院不良记录
个人资质数据
•收入等级•收入稳定性
•无业时长•行业•公司规模
•管理等级
客户行为数据
•电商消费等级•电商消费频次•电商浏览频次
•重点关注品类
与市场其他车险分相比,
车险风险评分数据涵盖维度更广
相较于目前市场上其他更基于电商交易消费推出的车险分数据,车险风险分能更多的从个人信用风险,财务收入稳定性,职业状况等方面来评估,提供更加全面的用户特征画像。