个人信用评分模型构建以及个人欺诈评分模型构建—、个人信用评分概念个人信用评分又称“消费者信用评分”,是预测信用申请人或现有借款人违约可能性的一种统计方法。
它通过对消费者的人口特征、信用历史记录、行为记录、交易记录等大量历史数据进行系统的分析,利用统计方法及其他定量方法挖掘数据中蕴含的行为模式和信用特征,开发出预测性模型,用以对消费者未来的信用行为进行预测。
有很多信用记录会明显影响个人信用评分,如延迟付款额度变化、拖延付款时间的严重程度、信贷账户数目增减、信贷余额变化、账龄、最近的查询记录等。
当个人信用评分模型工作时,它会从个人信用档案中抽取不同因素来评价消费者的信用状态,一旦信用记录中有瑕疵出现,评分模型就会度量出瑕疵的大小,直接从现有的分数中扣除, 从而使信用评分的分值减小一些。
信用评分及其自动化的操作加速了整个信贷决策过程,申请人可以更加迅速地得到答复,提高了操作的效率。
据美国消费银行协会的最新一份资料,以前不使用信用评分,小额消费信贷的审批平均需要12小时,如今使用信用评分和自动处理程序,这类贷款的审批缩短到15分钟。
使用信用分后,60%的汽车贷款的审批可以在1小时内完成。
信用卡的审批只要一两分钟,甚至几秒钟。
二、个人信用评分模型构建(一)“信用评分卡”的概念在了解个人信用评分模型之前,需要了解“信用评分卡”的概念。
在消费者信用评分过程中,信用评分卡是一种表格,由描述借款人状况的各个特征变量的不同取值对应的信用分值所组成。
使用信用评分卡可以计算不同借款人的信用评分分值。
典型的信用评分卡见表4-1。
□第四章个人征信业务一个贷款申请人的状况如下:在现岗位工作时间为12个月,租房住,同时拥有活期存款账户和储蓄存款账户,尚无信用卡,职业为销售人员,年龄24岁。
因此,通过表中所给的数据,可以算出该人的信用评分分值为:14+19+31 + 11 + 18 + 19 = 112。
(二)建立信用评分模型的过程一个人信用评分模型的建—立是市场分析人员、风险管理经理、统计—学家、数据库管理人员和计算机程序员等多个领域的专家综合协调的结果。
为了保证个人信用评分模型的顺利开发和应用,必须对建模过程的每个部分进行仔细的设计和计划。
通常,建立信用评分模型的过程一般包括以下几个部分:1.明确模型的使用目的建立个人信用评分模型的第一步是明确模型的使用目的。
建立信用评分模型的目的是预测消费者违约的概率,也可以是预测消费者拖欠的概率,或者是贷款的逾期损失以及拖欠、违约及损失的组合。
由于建立模型的目的不同,所研究的对象也不同,在使用开发方法、检验手段和处理原则方面也会存在差异。
正是由于上述差异的存在,当一个授信机构使用其他机构的信用审批系统时就需要格外谨慎。
2.数据收集与样本设计在模型开发过程中,能够收集到用于建立个人信用评分模型的数据是最重要的技术处理环节之一。
通常,可供使用的数据越多,模型的预测结果就会越精确。
因此,在建117第四节个人信用评分□I_i-fr118立个人信用评分模型之前,需要确定有哪些可以使用的数据。
通常技术人员没有必要也不可能将所有数据都用于建模工作,而是按照一定的方法从中抽取部分合格的样本,利用数据质量优秀样本建立起个人信用评分模型,这样可以达到精确预测的目的。
建模工作的这一过程被称为“样本设计”。
3.选择建立信用评分模型的工具建立个人信用评分模型的统计及数学工具很多,通常使用的方法有判别分析法、逻辑回归、分类树法和神经网络方法等。
对于技术人员来说,在选择合适的方法时既要考虑到与建立个人信用评分模型的目的有关,也要考虑到与建模所使用的样本有关。
在实际建立个人信用评分模型时,往往将多种方法交叉使用。
例如,可以使用“分类树方法”选择变量,以确定变量之间的相互关系,构造出新的变量。
再将这些新变量和原始变量一起使用,通过回归的方法构建出预测模型。
然后,把预测模型产生的结果与神经网络模型产生的结果进行比较,以确定模型的有效性,并对模型进行改进。
4.模型的验证与检验建立了个人信用评分模型(或信用评分卡)后,技术人员面临的一个重要的问题是这一模型的应用效果究竟如何。
当然,一个个人信用评分模型的有效程度如何,最终需要通过模型在实际应用中的效果来评价。
但是,在模型投入实际使用之前,必须对模型的预测能力进行评估,即对模型进行验证和检验。
在对模型进行检验时,经常采用的方法是“保留样本法”,也就是在建立个人信用评分模型时,将样本随机地分成两部分:一部分用于建立模型,另一部分(称为所谓“保留样本”)用来对模型进行检验。
如果模型对建模样本和保留样本的预测结果都较好,说明模型总体来说是稳定的,有一定的应用价值。
对个人信用评分模型进行检验的统计方法很多,常用的统计量包括Gini系统、Kolo-mogorov-Smirnov统计量(简称K - S统计量)、和谐度等。
对模型进行评价的总体想法是个人信用评分模型必须尽可能地将高风险授信和低风险授信区别开来。
另外,针对某个总体建立起来的个人信用评分模型对该总体的一个子集的预测能力,也是检验模型有效性的一个重要方面。
5.选择临界分值及人工修正在个人信用评分模型开始运行之前,还需要考虑授信机构所能承受的信用风险的大小。
模型本身可以预测某个信用申请人违约的可能性大小,但是并不能确定模型使用者所能承受的总体信用风险的大小。
信用申请人的这种承受信用风险的能力取决于授信机构对可能的申请人数量的市场分析、充足资本率要求以及定价、收益目标等因素。
确定授信机构所能承受的信用风险即需要确定信用评分卡的临界值,若申请人的信用评分分值在这一临界值之下,则授信机构可以拒绝其申请;若申请人的信用评分分值高于这一临界值,则建议批准其信用申请。
通常,临界分值的确定应该使得信用申请批准比率基本与当前的批准比率保持一致,□第四章个人征信业务或“坏账率”与当前的“坏账率”相等。
在个人信用评分模型运行之前,还需要确定“人工修正”原则。
“人工修正”是指授信部门作出的决策与个人信用评分模型所建议的不一致时所采取的人工修正规则。
6.个人信用评分模型的监测由于个人信用评分的基本假设之一是未来与现在是相似的,因此一旦信用评分模型投人运行,技术人员就应与先前的系统相比较,评价新模型的运行效果。
这样就需要对模型进行监测,通过监测,能够回答如下的一些重要问题:(1)信用评分卡的使用是如所预期的那样吗?对信用评分卡的人工修正是否保持在一个尽可能低的水平?人工修正有确实的理由吗?最普遍的理由是哪些?(2)信用评分卡对贷款风险的排序是否与所期望的一致,或者信用评分卡的表现是否出现退化?好、坏客户发生比(或坏客户比率)与我们运行信用评分卡时的预期是否一致?(3)信用申请人的特征是否发生了变化?是否有更多分值低的消费者申请贷款但是被拒绝了?他们的特征是什么?(4)账户的信用分值的分布是否发生了变化?三、个人欺诈评分模型构建欺诈是信用卡公司面临的一个严峻的问题,包括申请欺诈、信用卡丢失、信用卡被盗、信用卡伪造、信用卡机密信息被盗、账户被窃取等。
不管何种欺诈类型,归根结底,都是通过欺诈性的申请或欺诈性的使用信用卡交易来实现的。
欺诈风险评分模型包括申请欺诈风险评分模型可交易欺诈风险评分模型。
申请欺诈风险评分模型可预测信用卡申请为欺诈的概率,为银行发现和拒绝欺诈性申请提供科学依据;交易欺诈风险评分模型是运用先进的数据挖掘和模型技术来预测信用卡交易为欺诈的概率,为银行发现和拒绝欺诈性交易提供科学依据①。
(一)申请欺诈风险评分模型申请欺诈是欺诈分子盗取、仿冒他人身份信息,如姓名、性别、出生日期、身份证号码、家庭地址等申请信用卡,给银行带来巨大损失,给被冒名的消费者带来纠纷。
在欧美国家,信用卡的申请可以通过电话、信件、互联网等渠道进行,由于无法面对面地核对申请人身份和证件,只要欺诈分子盗取了他人身份信息,就可能成功地得到信用卡。
即使有面对面的审核,如果证件是伪造的,也可以进行欺诈性的申请。
申请欺诈风险评①陈建.信用评分模型技术与应用北京:中国财政经济出版社,2007。
第四节个人信用评分口120分模型,是利用信用局关于消费者身份的某些信息来预测申请为欺诈的概率。
申请欺诈风险评分模型常用的预测信息有:★申请表填写的地址与信用局档案地址不符;★申请表填写的地址在信用局档案里第一次存档时间少于90天;★申请表填写的地址在信用局档案里仅为新信用账户所用;★申请表填写的地址在信用局档案里不存在;★申请表填写的地址被信用局记录认定为高风险地址;★申请表填写的地址被信用局记录认定为非住宅性地址;★申请表填写的地址在信用局曾有欺诈活动的记录;★信用局档案中地址为高风险地址;★信用局档案中地址为非住宅性地址;★信用局档案中地址曾有欺诈活动的记录;★信用局记录显示该申请人(姓名或身份证号码)曾被仿冒;★信用记录最早确立的时间在该身份证号码发行之前。
从上述信息可以看到,对申请欺诈的预测主要依赖于信用局的记录,特别是关于地址的记录,这是因为在美国信用卡主要靠信件邮寄到申请表所填写的地址上,一般不存在面对面核对身份的机会。
在信用局不存在或不发达的国家,发展这种形式的申请欺诈风险评分模型的数据基础可能不存在或很不充分,对欺诈的发现主要靠人工核对申请表填写的身份信息,如面对面地核对身份证、电话核对身份信息等。
申请欺诈风险评分把申请者按照欺诈风险概率从高到低排列,预测力强的评分模型应该能够做到评分最差的一小部分申请者集中了绝大多数的欺诈申请者,这样,依欺诈风险评分进行决策的成效才比较好,达到通过拒绝尽可能少的申请者来拒绝尽可能多的欺诈申请者的决策目标。
如图4-1所示,依评分拒绝2%的最高风险申请者可以拒绝90% 的欺诈性申请。
(二)交易欺诈风险评分模型的开发交易欺诈风险评分模型是利用信用卡当前交易信息和历史交易行为模式对比来预测当前交易为欺诈的概率的模型,为智能反交易欺诈授权策略(intelligent anti-fraud authorization strategy)提供科学依据,对欺诈风险高的交易可以拒绝授权和展开调查。
交易欺诈风险评分模型的表现变量是“交易为欺诈与否”的二元性显示变量(binary indicator variable)。
对于样本中属于欺诈的历史交易,表现变量值为1,非欺诈的交易表现变量值为0。
在理想的状态下,银行应该对每一个怀疑性或争议性的信用卡交易进行调查核实欺诈与否,然后把核实为欺诈的交易一一记录在欺诈档案(数据库)里。
在实践中,由于数据记录、整理、加工等复杂性,银行往往把核实的第一次欺诈日(confirmed date of first fraud)记录在案,然后模型把第一次欺诈日之后的交易均定义为欺诈。
这里面会有误差:如果卡被伪造,欺诈人使用伪造卡,而真实的持卡人也在继续使用该信用卡,那么第一次欺诈日之后的交易就会有一部分是欺诈交易而另一部分是真实交易,这部分真实的交易会被误判为欺诈。