银行业数据挖掘
一、引言
数据挖掘(DataMining)是一种新的商业信息处理技术,产生于20
世纪80年代的美国,首先应用在金融、电信等领域,主要特点是对大
量数据进行抽取、转换、分析和模型化处理,从中提取出有助于商业
决策的关键性数据。
银行信息化的迅速发展,产生了大量的业务数据。
从海量数据中提取出有价值的信息,为银行的商业决策服务,是数据
挖掘的重要应用领域。
汇丰、花旗和瑞士银行是数据挖掘技术应用的
先行者。
如今,数据挖掘已在银行业有了广泛深入的应用。
二、数据挖掘在银行业应用的主要方面
现阶段,数据挖掘在银行业中的应用,主要可分为以下几个方面。
(一)风险管理
数据挖掘在银行业的重要应用之一是风险管理,如信用风险评估。
可
通过构建信用评级模型,评估贷款申请人或信用卡申请人的风险。
一
个进行信用风险评估的解决方案,能对银行数据库中所有的账户指定
信用评级标准,用若干数据库查询就可以得出信用风险的列表。
这种
对于高/低风险的评级或分类,是基于每个客户的账户特征,如尚未偿
还的贷款、信用调降报告历史记录、账户类型、收入水平及其他信息等。
对于银行账户的信用评估,可采用直观量化的评分技术。
将顾客的海
量信息数据以某种权重加以衡量,针对各种目标给出量化的评分。
以
信用评分为例,通过由数据挖掘模型确定的权重,来给每项申请的各
指标打分,加总得到该申请人的信用评分情况。
银行根据信用评分来
决定是否接受申请,确定信用额度。
过去,信用评分的工作由银行信
贷员完成,只考虑几个经过测试的变量,如就业情况、收入、年龄、
资产、负债等。
现在应用数据挖掘的方法,可以增加更多的变量,提
升模型的精度,满足信用评价的需求。
通过数据挖掘,还可以侦查异常的信用卡使用情况,确定极端客户的
消费行为。
根据历史统计数据,评定造成信贷风险客户的特征和背景,预防可能造成风险损失的客户。
在对客户的资信调查和经营预测的基
础上,运用系统的方法对信贷风险的类型和原因进行识别、估测,发
现引起贷款风险的诱导因素,有效地控制和降低信贷风险的发生。
通
过建立信用欺诈模型,帮助银行发现具有潜在欺诈性的事件,开展欺
诈侦查分析,预防和控制资金非法流失。
(二)客户管理
在银行客户管理生命周期的各个阶段,都会用到数据挖掘技术。
1.获取客户
发现和开拓新客户对任何一家银行来说都至关重要。
通过探索性的数
据挖掘方法,如自动探测聚类和购物篮分析,可以用来找出客户数据
库中的特征,预测对于银行营销活动的响应率。
那些被定为有利的特
征可以与新的非客户群进行匹配,以增加营销活动的效果。
数据挖掘还可从银行数据库存储的客户信息中,可以根据事先设定的
标准找到符合条件的客户群,也可以把客户进行聚类分析让其自然分群,通过对客户的服务收入、风险、成本等相关因素的分析、预测和
优化,找到新的可赢利目标客户。
2.保留客户
通过数据挖掘,在发现流失客户的特征后,银行可以在具有相似特征
的客户未流失之前,采取额外增值服务、特殊待遇和激励忠诚度等措
施保留客户。
比如,使用信用卡损耗模型,可以预测哪些客户将停止
使用银行的信用卡,而转用竞争对手的卡,根据数据挖掘结果,银行
可以采取措施来保持这些客户的信任。
当得出可能流失的客户名单后,可对客户进行关怀访问,争取留住客户。
银行为留住老客户,防止客户流失,就必须了解客户的需求。
数据挖掘,可以识别导致客户转移的关联因子,用模式找出当前客户中相似
的可能转移者,通过孤立点分析法可以发现客户的异常行为,从而使
银行避免不必要的客户流失。
数据挖掘工具,还可以对大量的客户资
料进行分析,建立数据模型,确定客户的交易习惯、交易额度和交易
频率,分析客户对某个产品的忠诚水准、持久性等,从而为他们提供
个性化定制服务,以提升客户忠诚度。
3.优化客户服务
银行业竞争日益激烈,客户服务的质量是关系到银行发展的重要因素。
客户是一个可能根据年费、服务、优惠条件等因素而持续流动的团体,为客户提供优质和个性化的服务,是取得客户信任的重要手段。
根据
二八原则,银行业20%的客户创造了80%的价值,要对这20%的客户实施最优质的服务,前提是发现这20%的重点客户。
重点客户的发现
通常是由一系列的数据挖掘来实现的。
如通过分析客户对产品的应用
频率、持续性等指标来判别客户的忠诚度,通过交易数据的详细分析
来鉴别哪些是银行希望保持的客户。
找到重点客户后,银行就能为客
户提供有针对性的服务。
三、数据挖掘在银行业的具体应用
数据挖掘技术在银行业中的应用,其中一个重要前提条件是,必须建
立一个统一的中央客户数据库,以提升客户信息的分析能力。
分析开
始时,从数据库中收集与客户相关的所有信息、交易记录,进行建模,对数据进行分析,对客户将来的行为进行预测。
具体应用分为五个阶段:
(一)加载客户账号信息。
这一阶段,主要是进行数据清理,消除现
有业务系统中相关客户账户数据不一致的现象,将其整合到中央市场
客户信息库。
银行各业务部门对客户有统一的视图,可以进行相关的
客户分析,如客户人数,客户分类,基本需求等。
(二)加载客户交易信息阶段。
这一阶段主要是把客户与银行分销渠
道的所有历史交易数据,包括柜台,ATM,信用卡,汇款,转账等,加载到中央市场客户信息库。
这一阶段完成后,银行可以分析客户使
用分销渠道的情况和分销渠道的容量,了解客户,渠道,服务三者之间的关系。
(三)模型评测。
这是为客户的每一个账号建立利润评测模型,需要收入和成本的确定金额,因此需要加载会计系统的财务数据到中央数据库。
这一阶段完成后,银行可以从组织,用户和产品三个方面分析利润贡献度。
如银行可以依客户的利润贡献度安排合适的分销渠道,模拟和预测新产品对银行的利润贡献度等。
(四)优化客户关系。
银行应该掌握客户在生活、职业等方面的行为变化及外部环境的变化,抓住推销新产品和服务的时机。
这需要将账号每天发生的交易明细数据,定时加载到中央数据仓库,核对客户行为的变化。
如有变化,银行则利用客户的购买倾向模型,渠道喜好模型,利润贡献模型,信用和风险评测模型等,主动与客户取得联系。
(五)风险评估管理。
银行风险管理的对象主要是与资产和负债相关的风险,因此与资产负债相关的业务系统的交易数据要加载到中央数据仓库;然后,银行应按照不同的期间,分析和计算利率敏感性资产和负债之间的缺口,知道银行在不同期间资本比率、资产负债结构、资金情况和净利息收入的变化。
四、结语
目前,银行业已逐步走向个性化服务和科学决策阶段,数据挖掘具有强大的信息处理和分析能力,可以为银行提供科学的决策依据和技术支持。
在经济全球化的今天,只有顺应知识经济时代的潮流,充分利用数据挖掘等现代科学技术,才能更好地促进银行业持续、健康的发展。
银行业数据挖掘。