ABCDE1项目本月累计本年计划占收入计划(%)21消费税32532541437.8432增值税22322326438.4443营业税24524530877.9454专项调节税33333343927.5865个人所得税26026030188.6176证券交易税17017018928.9987遗产税10610614397.3798土地增值税656563510.24109企业所得税18718721638.6511其中:集体75759028.3112私营57576378.9513其他55556248.811410城乡维护建设税207207203710.161511车船税269269188414.281612房产税16516517649.351713屠宰税13813826195.271814资源税12612618306.891915土地使用税494910804.542016印花税12012024934.812117滞纳金及补税罚款17173964.2922收入合计30053005375158.01!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!1引言1.1个人征信相关概念个人征信,是指第三方中介机构(即征信机构)把分散在不同授信机构、司法机构、行政机构等社会各个方面的个人信用信息通过合法手段进行采集、加工、存储到一个或若干个数据库中,进而形成个人信用档案,让授信机构在授信决策时能方便、快捷地查询到完整、真实的信用信息和信用评分。
个人征信体系是一个庞杂的系统,它由一整套个人征信制度和方法,以及个人征信主体、手段和产品构成,是与个人征信有关的业务和活动的总称,主要包括个人信用信息基础数据库、征信相关的法律法规、征信服务机构、信用产品市场、政府监督管理和诚信教育6个方面内容。
其中建立标准化的个人信用信息基础数据库系统是个人征信体系建设的核心,开发有效可靠的信用等级评估产品、建立个人信用评估机制是个人征信体系建设的目标,这将有助于对个人进行客观、科学的信用状况分析,是降低银行信贷风险、稳定金融秩序、促进经济增长的关键所在。
1.2国内外征信业发展现状从国际经验看,征信系统的构建主要有3种模式,而这3种模式的共同特点是都建有集中管理的全国性甚至跨国性数据库。
(1)美国模式:也称市场型模式,其信用体个人征信系统数据仓库与信用评估模型的构建黄岚1,张晓晖2,殷树友2(1.吉林大学计算机科学与技术学院,长春130012;2.长春金融高等专科学校,长春130022)[摘要]建立、健全个人征信体系有助于降低信贷风险、稳定金融秩序和促进经济增长。
随着个人信用信息数据量的增多以及对数据分析需求的加大,构建个人信用信息数据仓库,利用多维数据分析和数据挖掘等技术,开发信用评估等增值产品将会是个人征信体系发展的必经之路。
[关键词]个人征信系统;数据仓库;信用评估;信贷风险决策;数据挖掘;智能算法[中图分类号]F830.589[文献标识码]A[文章编号]1673-0194(2007)06-0060-05[收稿日期]2007-03-23[基金项目]吉林省科技发展计划项目资助(20050603-2)[作者简介]黄岚(1974-),女,江西临川人,吉林大学计算机科学与技术学院副教授,博士,主要从事计算机应用研究工作。
运行上述程序得到的结果如下表4所示。
表4某市税务局税收数据汇总表中国管理信息化ChinaManagementInformationization2007年6月第10卷第6期Jun.,2007Vol.10,No.6金融与投资系中的征信系统和评级系统由独立于政府之外的民营机构构成。
美国、英国、加拿大以及北欧的部分国家采用这种模式。
(2)欧洲模式:也称公益型模式,是指依据国家和政府的力量组建公共征信机构,并由相应职能部门负责运行管理。
欧共体采用这种模式。
(3)日本模式:是以银行协会建立会员制征信机构为主体的个人信用管理模式。
我国的个人征信体系发展相对滞后,随着经济的进步与发展,国家开始重视信用建设,并借鉴国际发达国家的征信体系建设经验,探索出具有中国特色的征信体系。
2003年,政府授权中国人民银行成立国家征信管理局,开始筹建个人信用信息基础数据库(以下简称个人征信系统),并于2006年1月正式运行。
个人征信系统运行一年来,已开始发挥积极作用,该系统收录的自然人数已达5.33亿人,成为世界上最大的个人征信数据库,其中有信贷记录的约6401万人。
据中国人民银行副行长苏宁披露,目前,银行每天对该系统的查询量近24万笔,查询后因信用记录不良而拒绝的个人贷款笔数占个人申请贷款笔数的10%。
1.3系统建设目标根据个人征信业务的现状与发展需要,我国的个人征信系统的建设目标分为三期:一期目标是采集个人在商业银行发生的信用信息,向商业银行提供个人信用报告查询服务;利用全国公民身份证号码查询服务中心的数据,为商业银行提供个人身份信息服务。
二期目标是在完成一期目标的基础上,采集个人的其他社会信用信息,如司法、税务、社保等,逐步完善个人信用信息数据库,逐步提供个人信用评分和咨询服务,逐步向社会各方面(包括个人)提供服务。
三期目标是在不断充实数据库的基础上,利用数据挖掘技术对数据进行深度分析,不断开发深层次的增值服务与产品,如风险预警、决策支持、市场分析等。
目前一期目标已实现,完成了应用系统基本功能的设计和开发,完成了数据中心、客服中心和接入网络的基本建设。
而二期建设还没有全面开始,二期建设的主要目的之一是采集个人的其他社会信用信息。
据报道,央行与信息产业部已联手将手机欠费记录纳入征信系统;央行还与劳动和社会保障部等积极配合,研究将个人参加社保和住房公积金等信息纳入征信系统中;另外,大学生贷款逾期不还的记录、法院判决信息、电话、水电气费缴纳情况等涉及个人信用的其他信息将逐步纳入该系统中。
二期建设的另一目的是数据库升级,建设数据仓库,提供简单的信用评分服务,为三期利用数据挖掘技术、开发信贷风险评估产品的目标奠定基础。
国内外关于这方面的研究很不充分,许多领域还有待深入探讨。
2系统功能与总体框架2.1系统功能根据系统的建设目标,并充分考虑到业务扩展的灵活性,个人征信系统包括数据采集、信用报告查询、异议处理、统计分析、运行管理等主要功能模块。
(1)数据采集是个人信用数据库系统的基本功能,是将分散在各商业银行和其他社会机构的个人信用信息,按标准收集到个人信用数据库的过程。
系统对收到的信息进行校验后存入数据库,对校验不合格的信息形成错误反馈报文反馈给原上报机构并要求重报。
(2)信息查询是各授信机构获取个人信用信息的过程,是个人信用数据库系统的核心业务,也是各授信机构当前最为迫切需求的服务,分为单笔信用报告查询和批量信息查询。
(3)异议处理是当用户认为本人信用报告中的数据有误时,可以向征信服务中心提出异议。
(4)统计分析则是系统为特定部门提供必要的统计报表,生成各类重要指标的总量和分类统计数据。
(5)运行管理主要内容是在系统日常运行过程中进行相应的维护和管理,包括数据管理、系统管理、运行监控和费用结算等。
2.2系统框架个人征信系统的总体框架如图1所示,数据中心(DataCenter)作为个人征信系统的数据采集中心和信息提供中心;其他社会机构包括公安、工商、税务、社保、建设、教育、法院等相关部门;商业银行和其他社会机构既是个人信用信息的来源机构,又是个人信用信息的使用机构;公安部身份认证中心为系统数据库提供个人身份信息;社会个人可以查询信用报告,若认为本人信用报告中的内容与事实不符时,可向数据中心提出异议申请。
3数据仓库设计由于采集到个人征信系统中数据的大量存在和迅速增长,如何从这些海量数据中提炼出具有指导意义的信用评估信息已成当务之急,因此可以利用高效能的面向主题的数据仓库来组织数据,数据仓库能够为用户提供辅助决策的综合信息以及随时间变化的趋势分析信息等。
个人征信数据仓库系统结构由数据仓库、仓库管理和分析工具3部分组成,如图2所示。
数据仓库的数据来源于多个数据源,包括各商业银行上报的银行卡和个人消费信贷数据,以及司法、税务、社保等其他社会机构提供的有关信用的图1个人征信系统框架器使用CGI脚本、Web服务器API、应用API和数据库API等实现客户浏览器与OLAP服务器、数据仓库系统之间的通信连接,是个人信用信息的发布平台;OLAP服务器将数据仓库的分析工具独立出来,负责将从数据仓库中抽取出来的数据转换成客户端用户要求的多维视图,并进行多维数据分析,将分析结果传送给Web服务器发布。
4信用评估模型构建个人信用评估作为个人征信体系建设中的重要环节,能够利用所获得的关于个人信用的信息,通过使用科学严谨的方法,综合考察影响个人及家庭的内存和外在的主客观环境因素,对个人履行各种承诺的能力和信誉程度进行全面评价,确定信用等级的一种方法。
个人信用评估可作为信贷风险决策的依据,从而使信贷决策自动化、科学化。
4.1个人信用评估指标体系的建立个人信用评估的指标体系是对个人信用进行综合评价的依据和标准,是综合反映个人本身和环境所构成的复杂系统的不同属性的指标。
根据国际标准和国内外银行经验,从数据仓库中抽取具有信用评估意义的条目,建立科学合理的个人信用指标体系是准确评价个人信用的基础和前提。
表1是一个包含3个一级指标和16个二级指标的信用评估体系。
表1个人信用指标体系一级指标个人基础信息指标经济指标历史信用指标二级指标年龄本人月均收入贷存比性别家庭月均收入不良信用记录婚姻状况易变现资产信用记录查询次数文化程度其他资产司法记录行业/职业家庭负债率职务/职称工作年限数据,源数据可以是关系数据库、数据文件或其他数据形式。
仓库管理包括数据建模、数据抽取/转换/装载(ETL)、元数据和系统管理等4部分内容。
数据仓库包括综合数据、当前数据和历史数据3类。
分析工具包括查询工具、多维数据分析(OLAP)工具、数据挖掘(DM)工具和客户/服务器工具(C/S)等。
常用的多维数据仓库模型有星型、雪花、星网和第三范式(3NF)等,实现多维数据模型的方法包括基于关系数据库的ROLAP、基于多维数据库的MOLAP和基于混合数据库的HOLAP。
个人征信系统模型可采用HOLAP方法实现,如图3所示,先以3NF模型存储个人信用基础数据,然后面向分析主题进行不同程度的汇总聚合,形成以客户为中心的轻度汇总星型模型和以信贷发放事实、金融机构查询等分析主题为中心的中度汇总星型模型,最后利用O-LAP工具(如Cognos)形成多维立方体(Cube)进行存储。