当前位置:文档之家› 数据生命周期管理

数据生命周期管理

随着时间的推移,数据重要性会逐渐降低,使用频率会随之 下降,应将数据进行不同级别的存储,为其提供适当的可用 性、存储空间,以降低管理成本和资源开销。 最终大部分数据将不再会被使用,可以将数据清理后归档保 存,以备临时需要时使用。
19
二、数据生命周期管理理论与方法
数据生命周期管理流程
清理
5
一、工行数据管理的总体情况
指标模型层
指标模型层主要包括指标和模型两部分 指标部分目前主要建立了面向绩效的全行指标库,包含总行、分行的 指标需求,支持分行自行定制分行特色指标。
全行指标库
全行指标 分行特色指标 分行定性指标、同业指标 基于总行基础指标进行衍生 基于科目定制分行指标 分行客户归属规则、网银业绩归属规则 衍生类 手工类 基础类 模型类 科目定制类 手工类 衍生类
管理信息主要从内部管理系统收集,包括资讯平台、制度园地、 人力资源管理、分支机构管理、办公管理等系统。
外部信息主要包括监管机构提供的信息(如征信信息、风险提示 信息等)、行业信息、外部报价信息等。
4
一、工行数据管理的总体情况
数据基础层(建立数据仓库和数据集市)
为了对客户行为和业务管理进行科学分析和预测,需要建立集 合各类业务数据为一体的数据仓库,进行面向各类主题的数据 统计和挖掘分析,为市场营销和管理决策提供科学依据。 工商银行在2002年完成数据大集中之后,就已经意识到数据对 于银行经营管理的重要作用,在姜建清董事长等行领导的关心 指导下,开始着手数据仓库建设工作。10来年,工商银行数据 仓库建设稳扎稳打,已成为各类业务数据集中存储的重要载体 和关键基础平台。
数据量(累积) 访问频率
数据量(累积)
访问频率
0 6个月 1年 5年 10年
18
二、数据生命周期管理理论与方法
数据生命周期管理的总体原则
在数据的整个生命周期中,不同阶段的数据其性能、可用性、 保存等要求也不一样。
通常情况下,在其生命周期初期,数据的使用频率较高,需 要使用高速存储,确保数据的高可用性。
23
三、工行数据生命周期管理实践
《数据生命周期管理技术规范》总体情况
《规范》建立了统一的对所有数据的有效期管理的具体标准、 方案、指引和制度,是数据管理的指导方针,提高了数据管理 工作的统一性、系统性、全面性和科学性 《规范》改变了以往根据磁盘容量和依赖于技术人员经验的状 况,使全行有了科学统一的数据管理标准,减少了因数据保留 时间不当而出现应用风险,使中国工行的各类业务系统可以更 好、更稳定地为广大客户提供优质地服务。
9
一、工行数据管理的总体情况
信息标准化建设总体目标
总体目标:通过统一信息标准制定、发布使用、制度约束、 系统控制等手段,实现工行信息的完整性、有效性、一致性、规 范性、开放性和共享性管理,提高工行信息化水平。
1.完整性:涵盖客户、机构、 产品、帐户等银行全部重 要信息 2.有效性:信息准确度高、理 解上不存在歧义。 3.一致性:做到“五统一”。 4.规范性:制度规范、流程 控制、系统管理等。
16
二、数据生命周期管理理论与方法
数据生命周期管理的目标
通过规范数据的生命周期管理,提高数据的整体管理水平。 优化数据存储结构,有效控制在线数据规模,提高生产数据访 问效率。 提高系统资源使用效率,确保系统安全、稳定、高效运行。 做好历史数据管理,为客户服务和经营分析提供数据支撑。
14
目录
一、工行数据管理的总体情况
二、数据生命周期管理理论与方法
三、工行数据生命周期管理实践
15
二、数据生命周期管理理论与方法
背景情况
早期银行的金融产品相对较少,主要是以存贷汇为主,且数据 是以省(市)为单位分布存放,数据量相对较少;此外由于还 还没有数据集中分析挖掘的需求,日常处理对象主要是短期之 内的数据,时间跨度小,处理的数据规模相对可控。 随着各家银行实施了数据大集中,集中存放和处理的数据量急 剧增加,例如工行目前核心银行数据已达150T,数据仓库存放 的数据已达185T;同时随着各类业务的快速发展,银行每天都 在产生大量的数据,并需要对这些数据进行分析挖掘,系统资 源开销和运行效率都面临着越来越大的压力。 为控制在线数据规模、保证应用系统健康高效运行,对数据从 创建到最终销毁的生命周期进行全程管理显得越来越迫切 。
21
物理删除磁盘和磁带上的数据,销毁光盘介质。
目录
一、工行数据管理的总体情况
二、数据生命周期管理理论与方法
三、工行数据生命周期管理实践
22
三、工行数据生命周期管理实践
建立了数据生命周期管理体系
工行数据生命周期管理从组织建设、制度规范、系统工具、日 常管理各方面开展相关工作。
制定了全行统一的《数据生命周期管理技术规范》,并配套发 布了一系列数据清理工具,根据规范制定的策略定期进行清理 ,并将清理的数据归档到历史数据管理应用中。
科目定制类
6
一、工行数据管理的总体情况
指标模型层(模型部分)
模型是实现各类共用指标成熟的计算方法,主要用来规范和统 一各类指标的计算,达到方法共享和提高数据一致性的目的。
目前已经实现的模型包括如下内容:
客户评价模型 产品定价模型
绩效评估模型
风险计量模型 财务预算模型 。。。
5.开放性:行内标准与国家标 准、国际标准可翻译、可对 照。 6.共享性:标准化信息在工 行内共享使用。
10
一、工行数据管理的总体情况
信息标准化建设原则
信息标准化是“统一语言、统一计量”的过程,遵循“五统一 ”原则 1 定义统一 同一信息项的业务含义和所适用的业务场景保持一致
2 口径统一 对于有数量表达的信息标准,计算口径必须要统一 3 名称统一 各信息项应该采用统一规范的命名 4 来源统一 对于已经标准化的数据,其来源应该有且只有一个 5 参照统一 工行标准和行外各类标准的衔接应建立明确的对应关系
7
一、工行数据管理的总体情况
管理操作层
主要面向客户服务和内部经营管理,包括客户营销、资本管理 、资产与负债管理、信用风险管理、操作风险管理、市场风险 管理、绩效考核管理、内部审计与合规管理等。管理操作层的 基础数据主要来自各个业务系统,有些统计指标类数据是经数 据仓库加工提供。 为满足日常经营管理,提供了以固定报表为主的综合报表统计 平台。 为便于突发性和临时查询需要,提供了基于数据仓库的灵活查 询功能。
客户经理
各级管理人员
信息获取
信息整合 信息反馈及应用
信息加工
信息展现
高级分析用户 (灵活查询) (数据挖掘)
3
一、工行数据管理的总体情况
数据采集层
采集的数据主要包括客户信息、交易信息、管理信息和外部信 息,这些信息有些是客户和行内人员手工录入,有些是从外部 批量导入。。
客户信息、交易信息主要从对客和自营业务系统收集,包括存贷 结算基本业务、银行卡业务、代理与投资业务、金融市场业务、 信贷管理与单证业务、托管业务、投行业务等系统。
24
三、工行数据生命周期管理实践
规范主要内容
借鉴国际先进数据模型,对工行的各应用系统数据进行提炼和分 类,在数据生命周期的各个阶段制定了有效的管理策略 。
将工行的应用系统按产品线(共20类)进行划分,并在此基础 上对各产品线的数据类别进行了确认;规定了各产品线各类数 据的数据有效期,建立了完整的数据有效期管理工作规范体系 ,确立指导工行各类数据的基本管理原则和具体应遵循执行的 各种办法
20
二、数据生命周期管理理论与方法
数据生命周期管理流程
数据各生命阶段的管理策略
数据生命阶段 管理策略 永久保存:数据从产生开始一直在生产系统中保存, 在线阶段 此类数据不需要进行清理。 (数据产生与使用阶段) 保存一段时间后清理:数据被标记为失效或过期后在 系统中保存一段时间后进行清理。 在线归档:查询频度仍相对较高的数据,通过数据库 形式保存数据,用户仍可以通过系统在线查询;部分 归档阶段 数据通过在线归档一段时间后进入离线归档阶段。 (数据备份与保存阶段) 离线归档:查询频度相对较低的数据,通过光盘或磁 带等介质保存数据,用户无法在线访问,需通过恢复 光盘或磁带介质。 销毁阶段 (数据被销毁至消失)
一、工行数据管理的总体情况
数据质量管理流程
1、从源头治理 从数据录入、内 部处理入手,把 好数据质量“入 口关”。
3、做好规范管理
完善制度、规范流程、 系统硬控制,把好数 据质量“流转关”。
2、督促问题治理
部署检查规则,实现问题数据发现、 分发、治理、监督、考核闭环管理, 把好数据质量“治理关”。
17
二、数据生命周期管理理论与方法
数据生命周期的基本原理
数据访问频度与数据量的变化会随着时间的迁移而呈反比例变 化
利用随时间积累,数据访问频 次变化和数据量累积变化成反 比这一客观规律,对数据根据 访问频次进行数据价值评估, 对大量低价值信息采取低成本 的数据保存手段,使数据的价 值和存储的技术和管理相匹配 ,进而大幅降低整体数据存储 成本;
11
一、工行数据管理的总体情况
数据质量管理
数据质量管理体系
数据质量管理制度
《数据质量考核
数据质量考核监督
纳入分行内控评
办法》及实施细 则 《数据质量管理 平台业务管理办 法》 《数据质量技术 规范》
12
价体系和行长绩 效考核 建立数据质量定 期通报机制 操作风险管理委 员会定期审议
2
一、工行数据管理的总体情况
构建了分层的数据架构体系
数据采集层 交易信息 客户信息 管理信息 外部信息 数据集成层
风险集市
指标模型层
管理操作层
绩效等经营 管理系统
相关主题