容灾备份体系建设方案
业务连续性管理(BCM)是一个灾难应急
的框架,涵盖:IT备份和恢复、业务连续性 规划、供应链管理、危机通讯和危机公关。
灾难恢复指标(RPO/RTO)
数据处于有 效状态的最 后时刻
RPO(Recovery Point Object ,恢复 点目标):是指业务 系统所允许的在灾难 过程中的最大数据丢 失量,用来衡量容灾 系统的数据冗余备份 能力
• 设计可行的灾难恢复流程并通 过测试和演练进行流程的不断 修订和完善;
• 设计和建设人员组织结 构,进行普及知识教育和 专门的技能和流程培训。
生产环境/运维现状调研 云基础架构风险评估 BIA 业务影响分析
灾备体系建设工作内容
灾难恢复策略制定 灾备方案总体架构设计 关键技术选型分析 软硬件配置
演练方案设计 演练前的技术测试 演练环境准备 演练培训 演练实施的组织 演练应急的组织与协调 演练总结报告
支持的业务功能从灾难造成的不正常状态恢复到可接受状态,而设计的活动和流程。
恢
-- 摘自<GB/T 20988-2007 信息安全技术 系统灾难恢复规范 >3 术语与定义
复
正常水平
水
平
可接受的水平
时间
T1
T2
与灾备相关的概念:BCP、BCM
业务连续性规划(BCP):包括风险和业
务影响分析,定义灾难恢复策略和方案、流 程,明确所需的环境和资源,以及相应的容 灾团队建设。业务连续性规划是一套高级管 理和规章流程,使一个组织在突发性事件面 前能够迅速作出反应,以确保关键业务功能 可以持续,而不造成业务中断或业务流程本 质的改变。
初始化
分析
改进
灾备建设阶段
设计
运维
实施
初始化
分析
设计
实施
运维
改进
灾备建设启动
为灾难恢复规划与领导达成共识,获得最大支持。 • 认可业务持续性对组织的价值 • 了解并接受业务持续性项目相关成本 • 明确管理层所承担的责任
确定核心业务功能(非IT基础架构) 组建项目核心小组
• 不仅仅包括信息中心部门 • 所需资源支持 确定范围、目标和计划
容灾备份体系建设方案
01 灾备综述 02 灾备建设方法 03 灾备技术架构
关键数据丢失对现代机构运作的影响
据IDC的统计数字表明,美国在2000年以前的10年间发生过灾难的公司中, 有55%当时倒闭。剩下的45%中,因为数据丢失,有29%也在两年之内倒闭,生 存下来的仅占16%。
随着企业对数据处理依赖程度的递增,此比例还有上升的趋势。
2007年7月30 日发布了国家 标准《信息系 统灾难恢复规 范》(GB/T
管理规范》(JR/T0044-2008) • 2008年4月23日银监办发[2008]53号《银行业重要信息系统突
发事件应急管理规范(试行)》 • 2009年3月3日银监发[2009]19号《银行业金融机构信息系统风
险管理指引》
RTO
2天以上 24小时以后 12小时以上 数小时至2天 数分钟至2天 数分钟至0
RPO
1天至7天 1天至7天 数小时至1天 数小时至1天 0至30分钟
0
01 灾备综述 02 灾备建设方法 03 灾备技术架构
如何建设全面的灾备体系
• 技术上进行灾备系统的 建设,采用多种技术和产 品;
技术
流程
人员
业金融机构信息安全保障工作的指
4
导意见 银发[2006]123号
什么是信息系统灾难恢复(DR)
灾难---由于人为或自然的原因,造成信息系统严重故障或瘫痪,使信息系统支持的业务功能停
顿或服务水平不可接受、达到特定的时间的突发性事件。通常导致信息系统需要切换到灾难备份中心运行.
灾难恢复 --- 为了将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态、并将其
初始化
分析
设计
实施
运维
改进
IT环境调研
输入
IT环境调研 问卷
• 调研应用系统概况及相互关联关系; • 调研主机、存储环境架构及配置; • 调研网络架构、网络设备配置及外联线
路; • 调研备份系统架构及平台配置; • 调研安全管理平台架构及配置; • 调研监控及运维管理平台架构及配置;
输出
IT环境调研 问卷反馈
生对机构造成影响。
18
初始化
分析
设计
实施
运维
20988—
3
2007)
• 中国人民银行《支付清算系统危机
相关政策法规
处置预案》(银发2007,278号)
• 2008年7月9日银监发[2008]50号
1
《银行、证券跨行业信息系统突发
时间应急处置工作指引》
2010年4月16日银监办发2010]114 号《商业银行数据中心监管指引》
• 中国人民银行关于进一步加强银行
时间 T0
灾难发生
时间 T1
恢复运行
RTO(Recovery Time Object,恢复时间目标 ):是指信息系统从灾难 状态恢复到可运行状态所 需的时间,用来衡量容灾 系统的业务恢复能力
时间T2
灾难恢复体系建设7要素
灾难恢复体系建设等级定义
灾备等级与灾备指标的关系
灾难恢复 能力等级
1 2 3 4 5 6
记录单
初始化
分析
设计
实施
运维
改进Leabharlann 风险分析的意义事先安排,降低风险,减少损失 使用最小成本,获取最大安全保障
17
初始化
分析
设计
实施
运维
改进
风险分析基础概念
资产:对机构有价值的信息或资源,是安全策略保护的对象。 威胁(外因):是一种对信息系统构成潜在破坏的可能性因素,是客观存在的。 脆弱性(内因):可能被威胁利用的资产的弱点,分为技术脆弱性和管理脆弱性。 风险:人为或自然的威胁利用信息系统及其管理体系中存在的脆弱性导致安全事件发
灾备系统实施方案设计 实施过程质量控制 实施过程进度控制 厂商、集成商进行操作维护手册开发 灾备系统的测试与验证 灾备系统验收
灾备中心组织架构及岗位职责 设计 灾备中心运维管理流程规划 相关 制度模版
应急及灾难恢复组织架构 灾难事件发生时的应急响应策略和流程 设计 灾难恢复和重续运行的恢复流程设计
灾难备份体系建设阶段
16% 29%
55%
当时倒闭 2年后倒闭 生存
灾备(DR)成为业界共识
企业上市地的监 管的要求
企业提高核心竞争 力的内在要求
企业因灾难性的 突发事件受到过
巨大损失
国家监管要求
企业投资人的要 求
灾备 (Disaster Recovery)
国家及行业灾备相关法规
2
• 2008年2月4日中国人民银行发布的《银行业信息系统灾难恢复