数据中心容灾备份解决方案
金融行业
交通行业
云计算模式
应用级容灾
云双活容灾
能源行业
教育行业
医疗行业
物理机模式
应用级容灾 同城应用级容灾 广域网应用级容灾
4-5级 4-5级
3级
3级
1-2级 1-2级
数据级容灾
云主备容灾
CDP容灾
备份
虚拟机备份
数据级容灾
数据库容灾
阵列复制容灾
虚拟化存储容灾
备份
备份软件备份
一体化备份
……
咨询服务
合作 交付
灾备建设 刻不容缓
数据集中化,风险加剧
以运营商、政府、金融、电力等行业为主的各行业逐步建立大型数据中心完成数据集 中处理,数据的集中也意味着风险的加剧,提高企业的抗风险能力,已成为急需考虑 和解决的问题。
业务中断对企业影响重大
企业业务如果缺乏业务连续性,关键业务中断对企业影响重大:直接收入损失、生产 力损失、名誉损失和财务业绩损失。
直接收入损失: 直接损失, 补偿金, 未 来营业额, 账单损失
和投资损失
识别关键业务功能和应用系统 识别应用系统之间的相互关联和支持关系 确定当在预定的时间内无法正常运行时,对
生产力损失 员工数 x 影响 x 小时 x 恢复额外工作 = ?
关键业务造成的损失及影响(定性和定量);
名誉损失:
灾难备份也是国家政策法规的要求
美国 《萨班斯法案》 中国中办 《国家信息化领导小组关于加强信息安全保障工作的意见》 中国人民银行 《关于加强银行数据集中安全工作的指导意见》 银监会《银行业金融机构信息系统风险管理指引》《商业银行操作风险管理指引》 证监会《证券公司集中交易安全管理技术指引》 保监会《保险业信息系统灾难恢复管理指引》
0.7%
小概率的自然灾害造成的巨大损失不可忽视!
灾备系统建设必要性—数据丢失意味什么
• IDC统计:美国在2000年以前的十年间发生过灾难的公司中,有55%当时倒闭,剩下的45%中,因为数 据丢失,有29%也在两年之内倒闭,生存下来的仅占16%;
• 美国明尼苏达大学的研究表明:在遭遇灾难的同时又没有灾难恢复计划的企业中,将有超过60%在两到三 年后退出市场。而随着企业对数据处理依赖程度的递增,此比例还有上升的趋势。
数据中心容灾备份解决方案
目录
1 灾备建设意义 2 灾备设计方法 3 华为灾备解决方案 4 华为的优势 5 成功案例
灾备系统建设必要性—灾害无处不在
来自国际权威机构瑞士 在保险的统计数据
全球在2004年因自然灾害和人为事故造成的直接损失达到1230亿美元 全球2005年共发生约400起巨灾,损失超过2300亿美元 2006年,自然灾害和人为灾难造成的损失低于长期趋势,直接损失480亿美元 在世界范围内与20世纪60年代相比,到了20世纪90年代,世界上可统计的自然灾害发生率增长了3倍,其经济损失增
直线型增加 天
风险和投资平衡
根据系统重要程度采取不同的恢复策略,平衡风险损失和系统建设投资
投入/ 运维成本
可接受的 停机时间
业绩 损失
投入多 数据丢失少
平衡点
投入少 业绩损失大
投资
恢复时间
允许的投资
业务连续性管理(BCM)的效果
灾难发生
事前
事中
事后
生 100% 产 能 力
BCP的效果 恢复
恢复时 可容忍的最大 间目标 中断时间
长了9倍
中国近年灾难的影响
2007年8月国务院办公厅印发的《国家综合减灾“十一五”规划》中指出,据估计我国近年来各类灾情综合直接损失已 高达8%的GDP(大多数发达国家只是千分之几)
自然灾害的种类是多种多样的,洪涝、台风、干旱等每年给国家带来2000亿元左右的经济损失 --国家减灾委 受汶川地震影响,整个银行业净损失约在50亿~130亿人民币, 没有灾备中心的城商行影响很大,08年银行业净利润下滑
CIO想什么
风险分析 Risk Analyze
机房内事件
x • 系统单点故障、机房电源系统故障、广域网故障、机 房漏水、空调系统故障、存储阵列关键设备故障、人 为破坏、软件逻辑错误、信息安全故障等
建筑物灾难
• 建筑物外部火灾、建筑物内部火灾、机房内部火灾、 长时间停电、光缆中断等
区域性灾难
• 机房所在区域或有紧密联系的地区交通、电讯、能源 及其它关键基础设施遭到严重破坏,或大规模人口疏 散的事件
容灾模式 双活 热备份 暖备份 冷备份
可靠性方案 集群+负载均衡 集群(cluster) 人工干预 人工强干预
灾备恢复 自动 自动 手动 手动
数据备份需求 实时同步复制(<100KM) 实时同步复制(<100KM) 异步复制(>100KM) 同上
容灾备份解决方案框架
政府行业
国际 标准
国内 标准
6-7级 6级
2级 备用场地支持
1级 基本支持
应用级容灾 数据级容灾方案+容灾应用软件
数据级容灾方案 异地备份方案
备份方案 备份方案
容灾设计模式:同步、异步相结合
可用性
高
热备份
双活
同步容灾:有距离限制
低
暖备份
2
高
1
4
3
冷备份
低
资源利用率
RPO:0s,两个镜像完全相同
异步容灾:无距离限制
3
1
2
4
RPO:从30min到数小时,定期更 新目标
DC1
MA
MA
iDA
iDA
ห้องสมุดไป่ตู้SAN
Production Center
MCSA
Backup & Archive Server
VTL/NAS
PTL Backup Center
DC1
AOPASOPPASOPPSP
HA Cluster Mirror
DC2
AOPASOPPASOPPSP
一般意义上,容灾指的是不在同一机房的数据或应用系统备份,备份指的是本地的数据或系统 备份。通常说的灾备是将容灾与备份结合,即本地备份结合远程数据复制实现完善的数据保护。
实现远程数据复制技术 备用网络也具备自动或集中切换能力
4级
电子传输及 完整设备支持
3级
电子传输和 部分设备支持
2级 备用场地支持
1级 基本支持
配置所需要的全部数据和通讯线路及网络设备,并处于就绪状态 7*24 运行;更高的技术支持和运维管理
配置部分数据,通信线路和网络设备 每天实现多次的数据电子传输 备用场地配置专职的运行管理人员
当前企业的IT环境?总数据量有多少,每天会新增多少数据? 我们企业的风险来自于哪些方面?如何规避风险? 业务中断带来的直接经济损失、名誉损失是多少? 对RTO、RPO的需求?哪种容灾建设模式最适合我们企业? 如何构建端到端完整有效的数据保护机制,提升数据可靠性的同时,提升企业的运营效率? 怎样实现绿色高效、节能减排等方面的统一规划以匹配国家战略?
1小时值多少钱 — 摘自互联网
业务 经纪业务运营 信用卡授权 付费收看 居家购物(TV) 目录销售 预定航班 电子标务销售 ATM费用
行业 金融 金融 媒体 零售 零售 交通 媒体 金融
停机1小时的损失 645万美元 260万美元 15万美元 11.3万美元 9万美元 9万美元 6.9万美元 1.45万美元
确定灾难恢复和业务连续需求(RTO和
客户, 竞争对手的获益,
RPO);
供应商, 资本市场, 业
识别关键的服务时间段和可容忍的性能下降 务合作伙伴
程度
财务业绩损失:
营业额的确认, 现金流,
信用评级, 股价, 违规
罚款
$万
$ I影响
$ 上亿
指数型增加
分
时间
财务业绩损失 名誉损失 生产力损失
直接收入损失
容灾 选型
链路 设计
演练 切换
服务 交付
评估 优化
匹配客户业务和发展策略,提供从战略咨询、容灾规划、业务实施到持续运营管理的专业服务。
华为容灾备份特点
灾备整合优化
-存储虚拟化(VIS和云管理 智能协同
-数据复制、数据传输、业 务迁移与网络/安全的协同
集中灾备管理和调度
-数据中心统一管理和监控 -灾备统一调度、维护
容灾和备份
备份:备份是容灾的基础,通常指在数据中心内, 将全部或部分数据集合从应用主机的硬盘或阵列 复制到其它的存储介质的过程。
容灾:容灾系统是指在相隔较远的异地,建立两 套或多套功能相同的IT系统,互相之间可以进行 健康状态监视和功能切换,当一处系统因意外(如 火灾、地震等)停止工作时,整个应用系统可以切 换到另一处,使得该系统功能可以继续正常工作。
目录
1 灾备建设意义 2 灾备设计方法 3 华为灾备解决方案 4 华为的优势 5 成功案例
灾备关键指标
周天时 分秒
秒分 时 天周
数据恢复时间点
应用恢复时间
数据恢复时间点(RPO)
故障时间
应用恢复时间(RTO)
RPO (Recovery Point Objective): 以数据为出发点
时间点备份
Tier 2 – PTAM+热备站点 Tier 1 – PTAM
15Min 1~4Hr 4~8Hr 8~12Hr 12~16hr 24Hr Days Weeks
RTO
灾备系统建设的国内标准
6级
数据零丢失和 远程集群支持
5级
实时数据传输 及完整设备支持
实现远程数据实时备份,实现零丢失 应用软件可以实现实时无缝切换 远程集群系统的实时监控和自动切换能力