当前位置:文档之家› 企业云容灾备份规划方案

企业云容灾备份规划方案

企业云容灾备份规划方案IT 现状问题分析总结:IT 架构优化已迫在眉睫存储•存储备份:没有规划备份机制,存在数据丢失的风险,包括财务核算,检验等重要数据•存储容量:由于大数据等业务发展非常快,存储没有统一复用,现有存储容量和性能已经无法满足要求运维•SLA 服务标准:当前没有发布云计算服务SLA 目标和测评标准,不能满足迁移到云上的业务连续性要求•运维工具:当前有网络/资产/ITIL 的运维工具,但缺乏服务器,存储和应用的运维工具,没有主动告警和故障快速恢复机制网络•网络架构:网络中存在大量的单点故障,一旦链路或者设备故障,会严重影响到的业务•网络设计:网络设计层次不清晰,二层广播域过大,一旦出现广播风暴,会导致整网瘫痪计算•物理服务器:服务器年限过长,一旦出现硬件故障,会导致对应业务中断•虚拟化:虚拟化,集群超配严重,导致HA 无法正常工作,一旦故障会导致大面积的业务瘫痪安全•安全技术:安全防御手段不足(IDS/WAF 没有充分利用),容易被黑客攻击,存在科研数据泄露的风险•安全制度:安全制度无法满足等保三级要求,会影响到后续业务向云上迁移的安全合规要求业务•开发平台:当前IT 开发平台不统一,各系统独立部署,形成资源孤岛,业务故障无法快速排除•系统架构:多套系统架构完全不同,没有统一的可靠性/可用性/安全性的软件架构设计,导致系统的可用性低,出现故障难以快速恢复3317143334当年1-3年4-6年7年以上⚫容灾问题➢当前对容灾备份暂无考虑,数据可靠性和容灾能力较差⚫资源利用问题➢某些阶段性应用,在相当长时期内或者永久不再需要,但是该资源不能被及时、方便的释放或回收,以供新系统使用,造成空闲资源的浪费⚫安全问题➢当前对安全防护及隔离考虑较少,而系统安全性格外重要,必须严格遵守集团对信息安全等级保护的要求;业务安全隔离也尤为重要⚫自动化及运维问题➢仍然存在很多手工配置的内容和纸件办公。

随着后续IT 资源规模不断扩大,服务模式转型会使得业务需求更具多样化,系统升级扩容将更加频繁,容易产生人为操作错误的问题,且不易维护信息中心一卡通员工报销档案管理统一支撑管理平台测试系统…系统仿真平台大数据平台天气预报平台信息化建设起步较早,但当前并行存在多套具有各自架构特点的平台,孤岛式建设导致资源不能重用,阻碍信息和业务的进一步深度集成和共享。

应用系统现状传统IT :✓IT 资源分散建设✓资源手工交付✓多个管理界面新IT :✓IT 资源服务化✓管理界面统一云平台建设目标以云服务平台作为企业云业务统一入口,提供IT 资源服务化的整合引擎,实现资源服务化、运维部署自动化建设目标建设内容平台架构技术选型高可靠设计路线•备份与容灾是保证业务连续性的两种技术手段,两者有着紧密的关联•备份的目的是保存历史数据,主要方式是将生产数据复制至其他离线介质中进行保存•容灾的目的是在异地建立与生产系统相同的环境并通过数据同步,将生产环境复制至容灾环境,当生产环境发生灾难时,由容灾环境接管业务继续运行•备份是容灾的基础,而由于逻辑故障恢复和归档等需求,容灾不能完全替代备份•不同的业务系统有不同的RPO 和RTO 需求,根据需求来规划合理的灾备方案Time可恢复的最近时间点系统恢复到可用的时间点灾难发生的时间点RPORTO通过备份加强数据的安全性,通过三地四中心建立容灾体系建设目标双活方案备份方案灾备方案线路图两地三中心双活+灾备中心模式多活中心模式分布式数据中心模式(理想状态)异地灾备中心主数据中心同城数据备份中心异地灾备中心主数据中心同城数据中心异地多功能中心(灾备、研发和部分生产应用)主数据中心同城数据中心数据中心C数据中心A数据中心B1.在同城部署核心、重要业务等较多业务的主备架构(为主),在异地部署核心业务的主要架构及较多系统的数据备份;2.仅在同城的两个中心都无法执行任务时,才启用异地容灾中心;以牺牲资源效率为代价满足灾备要求;1.根据应用特征进行同城部署,以充分利用资源,通常要求业务数据读写分离,例如:数据中心A 处理某应用的正常业务,而数据中心B 完成该应用以读为主的业务;2.同城数据中心保留一定的资源冗余,以保证在灾难状况下一定的服务质量;3.典型案例:四大行等国内大型金融机构陆续采用该模式1.与“双活+灾备中心模式”不同之处在于:部分关键应用实现同城的读写同步,同时实现不同应用部署异地的两个中心;2.各技术层面均有较成熟的解决方案,但缺乏整体应用的成熟案例1.各数据中心完全对等,支持所有业务应用的分布式部署(可同时读写);2.实现前提是形成数据存储在任意时刻、任意地点的单一视图,而目前尚存在克服异地时延的技术障碍资源效率应先建立同城灾备,再逐步推进到同城双活建设目标双活方案备份方案灾备方案线路图北京主中心南京数据中心武汉数据中心北京备中心◼北京做为作为的同城灾备中心,武汉、南京2个资源池数据备份到中心;◼南京作为北京异地灾备中心;◼灾备中心和生产中心在资源的投入上基本上是0.X:1,灾备中的资源要小于生产中心。

只有当生产中心不可用时,灾备中心临时接管生产业务,当生产中心恢复后,生产业务从灾备中心回切到生产中心;◼备中心仅作为备份和测试中心,不建议两边同时跑业务互为备份;◼南京和武汉需要在本地备份数据,当本地无法恢复业务时,才考虑在北京接管业务;三地四中心的职能规划建设目标双活方案备份方案灾备方案线路图虚拟化集群1虚拟化集群2备份服务器备份介质备份方案说明:◼在每个数据中心内外网各部署一套备份软件,备份介质可以利旧现有的磁带库;◼虚机无代理备份:在虚拟化平台安装备份Agent ,对整个虚机文件进行备份;◼可以针对每个虚机制定不同的备份策略;◼同时支持物理服务器和虚机数据的备份;恢复方案说明:◼优先选择在原集群恢复虚机;◼原集群无法恢复,在本地其它集群恢复虚机,在云平台重新纳管虚机;◼本地无法恢复,在异地虚级化集群中恢复业务,在云平台重新纳管虚机;备份规划建设目标双活方案备份方案灾备方案线路图•备份方式:全备份、增量备份、差异备份•备份开始时间:尽量避开业务运行期,不同的备份任务尽量错开•备份副本数:根据数据的重要程度和保留策略制定•备份周期:根据不同虚机的保护级别制定备份的频率•备份策略示例:备份对象全备份周期增量备份周期数据保留副本备份开始时间虚拟机1每周每天400:00虚拟机2虚拟机3每周每2天401:00虚拟机4每月每周607:00数据库1每天/204:00数据库2每周每天606:00根据业务系统的重要性,制定不同的备份策略建设目标双活方案备份方案灾备方案线路图vSwitch V MV MV MvSwitch V MV MV MvSwitch V MV MV M共享存储虚拟化集群备份介质备份服务器备份网络VM 备份数据库服务器数据库存储数据库备份备份介质备份服务器vSwitchV MV MV MvSwitchV MV MV M共享存储虚拟化集群北京主中心北京备中心备份介质备份服务器vSwitch V MV MV MvSwitch V MV MV M共享存储虚拟化集群武汉数据中心备份介质备份服务器vSwitch V MV MV MvSwitchV MV MV M共享存储虚拟化集群南京数据中心备份说明◼每个数据中心均做本地数据备份◼主中心在同城和异地南京同步备份数据,武汉、南京的备份数据同步至数据中心恢复说明◼业务恢复需要通过云管理平台或者备份软件与云管理平台定制;◼优先在本数据中心恢复业务;◼虚拟机在原集群中恢复业务,如果原集群无法恢复业务再在其它集群中恢复;◼本地无法恢复业务时再从备中心恢复业务;四中心异地容灾的规划建设目标双活方案备份方案灾备方案线路图云管理平台(主)SDN-C ClusterRegion2SDN-C Cluster Region1vSwitch V MV MV M云管理平台(备)vSwitch V MV MV MvSwitchV MV MV M汇聚汇聚汇聚汇聚vSwitch V MV MV MvSwitch V MV MV MvSwitchV MV MV M二级网关组存储复制SDN 控制器集群存储远程复制SRM虚拟化集群(主)虚拟化集群(备)主中心备中心容灾架构说明:1、通过SDN+Overlay 技术将两个数据中心构建成大二层网络:(1)两个数据中心的三级和二级汇聚构成一个无状态网关组;(2)每个网关组发布相同的VTEP IP 地址,每一个数据中心会自动根据最短路径算法,将自己的汇聚设备选为GW 网关;(3)SDN 控制器跨数据中心形成集群;2、虚拟化平台通过SRM 进行容灾切换:(1)对于重要的需要做容灾的数据通过存储远程复制;(2)虚拟化平台通过SRM 实现主备切换;3、云管理平台通过存储复制来实现数据同步,并通过主备部署,实现切换:4、大数据和VDI 容灾成本较高、技术不成熟,暂不考虑容灾;汇聚汇聚汇聚汇聚三级网关组核心核心核心核心主备数据中心容灾架构建设目标双活方案备份方案灾备方案Hypervisor+SRM主中心备中心Hypervisor+SRM 光纤网络VXLAN 网络存储复制复制关系断开扫描并挂载存储虚拟机启动•通过存储的远程复制功能,将主中心所有的虚机数据同步至备中心•虚拟化平台数据也同样从主中心同步至备中心•在主中心发生站点级故障后,将业务全部切换至备中心运行•备中心挂载存储•VM 自动启动运行虚拟化平台异地恢复(SRM )介绍建设目标双活方案备份方案灾备方案线路图优先本地恢复异地传输回本地恢复灾备中心接管业务•数据发生逻辑错误或者硬件故障导致业务中断时,优先通过本地的备份数据进行数据恢复•在本地生产数据和备份数据都丢失的情况下,如果业务系统仍能运行,则将异地备份数据传输回本地后,再在本地进行数据恢复•如果本地数据中心已完全瘫痪,生产数据和备份数据均丢失,则需要在灾备中心()接管业务继续运行灾备恢复策略建设目标双活方案备份方案灾备方案线路图IntranetInternet网络调度Web/App平台数据库服务网络负载均衡应用负载均衡灵活调度数据库双活NASFC SAN存储服务存储双活同时读写零数据丢失用户接入技术层面⚫服务器/虚拟机之间的集群协同⚫数据的复制与同步⚫两地网络互联互通⚫分支/Internet 用户对DC 的访问、链路双归属⚫网络访问控制策略的迁移,业务分流⚫网络带宽与服务质量的要求⚫IP 地址设置、路由发布控制、网关设计、防火墙状态会话、流量路径规划及迂回控制等技术非技术层面⚫宏观角度考虑业务系统的分布式部署⚫对应用与软件系统的流程再造与开发⚫运维协同操作系统业务系统操作系统业务系统操作系统业务系统虚级化双活虚机服务操作系统业务系统操作系统业务系统操作系统业务系统NASFC SAN 云portal 云portal管理区双活云服务双活云数据中心是一个复杂的系统工程建设目标双活方案备份方案灾备方案线路图双活数据中心技术架构备份方案灾备方案线路图建设目标双活方案第二阶段第三阶段本地备份同时备份数据传到到备数据中心和实现同城主备数据异地备份到南京数据中心进行异地容灾数据中心双活灾备线路规划建设目标双活方案备份方案灾备方案线路图第一阶段谢谢!。

相关主题