当前位置:文档之家› 数据中心灾备服务

数据中心灾备服务

数据中心灾备服务方案相关内容如何应对“将鸡蛋放在一个篮子里”所带来的风险?对于信息化应用而言,灾备系统的建设已成为备受关注的热点和重点。

概述数据中心是数据大集中而形成的集成IT应用环境,它是各种IT应用服务的提供中心,是数据计算、网络、存储的中心。

数据中心实现了安全策略的统一部署,以及对IT基础设施、业务应用和数据的统一运维管理。

数据大集中的同时也对数据安全提出了更高的要求,如何应对“将鸡蛋放在一个篮子里”所带来的风险,已成为备受关注的重点。

面对频频发生的雪灾、地震等自然灾害,对于信息化应用而言,灾备系统的建设也已成为热点。

随着2007年11月《信息系统灾难恢复规范》正式成为国家标准,许多用户将从观望、徘徊转向实际应用。

对于正处于服务转型期的电信运营商来说,借助灾备中心应用热潮,提供更有价值的信息化服务,改变原有的、单一的网络接入商角色,是值得把握的一次良好机会。

灾难备份概念介绍1. 灾难备份的分类灾备从应用层次,大体可分为三个类别:数据级别、应用级别和业务级别。

从用户整个业务连续性的保障程度来看,其高可用性级别也随之逐级提高。

1) 数据级别数据级别灾备的关注点在于数据,即灾难发生后可以确保用户原有的数据不会丢失或者遭到破坏。

数据级别灾备是保障数据可用的最低底线,当数据丢失时能够保证应用系统可以重新得到所有数据。

这种方案的优点是投入低,构建简单。

2) 应用级别对于业务应用繁多,并且系统需要保持7*24小时连续运行的企业来说,显然需要高级别的应用灾备系统来满足其需求。

应用级备份是在数据级灾备的基础上,在备份站点同样构建一套应用系统。

应用级灾备系统能提供不间断的应用服务,使用户的服务请求能够透明地继续运行,保证信息系统提供的服务完整、可靠和安全,完全不受灾难的影响。

一般来说,应用级灾备系统需要通过更多软件来实现,它可以使企业的多种应用在灾难发生时进行快速切换,确保业务的连续性。

3) 业务级别即使构建了数据级灾备和应用级灾备,也都还是在IT范畴之内,对于正常的业务而言,仅有IT系统的保障还是不够的。

当一场大的灾难发生时,原有的办公场所都会受到破坏,除了需要原有的数据和原有的应用系统,还需要工作人员在一个备份的工作场所能够正常的开展业务,这就要包括原有工作环境中的一切必须工作设备(如电话、电传、扫描和打印等)。

因此用户需要构建最高级别的业务级别灾备,这一级别灾备的大部分内容是非IT系统。

2. 灾难备份的等级划分以下依据国标GB20988-2007-T《信息安全技术信息系统灾难恢复规范》来说明灾难恢复的等级要求。

1) 灾难恢复资源要素支持灾难恢复各个等级所需的资源可分为如图1所示的7个要素:图1 灾难恢复资源要素数据备份系统数据备份系统通常由数据备份的硬件、软件和数据备份介质组成,如果是依靠电子传输的数据备份系统,还包括数据备份线路和相应的通信设备。

数据备份系统是灾难备份系统的最基本要素,如何将数据(包含系统、应用和业务数据)完整的、实时的复制到灾备中心是灾备系统建设需要重点考虑的事项。

备用数据处理系统备份数据处理系统是指备用的计算机、外围设备和软件。

备用网络系统备用网络系统是最终用户用来访问备用数据处理系统的网络,包括备用网络通信设备和备用数据通信线路。

备用基础设施备用基础设施是灾难恢复所需的、支持灾难备份系统运行的建筑、设备和组织,包括介质的场外存放场所、备用的机房及灾难恢复工作辅助设施,以及容许灾难恢复人员连续停留的生活设施。

专业技术支持能力专业技术支持能力是对灾难恢复的运转提供支持和综合保障的能力,以实现灾难恢复系统的预期目标。

包括硬件、系统软件和应用软件的问题分析和处理能力、网络系统安全运行管理能力、沟通协调能力等。

运行维护管理能力运行维护管理能力包括运行环境管理、系统管理、安全管理和变更管理等内容。

灾难恢复预案灾难恢复预案是保障关键业务功能在灾难备份中心的恢复和重续运行、主系统的灾后重建和回退工作,以及突发事件应急响应的组织流程和预案。

2) 灾难恢复能力评价指标一般地,灾难恢复能力采用三个主要的容灾指标RTO、RPO、NRO作为评判依据:恢复时间目标RTO(Recovery Time Object)该指标是容灾恢复的时间指标,从广义上来说是从灾难发生造成业务中断,直到通过各种方法恢复业务所需要的时间。

通常越短的RTO意味着越高的容灾能力。

另一个狭义的RTO指标是指从决定进行容灾切换到业务可以继续运行所经过的时间。

一般用狭义的RTO指标评价IT层面的容灾能力。

恢复点目标RPO(Recovery Point Object)宕机导致的停机不是故障影响的全部,宕机带来的另一种影响对企业的损害可能更大,那就是永久性数据丢失:宕机以前的数据没有保存到在线数据库或文件中。

宕机之后数据开始恢复的时间点称之为恢复点,恢复点指标RPO,就是当业务恢复后,可以达到与灾难发生前那个时间点相同的工作状态。

通常RPO对应着灾难造成的数据丢失程度,如果RPO为0,就相当于没有丢失任何数据。

但这种理想状态往往是无法达到的,这就涉及到业务回滚。

业务恢复与回滚的不同之处在于业务恢复不考虑数据丢失,特别是对于没有前后连贯性的一类业务,新的业务处理不需要以前的业务结果,当灾难恢复完成后,可以直接进行新的业务;而业务回滚是与数据丢失相关的,丢失的数据必须通过各种方法进行修复,可能需要手工完成,新业务开始运转后会持续很长的时间,这段时间就是业务回滚时间,也可以叫做修复灾难造成的损失时间。

网络恢复目标NRO (Network Recovery Object )网络恢复时间是指当灾难发生后,最终用户切换到备用网络系统,并且可以通过备用网络访问灾备中心所需的时间。

一个快速收敛聚合的网络可以为应用和数据的迁移提供可靠的传输路径。

NRO 可以滞后于RTO ,也可能超前于RTO 。

图2 RPO/RTO/NRO 三者关系3) 国标灾难恢复等级以下是对国标灾难恢复等级的简要描述,表1中用蓝色字体表明了不同等级对备用网络系统的要求。

表1 国际灾难恢复等级描述 SHARE78 《信息系统灾难恢复规范》GB/T 20988-2007Tier-0 无异地备份数据 第1级 基本级。

备份介质场外存,安全保管、定期验证。

对备用网络没有要求。

Tier-1 有数据备份,无备用系统Tier-2 有数据备份,有备用系统 第2级 备份场地支持。

网络和业务处理系统可在预定时间内调配到备份中心。

配备部分通讯线路和相应的网络设备,或在灾难发生后能在预定的时间内调配所需的通讯线路和网络设备到备用场地。

灾备服务实践在规划和建设灾难备份和恢复系统时,用户经常面临着许多同样的困惑,例如,对灾难恢复建设不熟悉、缺乏经验;管理、技术、运维都面临调整;垂直行业无标准或标准混乱;投资保护和长远规划难以兼顾等等。

如何在满足业务需求的基础上,摆脱灾备系统成本高、建设难的困扰?杭州电信为杭州市政府搭建的共享灾备平台值得借鉴。

作为整个杭州市的数据集中备份平台,杭州市政府共享灾备中心要为各个市级部门的非涉密信息系统的重要数据实现集中灾难备份,通过提供统一的数据备份平台,在确保数据安全的基础上,满足相关单位应用级、数据级的容灾备份需求。

由于杭州市政府各相关委办局IT系统建设程度不一,数据存储形式复杂,要搭建起一个同时满足各种不同复杂需求的统一灾备中心,的确是一项非常“棘手”的任务。

杭州市政府经过综合对比(见表2),最终认定共享灾备服务是一种较合适的选择。

杭州电信在国内率先搭建起了全外包式的政府共享灾备中心,帮助杭州市政府多个委办局实现数据集中备份,开创了运营商提供共享式数据保护外包服务的先河。

表2 杭州市政府灾备平台三种建设方式对比出现问题多厂家相互推卸责任想结果相差甚远用,系统可靠运行可升级和可迁移性一旦升级又要考虑设备兼容性和设备的整合,数据迁移不方便基本是将自建的烦恼委托第三方,但是必须全程主导按需调整,随时可以升级或迁移,随着部门业务的发展,设备可以方便的利旧重复利用,大大节约系统升级费成本问题投资大,各系统均花费巨大,维护更是很大一部分投资巨大,维护成本严重受限于第三方的水平购买即可使用,运行成本低,维护简单,而且有运营商、厂商直服何种用户采用对组织财力、能力经验均要求很高,特别是IT技术实力强需要全部灾备服务而无能力、经验建设任何用户综合优势比较☆★★★★★1. 共享灾备方案总体介绍共享灾备解决方案利用数据保护技术、多对一的远程复制技术、数据加密和安全传输技术,不仅实现了多个用户生产中心到运营商共享灾备中心的灾备,还实现了灾备平台的集中管理和基础架构共享。

图3 共享灾备平台总体架构图如图3所示,共享灾备平台通过统一数据管理平台和虚拟化平台形成统一的管理中心,并提供运营商业务平台接口,作为灾备运营的管理平台。

运营商对共享灾备平台进行运营管理时,底层设备对使用者相当于是透明的,运营管理人员可以:动态分配和扩展备份空间,进行统一的资源配置;动态设置和改变备份策略,进行统一的备份策略设置;在同一管理界面中同时管理各种存储设备,异构厂家磁盘阵列逻辑资源可以通过虚拟化后纳入灾备平台的统一管理;对全网存储设备进行故障监控。

2. 共享灾备方案特点共享灾备解决方案充分整合了IP网络、存储、安全等领域的技术,采用层次化管理结构、开放的体系架构和标准的技术实现,使灾难备份系统建设突破了长期困扰的兼容性、成本和管理性桎梏,为运营商提供数据中心增值服务提供了可能。

该方案设计具备如下特点:1) 适合广域部署的IP存储跨广域网的数据备份在技术上至少有三个要点:如何保障数据传输的带宽,如何保障数据传输的安全性,如何保障在复杂网络结构下的数据传输。

解决的核心是以IP为代表的标准化技术。

将10Gb网络技术、虚拟化技术、远程复制技术和镜像技术、CDP连续数据保护技术、WSAN广域存储技术、存储网络安全技术等进行一体化融合后,推出了新一代IP SAN。

IP SAN的出现使得广域存储的部署变得简单。

2) 逻辑上独立,物理上统一的灾备平台给每个用户划分逻辑上独立的存储空间,对用户生产中心的数据进行保护。

这些“独立”的存储空间在物理上也可以集中在同一台存储设备上,这样能很好的提高存储设备的资源利用率,提高用户的投资回报率。

3) 业务分层、统一管理、弹性架构共享灾备解决方案由资源层、虚拟层、业务层三个层次构建。

其中,虚拟层的作用是一方面将网络、存储、安全等设备资源化,另一方面通过屏蔽异构厂家的差异化向业务层提供统一的接口。

这三个层次均基于IP标准技术,提供良好的扩展及兼容性。

图形化的管理界面和统一的管理平台,符合业内流行趋势,使管理变得更加集中、更加容易。

还可以提供不中断业务的在线可视化管理。

相关主题