当前位置:文档之家› 浅谈容灾与容灾方案设计

浅谈容灾与容灾方案设计

浅谈容灾与容灾方案设计自从有了信息技术以来,信息系统面临的各种故障和灾难就从来没有停止过。

在企业信息化进程不断加快的今天,保持业务的持续性是企业用户进行数据存储时必须考虑的重要问题。

灾难的出现,可能导致生产停顿、客户满意度降低,企业的竞争力会因此大打折扣。

震惊世界的“9.11” 事件让全世界都看到了金融、电信企业在灾难中遭受的巨大损失。

08年的南方雪灾和汶川地震告诉我们,灾难就在我们身边,容灾系统的建设已经刻不容缓。

容灾是指为了保证关键业务和应用在经历各种灾难后,仍然能够最大限度的提供正常服务所进行的一系列系统计划及建设行为,业务连续性是容灾的最终建设目标。

一般来说容灾是一个宏观的概念,IT领域所说的灾备、灾难恢复等只是容灾的一部分,主要讨论数据和信息系统保护的问题,或者说是容灾整体框架中的技术基础部分。

容灾技术的进步和需求的增长是企业信息化发展的必然结果,同时也反映了信息化系统及数据对个人、企业和国家的重要程度的不断提升。

信息系统容灾建设的目标是提高信息系统抵御灾难和重大事故的能力,减少意外情况发生所造成的损失,减轻对企业和社会带来的不良影响。

容灾与数据安全性是密切相关的,数据的安全性是实现业务连续性的基础。

统计结果表明,在过去5年内,全球93%的公司有过丢失重要数据而造成业务损失的经历,72% 的业务没有可靠的业务连续性计划,只有18%的最终用户的数据得到了可靠保护。

虽然已经认识到数据安全的重要性,但很多企业在如何建立容灾系统的问题上却存在种种疑惑。

我国在实施容灾工程方面尚处于初级阶段,某些已经建成并投入使用的容灾系统,功能单一,而且存在投入成本高、投资回报率低、容灾数据的可恢复性难以验证、管理成本居高不下等问题。

以上种种因素使得部分准备建立容灾系统的用户裹足不前。

为此,国务院信息化工作办公室于2005年4月下发了《重要信息系统给灾难恢复指南》,而后2007年国家标准《信息系统灾难恢复规范》出台,指明了灾难恢复的流程,灾备建设的等级划分及灾难恢复预案的制定等内容,为企业的相关工作提供了有益的参考。

要建设容灾工程必须提出容灾系统的建设目标,作为衡量和选择容灾产品技术和解决方案的参数。

例如:●备份/恢复的范围●灾难恢复计划的状态●业务系统与容灾系统之间的距离●业务系统与容灾系统之间如何相互连接●数据是怎样在两个系统之间传送的●允许有多少数据被丢失●怎样保证更新的数据在容灾系统被更新●容灾系统可以开始支持服务的能力在设计容灾系统时,还需要提供更加具体的设计指标。

建立容灾系统的最终目的,是为了在灾难发生后能够以最快的速度恢复数据服务,所以,容灾中心的设计指标主要与容灾系统的数据恢复能力有关,最常见的设计指标有:RTO 和RPO。

RTO(Recovery Time Objective)代表容灾系统在灾难发生后数据或者系统恢复所用的时间。

RPO(Recovery Point Objective)代表灾难发生时已经备份的数据与生产中心数据的时间差。

通常情况下,容灾系统投资较大,使用概率较低,因此,需要对总体投入成本(TCO)和投资回报率(ROI)进行认真的分析和计算。

从经济角度考虑,最佳的容灾技术不一定是最好的容灾解决方案,容灾系统的总体投入TCO和投资回报ROI,对于许多用户来说是十分重要的设计指标。

TCO 包括建立系统、维护系统和扩充系统的总投入,由于容灾系统的启用概率很低,新技术的发展和新产品的性能价格比的提高,必定造成容灾设备的贬值。

所以,对于容灾系统TCO越高,ROI越低。

不同企业的系统环境千差万别,从单机到大型数据中心,从小型单业务到复杂的多业务集成。

平台复杂度、数据复杂度、业务复杂度、管理复杂度的区别使得我们很难用简单的思维去理解和规划容灾系统。

容灾项目的推进不是需求与技术的简单匹配,而要深入地分析用户的应用环境,找到最适合的解决方案。

正所谓“没有最好的产品,只有最合适的方案”。

容灾的建设不能局限于技术类型的划分,而是帮助用户打破产品技术局限,根据不同应用的特点,综合地考虑RTO、RPO、TCO、RIO等指标和技术实现方式,提供从单业务系统到企业数据中心的多套灾难解决方案共用户选择。

用户不必过多地考虑不同技术的差异,仅需要理解技术方案与自身业务的匹配度。

例如,针对中小企业,UIT提出的基于主机容灾方案,充分考虑中小企业没有大型存储,环境简单的特点,支持从操作系统 -- 应用软件-- 数据的全面容灾保护,使得客户不需要关心数据结构和类型的差别。

UIT方案兼具HA与远程复制容灾功能,传输数据量小,容灾距离无限制等特点。

首先对生产系统做数据镜像,实时捕捉系统byte-level变化,当数据有任何变动时,将变动的部分更新至目标备用服务器,一旦生产数据库宕机,则灾备服务器立即接管相关的服务,系统实时数据复制与保护,最大程度降低服务中断时间,并可加强磁带备份机制,该方案同时支持SAN,NAS或 Microsoft Cluster Server(MSCS)等中小企业常用应用平台,系统环境不需要修改,最大限度的保护了现有设备的投资。

大型企业的容灾建设就需要另外的思路。

企业级数据中心的复杂度在于平台繁多,各类系统的RTO、RPO指标可能差距很大。

如果分散使用各类容灾技术,会极大的影响产品采购及后期使用维护的整体成本(CTO)。

所以在数据中心环境下建立灾备系统,不能单独考虑某个技术或产品适合某个系统的问题。

另外大型企业数据中心进行容灾建设的前提是数据的集中。

如果在数据分散存储的状态下做容灾规划是不可想象的。

因此统一的SAN存储结构最有利于容灾系统的设计。

UIT提出的存储虚拟化企业级容灾方案即基于以上环境,充分考虑大型数据中心对高可靠性、高性能、高扩展性的要求,利用带外虚拟化技术在现有的SAN 存储架构上增加虚拟化管理器来实现高级的统一存储管理和远程容灾功能。

UIT 方案提供先进的、集中简化的SAN管理及多层次的数据保护功能(快照和复制)。

企业用户能够更加有效地管理和利用存储系统,建立可靠的容灾环境,确保业务的可靠性和连续性。

同时,该解决方案能够使用户的存储基础构架更具扩展性和灵活性,支持不同厂商的存储平台,将选择权真正交还给用户,现有设备的投资受到保护,从发展的观点看能够真正降低企业的总体拥有成本(TCO)。

容灾备份技术的应用,帮助企业在发生不可抗拒灾难之后,能够在第一时间内恢复公司企业的重要数据,以求达到业务连续性的目的,是公司尽最大可能减少灾难下的损失,为企业赢得利益上的保证。

灾备建设基本方法的三个要素灾备建设的基本方法,一言以蔽之,就是灾备目标、拥有成本和灾备技术方案选型三者的权衡。

灾备目标,就是熟知的RPO和RTO,可对应于《灾备信息》所规定的灾备系统等级;灾备拥有成本,一般包括首次建设成本和后期运维成本;灾备技术方案,就是实现灾备目标的技术手段,具体包括备份、复制、镜像、集群、虚拟化等技术和技术组合方案。

灾备目标和拥有成本的关系是比较容易理解的,要实现或达到怎样的灾备目标或等级,就需要花费相应的成本,绝大部分的情况下,灾备目标和等级越高,总体拥有成本越高。

灾备目标和容灾备份技术方案的关系是,灾备目标决定了灾备技术手段的选择范围。

这里的“范围”是指一个技术产品群,也就是说达到同一个灾备等级是有多种技术可选择的,每种技术在业内又有不同的产品,如何选择是核心问题,也是用户在灾备建设中的最为困惑的问题之一。

本文正是通过对灾备关键技术的介绍,告诉您灾备技术选择的一般方法。

灾备技术需求新发展随着IT系统建设的日益复杂化,在灾备实际建设中,除了关注传统的灾备目标和等级要求(RPO和RTO)外,还涌现了一些典型的技术需求。

这些需求由于与灾备目标实现和总体拥有成本紧密相关,正逐步成为灾备建设技术评价体系的一部分,越来越受用户的重视。

归纳起来有以下几个方面。

1.生产系统的影响程度灾备部署和运行对生产系统的架构、性能的影响程度,表现为对生产系统资源的占用程度和部署容灾备份技术对原架构的更改程度,占用和更改程度越大,说明影响程度越高,越需要进行技术改善。

2.统一灾备能力目前中大型企业机构的数据中心都有多个IT系统,同时存在多品牌或不同档次的存储、服务器。

由于品牌技术的锁定,特别是存储系统的品牌锁定,灾备中心建设面临一个典型的技术无奈:为每套存储系统建立单独的灾备系统,庞大的多套灾备系统由此产生。

这样的情况下,不仅灾备成本居高不下,而且灾备日常运行维护投入也很高。

因此,越来越多的用户希望获得多个生产系统统一灾备的解决方案。

这样的方案有两个特点:第一,灾备中心只建设一套灾备系统,承载多个生产系统的灾备业务;第二,统一管理分散的多套生产系统的灾备业务。

3.逻辑软灾难应对需求据权威统计,IT系统计划外宕机的故障原因中,有49%是由于人为误操作、软件bug、病毒等逻辑软灾难造成的。

越来越多的灾备建设规划,将具备软灾难的恢复能力作为灾备系统的建设目标需求。

4.灾备链路带宽要求灾备建设有灾备距离要求,灾备链路规划是容灾备份技术建设的技术主题之一。

目前大部分用户的灾备链路都采用租用公共链路方式,灾备系统的链路需求与总体拥有成本强相关。

选用带宽要求小的灾备技术或者部署相关的带宽优化技术成为技术选型的方向。

5.灾备数据可用性低级的容灾备份技术需要在数据反向恢复后才能检验灾备数据副本是否完整一致,数据反向恢复操作对源数据是一次覆盖,具有极大风险。

用户需要这样的高级的灾备技术,无需进行数据恢复,能实现数据副本的即时可验证;灾备数据的可用性是指多大程度上实现灾备数据副本的可用,分为不可用、可用(需进行少量低风险操作后可用)、实时可用(源数据及其副本可同时提供业务访问)。

灾备基础数据同步技术灾备技术源于数据保护技术,其核心的技术思想是为数据在异地创建副本。

灾备技术就是利用数据保护的基础技术在几十公里、数百公里甚至千里之外的系统中创建数据的副本,实现生产系统和灾备系统的数据同步。

虽然实现某一灾备等级和目标有多种技术和产品,但纵观业界的灾备产品,万变不离其宗,都是基于以下几个数据保护与同步基础技术。

灾备数据同步技术实现与选型1.备份技术传统备份技术的实现已经被当前的用户大量应用并被熟知,技术实现不再赘述。

备份技术在技术成熟度和成本上是有优势的,但这个技术部署在灾备系统中是有明显局限性的,主要体现在以下几个方面:备份时间长,存在备份窗口,无法实时灾备,所以RPO至少在半天以上容灾备份技术有效性无法检验,灾备可靠性差备份有数据格式转换,灾备恢复时间长备份技术近几年有了一定的优化,主要有两个方面:基于磁盘备份技术,产生了D2D(磁盘到磁盘)和D2VTL(磁盘到虚拟磁带库)的备份方案。

这种技术方案大大缩短了备份时间,备份窗口进一步减小。

相关主题