1XXXX 系统 赛门铁克方案建议书2010-11赛门铁克软件(生产中心)有限公司Your Infrastructure. Your Information. Your Interactions. Only Symantec Protects Them All.目录1系统需求分析 (2)1.1系统建设目标 (2)1.2需求简析 (2)2高可用容灾方案设计 (3)2.1 设计原则 (3)2.2方案概述 (4)2.2.1 网络拓扑图 (4)2.2.2 软件安装 (5)3高可用容灾方案实现 (5)3.1 软件功能解释 (6)3.2 安装、配置过程 (11)3.3 工作过程 (12)3.4方案分析 (16)3.1.1 3.4.1 有关数据的量化分析及结果 (16)3.1.2方案小结 (17)1系统需求分析1.1系统建设目标建设本系统的目的是为XXXXXXXX系统建立一个全面的、整体的容灾方案,最大限度地保证业务系统工作的连续性、可靠性。
1.2需求简析在XXXX以往的业务系统中没有考虑本地高可用性, 也没有远程容灾中心.但是,随着XXXX业务系统的发展,随着竞争的不断加剧,在一些重要的系统中,客户已经不满足于简单的本地保护。
越来越多的客户提出了要求更高的系统可用性,要求实现真正的异地容灾保护。
因为一旦出现异常情况,如火灾、爆炸、地震、水灾、雷击或某个方向线路故障等自然原因以及电源机器故障、人为破坏等非自然原因引起的灾难,导致业务正常无法进行和重要数据的丢失、破坏,造成的损失将不可估量。
因此,XXXX要求业务系统可以在发生上述灾难时快速恢复,将损失降到最低点。
全面的异地容灾保护方案,意味着除了要实现本地的切换保护外,更要实现数据的实时异地复制和业务系统(包括数据库和应用软件)的实时远程切换。
2高可用容灾方案设计2.1 设计原则我们为XXXX提供的高可用容灾方案的设计原则如下:●方案当前即可实施●在满足要求的前提下尽量简单●除特别必要,不需要增加另外超出本方案的软硬件●如果一个软件产品可以实现需要的功能,我们不会再使用另外的产品实现重复的功能●同一方案适合多种平台环境,降低安装、管理和维护的难度。
VERITAS的容灾方案是一个完整的方案,该方案包括三个功能:主节点(存储虚拟化)到灾备节点的数据远程实时复制、本地应用服务和数据复制服务的切换保护、应用远程容灾切换。
涉及的产品包括V olume Manager+V olume Replicator,VERITAS Cluster Server和Global Cluster Manager。
在该整体方案中中,上层依赖于它的下层,每一层的产品实现相应的功能。
图中涉及的软件产品将在下面论述。
2.2 方案概述2.2.1 网络拓扑图本方案在异地搭建容灾中心,通过VVR 技术把生产中心(虚拟存储池)的数据同步到灾备中心,当,出现故障时用GCO 来做自动切换,因为VVR 属于卷复制技术,所以不用考虑存储上是数据库还是文件.,因为灾备中心需要能够接管生产中心和容灾中心的所有业务,所以,要考虑灾备中心的服务器性能问题,可以考虑在灾备中心放两台服务器做备机用来切换.具体数据同步过程和切换过程下面有详细介绍.在两种情况下,每个地点的每台服务器上安装的软件相同,只是不同情况下配置方法不同,每台服务器的具体配置方法后面讨论。
每台服务器安装软件如下:1) 安装VERITAS V olume Manager(VxVM)2) 安装VERITAS File System(VxFS)3) 安装VERITAS V olume Replicator(VVR)4) 安装VERITAS Cluster Server(VCS)、相应的数据库代理(Agent)和应用软件代理5) 安装VERITAS Global Cluster Manager(GCM)3高可用容灾方案实现本章将就该方案的每个细节进行讨论。
包括方案的详细讲解,软件的实际配置方法等。
通过阅读和理解本章,您将了解VERITAS解决方案的实现方法,并清楚地知道VERITAS解决方案是切实可行的,并且有相关的实施案例和实施经验。
本方案仅需要增加不同地点间的广域连接,需要增加一台主机和一台存储设备。
软件方面要用VERITAS高可用软件新增V olume Manager、VERITAS File System、VERITAS V olume Replicator和Global Cluster Manager。
在介绍功能前,需要强调的的是:VERITAS提供的是完整的容灾解决方案。
各个软件的功能完全集成在一起,建立一个容远程数据复制、本地容灾、远程应用切换于一体的方案。
在这里,每个软件只解释与本方案相关的那部分功能,一、VERITAS V olume Manager(简称VxVM) 将在物理磁盘上建立多个或一个逻辑卷(V olume)。
以裸设备的方式使用卷,或在卷上建立文件系统。
将数据(特别是需要进行远程复制的相关文件系统、数据库)存放在卷上。
由于数据复制是基于卷的,所以,V olume 是进行复制的基础。
二、VERITAS V olume Replicator(简称VVR)负责远程数据复制。
VVR复制基于V olume进行。
复制的数据可以是数据库中的数据(文件方式或裸设备方式)和文件。
复制的示意图见图四。
图四1)VVR与VxVM完全集成在一起。
用VxVM管理界面和命令统一配置管理;由于VVR仅仅将V olume上每次I/O的实际数据实时复制到远程节点,所以在网络线路上传输的数据量很少,对带宽的需求也很小。
;2)将各个业务系统中需要进行远程复制的多个或一个卷定义为一个Replicated V olume Group(简称RVG);3)在Site A定义一条RLINK,指向Site B;在Site B也定义一条指向Site A的RLINK。
RLINK是单向的;需要进行复制的两个系统各定义一个指向对方的RLINK;每个RVG定义一个RLINK。
例如有Site A和Site B两套系统同时用Site C的系统作为备份。
在Site A定义一个RVGa,包含需要进行数据复制的卷;在Site B定义一个RVGb,包含需要进行数据复制的卷;在Site C定义两个RVG,名为RVGa’和RVGb’,分别作为Site A RVGa和Site B RVGb的备份。
然后,在Site A定义RLINK to_c1,指向Site C;在Site B定义RLINK to_c2,指向Site C;在Site C定义两个RLINK,一个to_a,指向Site A,另一个to_b,指向Site B。
4)Storage Replicator Log(简称SRL)是VVR中的重要部件。
将数据复制各方的某个卷定义为一个SRL。
需要复制的数据首先要写入SRL,然后传到异地。
VVR通过SRL保证数据复制严格按照写顺序进行,这在异步工作方式下非常重要。
当网络中断或异地系统出现故障时,本地数据将记录在SRL中,等系统恢复正常时再将SRL中的数据按照先进先出的顺序传送到异地。
当SRL满后,VVR将通过Data Chang Map(简称DCM)记录变化过的数据块的块号。
VVR数据流程见图五:图五5)Data Change Map(简称DCM)与主节点的RVG相关,它其中的内容是位图信息,记录某一时间点后修改过的数据块位置。
DCM在正常情况下不使用,在SRL满后记录变化的数据块的块号,当恢复正常复制后,等SRL中的数据传送完后,将DCM中记录的块传送到异地。
灾难恢复后的反向复制也用到DCM。
6)数据复制的工作模式缺省为同步/异步自适应,即在网络延时情况较好、数据能够及时复制时,工作在同步方式,完全保证两边数据的一致性;当网络延时情况较差、数据不能及时复制时,工作在异步方式下,保证主节点的I/O性能。
数据复制根据实际情况,自行在两种工作模式之间切换。
如果数据复制的线路带宽有限,出于保证本地服务器读写性能的考虑,可以将复制工作模式定义为异步。
由于VVR的数据复制严格按照I/O的修改顺序进行,所以,无论在同步还是异步工作方式下,都能保证数据的完整性。
对于数据库系统,该复制机制能够保证灾备节点的数据库在灾难发生时正常启动并提供服务。
7)后备节点的完全同步,即所谓的”建立基线”。
在主节点往后备节点正常复制数据前,必须逐块逐块地将主节点中需要复制的数据拷贝到后备节点,也就是说,将双方的RVG进行同步。
后备节点的完全同步分为两种情况,一是复制时主节点应用不进行数据更改,二是复制时主节点应用进行数据更改。
两种情况下,都可以采用自动同步方式或采用备份和检查点(Check Point)结合的方法。
自动同步是指通过网络将数据从主节点(Primary)复制到备份节点(Secondary)。
方法很简单,只要进行一步操作即可完成。
自动同步对带宽要求较高,否则,将无法完成完全同步。
自动同步要求RVG中的每个卷都有DCM。
对于网络带宽较小,或者需要完全同步的数据量太大时,使用备份与检查点结合的方法。
在备份开始前,在主节点设置检查点,该检查点记录在SRL中,然后将数据备份到活动硬盘、光盘、磁带或其它介质上。
备份完成后,将检查点取消。
将备份的数据恢复到后备节点上。
然后将RLINK连接挂上,主节点SRL中记录的的数据传送到后备节点,完成后,两边数据一致,进入正常数据复制状态。
用该方法进行数据完全同步,要求SRL卷大些,等完成后,再将SRL卷通过V olume Manager在线缩小。
8)当某些严重意外情况发生后,后备节点会变成新的主节点,称为角色转换。
在灾难期间,不进行数据复制,新的主节点用DCM记录变化数据位置。
9)当原来的主节点在灾难后恢复正常,需要进行数据反向同步和角色转换。
反向同步有两种情况,一种是在灾难发生时刻,原主节点与灾备节点的数据是同步的(即无未复制的数据);第二种是在灾难发生时刻,原主节点与灾备节点的数据不是完全同步的(即主节点有数据尚未复制到灾备节点)。
第二种情况在反向同步开始时第一步首先要进行重置,指将原主节点SRL和DCM中数据(这些数据在灾难发生时尚未来得及传送)的位置信息修改当前主节点(即原后备节点)的DCM。
然后,将DCM中指向的数据全部传送到原主节点。
而第一种情况的话,直接进行第二步工作。
传送完成后,将当前主节点的数据库和应用停止,将双方角色复原,并在原主节点提供正常服务。
10)脱机处理。
通过使用VVR的In-Band Control(IBC)消息、Snapshot、以及V olume Manager(VxVM)的FastResync(简称FR,即快速同步)功能,可以实现数据的脱机处理。