XXXXXXX客户中心机房设备监测及同城容灾系统项目灾备系统实施方案2011年5月25日XXXXXXX有限责任公司信息中心目录第1章项目背景 (3)第2章目标和范围 (3)第3章灾备系统的规划 (4)3.1.总体建设原则 (4)3.2.灾备系统架构 (5)3.3.数据复制策略 (5)第4章灾备系统的实施 (6)4.1.灾备DS5100的配置 (6)4.1.1.磁盘组的划分 (6)4.1.2.LUN的划分 (7)4.1.3.存储HOST的配置 (8)4.2.复制存储网络的配置 (9)4.2.1.生产中心SAN连接 (10)4.2.2.灾备中心SAN连接 (10)4.2.3.Zone的划分 (10)4.3.ERM的配置步骤 (12)4.3.1.初始安装和配置 (12)4.3.2.创建镜像关系对 (12)第5章灾备数据验证 (19)5.1.公文系统灾备数据的验证 (19)5.2.邮件系统灾备数据的验证 (20)5.3.财务银行系统灾备数据的验证 (21)5.4.财务管理系统灾备数据的验证 (23)5.5.统计报表系统灾备数据的验证 (24)第1章项目背景第2章目标和范围灾备系统的建设是个循序渐进的过程,从灾备系统的业务和数据恢复能力上,可以将灾备系统分为数据级灾备系统和应用级灾备系统。
数据级灾备系统的关注点在于数据保护,即灾难事件发生后如何确保重要信息系统的关键数据不会丢失或者遭到破坏。
应用级灾备系统是在数据级灾备系统的基础上,不仅提供数据保护功能,而且还提供灾难事件发生后的业务接管能力。
XXXXXXX根据行业内信息系统的现状和灾备建设的总体规划,确定本项目的灾备建设目标为同城数据级灾备系统。
同城灾备系统与生产中心处于同一地理区域,面临同一区域性灾难风险,故同城灾备系统用于非区域性灾难事件,即:生产中心发生的设备故障,或者人为操作错误,以及生产中心所在建筑发生的水灾、火灾、电力异常等突发事件,导致生产中心重要信息系统的关键数据部分损坏或者完全丢失,致使生产中心业务系统陷于停顿。
本项目中,灾备系统建设的范围将涵盖集团公司重要信息系统的关键数据,这些重要信息系统包括:⏹财务银行系统⏹财务管理系统⏹统计报表系统⏹人力资源系统⏹运销系统⏹协同办公系统第3章灾备系统的规划3.1.总体建设原则在XXXXXXX灾备系统的设计和建设过程中,将遵循如下总体原则:❑技术先进性、可靠性和可扩展性采用先进成熟的IT资源整合手段和数据复制技术,实现生产中心的资源整合和生产中心与灾备中心数据的完整性和一致性。
在灾备系统技术方案的选择上满足一定的先进性,以保障在一段时间内在技术及设备上的投入。
同时,灾备系统应具有高度可扩展性和灵活的可调整性,确保新功能、新业务的增加在原有的系统平台上平滑扩展。
❑等级保护的原则按照《重要信息系统灾难恢复指南》,灾难恢复等级分为以下六个等级:基本支持备用场地支持、电子传输和部分设备支持、电子传输及完整设备支持、实时数据传输及完整设备支持、数据零丢失和远程集群支持。
对于不同的等级,其灾难恢复资源要素的相应满足要求,指南中进行了详细的描述。
❑经济性和投资保护原则灾备建设应对的灾难情况是小概率事件,应充分考虑灾备中心设备的性能价格比、灾备中心运营的成本和原有资产的利原使用,最大限度地降低灾备系统建设的成本。
同时,在灾难恢复技术的选择上,应充分考虑与现有软硬件资源共享的原则。
本着低成本、高效率的建设原则,灾难备份建设需要充分考虑利用现有资源,提倡资源共享。
❑统筹规划、分步实施灾备建设的投入很大,不能一蹴而就一步到位,需要的是一个循序渐进的过程。
数据级灾备和应用级灾备并不冲突,数据级灾备是应用级灾备的基础,灾备系统可以先做数据级的,相对于应用级灾备而言,数据级灾备的投入产出比更高。
另外,灾难恢复建设项目是一项涉及多领域、跨部门的、跨专业的综合性系统工程,应结合自身的实际需求情况进行统筹规划、合理安排、分阶段实施。
3.2.灾备系统架构在本项目中,XXXXXXX根据自身重要信息系统的系统现状和数据特点,结合XXXXXXX对重要信息系统灾备建设的需求,遵循灾备系统建设的总体设计原则,确定采用基于IBM DS存储阵列的ERM复制技术,实现XXXXXXX重要信息系统的数据级灾备。
XXXXXXX同城灾备系统架构图如下:如上图所示,生产中心和灾备中心之间通过裸光纤专线互连,在专线两端各配置一台IBM B24存储交换机作为数据复制专用设备,构成数据复制存储网络。
生产中心原有的生产存储阵列IBM DS5100和DS4700,以及财务银行系统的新购存储阵列IBM DS5020分别通过各自闲置的主机端口,接入到数据复制存储网络,并连接到灾备中心的新购存储阵列DS5100上。
利用IBM DS系列存储阵列自身的ERM数据复制功能,实现生产中心到灾备中心的“3对1”的灾难备份。
在上述架构中,灾备中心的数据验证系统包括1台IBM小型机及数台PC服务器,这些服务器通过非冗余链路连接到灾备DS5100存储阵列上。
数据验证系统分别对应于生产中心的各应用系统,仅用于对灾备数据的定期验证。
3.3.数据复制策略IBM ERM支持同步和异步两种复制方式。
同步复制可以保证灾备中心与生产中心间的数据在任意时刻保持一致,当生产中心的数据发生更新,这些更新会立刻反映到灾备中心。
异步复制是指灾备中心和生产中心的数据不是完全一致,当生产中心的数据发生更新,这些更新会在即时反映到灾备中心。
在异步复制时,灾备数据与生产数据的差异程度主要由复制策略配置以及复制链路的情况共同决定的。
数据复制策略的选择同样受到数据增量和复制链路带宽的影响,XXXXXXX 同城灾备中心与生产中心的网络采用裸光纤,故数据复制策略采用实时增量的异步复制方式,采用一致性组策略,保证数据的一致性。
从而确保灾备中心有满足灾难备份与恢复需求的完整数据副本。
XXXXXXX同城灾备系统的数据复制策略如下表:注:生产DS5100(包含:统计报表系统、财务管理系统、运销系统和人力资源系统的数据库文件)存储阵列的多个LUN空间需要启用一致性组策略。
注:生产DS4700(协同办公系统)和DS5020(财务银行系统)的LUN空间划分比较集中,各应用系统的存储数据独占1个LUN空间,故无需启用一致性组策略。
第4章灾备系统的实施4.1.灾备DS5100的配置灾备中心配备1台IBM DS5100磁盘阵列设备,配置4台EXP5000磁盘扩展柜,满配64块300G磁盘,裸容量超过18TB。
灾备DS5100阵列的存储空间用于存储从生产中心存储阵列上实时复制到灾备中心的灾备数据。
4.1.1.磁盘组的划分灾备DS5100存储阵列共分为4个磁盘组和4块热备磁盘。
考虑到性能因素,在规划磁盘组时,尽量将每个磁盘组内的硬盘的分散在多个磁盘扩展柜中。
并保留部分空余磁盘留作备用。
4块全局热备盘分布于4个磁盘柜中。
详细的磁盘组的划分情况如下表:4.1.2.LUN的划分ERM复制技术是基于LUN的存储复制技术,在灾备DS5100存储阵列,参考生产中心各存储阵列空间的分配情况,划分“1对1”的LUN配置,如下表:4.1.3.存储HOST的配置在灾备DS5100存储阵列上,应配置所有的数据验证服务器作为存储系统的HOST。
当进行灾备数据验证和灾难切换时,通过MAPPING操作将相应的灾备数据分配给对应的数据验证服务器。
灾备DS5100的HOST配置如下表:4.2.复制存储网络的配置IBM ERM功能必须是基于SAN网络环境,每个DS存储系统的控制器需要使用专用的主机端口用于ERM复制,即:每个控制器最后一个主机端口专用于远程拷贝连接。
对于ERM连接的Zone而言,本地DS存储系统的控制器A要与远端DS 存储系统的控制器A划成一个Zone,本地DS存储系统的控制器B要与远端DS存储系统的控制器B划成一个Zone。
在本项目中,生产中心和灾备中心各配置1台IBM B24存储交换机,这两台存储交换机通过裸光纤直连方式级联,模块采用Finisar 4G 30KM单模模块。
4.2.1.生产中心SAN连接4.2.2.灾备中心SAN连接4.2.3.Zone的划分注:存储交换机的配置名:PROD_DR5100。
4.3.E RM的配置步骤DS4000/5000系列存储系统支持跨越两个站点的存储系统间的数据复制,包括同步拷贝、异步拷贝和异步一致性组拷贝功能。
这种功能称之为增强型远程镜像(Enhanced Remote Mirror),简称ERM。
4.3.1.初始安装和配置IBM ERM数据复制软件是作为IBM DS系列存储系统的附加功能提供的,不需要进行安装,但在使用ERM功能前,请确认生产DS4700、DS5020和DS5100及灾备DS5100存储系统的ERM License许可都已经录入并处于激活状态。
以灾备DS5100为例,可以看到如下信息:4.3.2.创建镜像关系对IBM ERM是基于LUN的数据复制软件,在开始复制前,需要配置镜像复制关系对。
镜像复制关系对是标识数据复制的源与目标之间关系的配置。
一个复制关系对包含1个主设备和1个从设备,主、从设备可以通过手工方式进行切换。
注:为保证目标端与源端设备的数据一致性,ERM会锁住目标端的从设备,此时从设备不可被Host所读写。
以统计报表生产系统为例,其生产存储设备DS5100共划分如下空间:对应统计报表生产系统存储空间的分配情况,配置复制关系对如下:以统计报表系统为例,配置镜像复制关系对的步骤如下:打开存储管理软件,登陆生产中心统计报表DS5100存储系统,选择“Logical/Physical View”选项页,进入如下界面:Drive Mirror…”,进入如下界面:如上图所示,点击“Next”继续,进入如下界面:如上图所示,选择DR_DS5100,点击“Next”继续,进入如下界面:如上图所示,选择Mirror_bbyw_8,点击“Next”继续,进入如下界面:如上图所示,设置镜像复制关系对为“Asynchronous”异步模式(注:对需要启用一致性组策略的镜像复制关系对,需要勾选“Add to write consistency group”选项),点击“Next”继续,进入如下界面:如上图所示,点击“Next”继续,进入如下界面:如上图所示,输入“Yes”,点击“Finish”完成配置,进入如下界面:如上图所示,创建镜像复制关系对操作成功,点击“OK”确认完成。
参考上述步骤,配置统计报表系统的所有LUN的数据复制关系对,这些复制关系对如下包括:注:安装上述创建镜像复制关系对的操作步骤,为本项目相关业务系统在DS4700、DS5020和DS5100上的所有LUN创建镜像数据复制关系对,这些镜像数据复制关系对的配置如下:第5章灾备数据验证5.1.公文系统灾备数据的验证信息中心公文系统灾备数据验证环境示意图如下:在上图中,左侧深色阴影区域内为公文系统目前的生产环境,右侧浅色阴影内为公文系统的数据验证环境。