当前位置:文档之家› 虚拟化环境机房搬迁方案

虚拟化环境机房搬迁方案

虚拟化环境机房同城搬迁方案
随着云计算的普及,大型企业用户为了降低运行成本、管理成本,大型企业用户开始自建中心机房,并逐步将各分支机构的信息化基础设施迁移到中心机房。

在基础设置迁移过程中,即要尽可能的降低迁移风险,又要快速的恢复服务,这对迁移服务提出了较高要求:保证数据不丢失,保证服务在规定时间内恢复。

一、用户需求
1.1用户环境
用户环境如下图所示。

在分支机构机房部署有防火墙、核心交换机、服务器等硬件,在硬件上部署有VMware ESXi虚拟化平台、用户数据分析系统等软件及应用平台。

接入互联网的带宽为20Mbps。

由于公司整体发展需要,需要将分支机构机房中的所有硬件全部迁移到中心机房。

中心机房部署有防火墙、核心交换机、及2台空闲的服务器。

中心机房的网络带宽为100Mbps。

整体用户数据量为60TB左右。

1.2虚拟机情况
目前有4个物理机部署ESXi,具有48台虚拟机,数据量约16T,大部分存储在存储上,一部分存储在物理机上,生产网络为千兆网络。

1.3设备/数据风险
(1)硬盘由于震动,数据不能正确读出,导致系统不能引导。

(2)网卡由于灰尘,不能正常通信。

(3)器件之间的连接产生松动,服务器或存储等设备不能正常运行。

(4)其它原因导致设备不能正常运行。

1.4运营要求
事先发通知各强关联用户,晚上8点半点可停机,次日8点半前必须恢复应用,共12小时。

1.5安全要求
数据不丢失,应用在规定时间内启用。

考虑到设备/数据风险,搬迁以前必须完成数据备份,并做数据、应用的验证,然后实施搬迁。

一旦搬迁设备出现故障,需要使用备份数据和备份设备恢复数据和应用,确保万无一失。

二、解决方案
2.1搬迁步骤
1)分步搬迁:首先梳理各虚拟机之间的依赖关系,将有依赖关系的虚拟机放置到一台物理上,尽量做到每台物理机上跑的应用之间没有依赖关系,如有依赖关系,应该一起搬迁。

2)备份数据、应用验证:应该在分支机构机房搭建隔离验证环境,利用备份软件恢复虚拟机后,人工验证应用的有效性和数据的完整性。

2.2具体实施步骤
具体实施步骤如下图所示。

搬迁步骤(以用户数据分析系统为例):
0)环境准备:
a)在分支机构机房准备转储机,需要配备约16TB的存储,至少2颗处
理器、64GB内存,万兆网卡,安装ESXi、安装云祺虚拟机备份与恢
复系统;
b)在中心机房准备服务器备机,服务器备机性能应该大于分支机构服
务器,配备万兆网卡;
c)在中心机房准备网络环境,和分支机构机房网络环境一致,搬迁完成
后,不需要修改IP地址。

1)虚拟机完全备份:
a)把现有分支机构机房内的“用户数据分析系统”虚拟机A完全备份
到云祺虚拟机备份与恢复系统;(图中①步)。

根据虚拟机的大小,该
备份的时间可能较长,备份速度约为80~90M/S,以85M/S为平均速
度,备份一个典型的500GB的虚拟机需要花费1.63小时=500 * 1000
/85 /3600。

一台物理机上的虚拟机大约有4T的数据,备份一台服
务器约需要13小时。

2)验证数据应用步骤:(图中②步)
a)从云祺虚拟机备份与恢复系统上将“用户数据分析系统“恢复到转储
机,生成一个新的“上牌数据分析系统”B(此时不开机,否则可能
会出现IP冲突);
b)将转储机从分支机构机房网络断开,启动虚拟机;
c)在B系统内验证数据、应用恢复正确性。

3)增量备份
a)由于验证数据应用可能花费1~2天时间,期间业务正常开展,验证
完成后,停机转储机上的“用户数据分析系统”B,将转储机接入分
支机构机房机房;
b)停机主机上的“用户数据分析系统”A,利用云祺虚拟机备份与恢复
系统中“启动增量“功能,执行增量备份(图中③步)。

增量备份只
备份验证期间产生的数据变化,因此,花费的时间较短,按照1小时
计算。

4)搬迁
a)使用汽车将主机、转储机搬迁到中心机房,主机下架、装车运输、中
心机房上架,约花费2小时(图中④步)。

在此之前,需要做好勘查
线路、准备纸包装箱、准备防震材料等工作。

b)启动搬迁后的“用户数据分析系统”A。

5)如主机正常,则搬迁结束,否则进行应急恢复:
a)如果主机故障,利用云祺虚拟机备份与恢复系统的增量备份点虚拟
机进行恢复,恢复到备机上(图中⑤步)。

由于采用万兆网络,理论
恢复速度可达到1000MB/S,硬盘读写速度150MB/S,完全恢复4TB的
时间约为7小时30分钟;
b)启动该虚拟机,提供服务;
c)待主机故障修复后,利用vCenter中的虚拟机迁移功能,将“用户数
据分析系统”迁移到主机。

三、分析
3.1运营要求
业务连续性:在搬迁前,应用、数据验证阶段不需要停止服务。

搬迁花费时间:
理想情况下:3小时=增量备份时间1小时+搬迁时间2小时;
最差情况:10.5小时=增量备份时间1小时+搬迁时间2小时+应急恢
复7.5小时;
结论:满足运营需要。

3.2数据一致性
搬迁前:在搬迁前做完全备份,停机进行增量备份,保证应用和数据的一致性。

搬迁过程中:无提供服务,不产生数据变化。

搬迁后:数据和应用一致,重新提供服务。

相关主题