随着VMWare vSphere部署率呈爆炸性增长,随之而来的是vSphere的数据灾难出现机率也大大增长。
数据丢失,大多时候对一个企业的影响是致命的,如何抢救vSphere的数据,这是连VMWare官方都头痛的问题,VMWare官方只能见议backup,backup……,而vSphere的VMFS文件系统的复杂性对于vSphere数据灾难急救是一条很难逾越的槛。
难道vSphere的数据丢失后就真的没一点办法了吗?答案是否定的。
只是太多因素影响了最后恢复的结果,比如删除虚拟机后又重建了虚拟机、又格式化了存储等,这些操作都有个特点,那就是对原始存储有致命性的写入操作,无法保持数据灾难现场的原始性,所以最后数据恢复结果通常都不怎么完美,严重的会造成根本无法恢复。
因为最近接手的vSphere的数据恢复案例较多,情况都相当的紧急和典型,故写了这篇文章,一起来分析下事故的起因和解决过程。
一天,正常上班中,突然接到一个紧急电话,无锡市政府某部门的一vSphere4系统在迁移虚拟机过程中出错,导致虚拟机的一个快照无法加载,此快照已不能被正常识别,而此快照存储了最后两天的数据,数据极其重要。
事故起因:此虚拟机OS为windows2003,为一个OA系统。
虚拟机的虚拟磁盘大小为500GB,做有3级快照,大小分别为:190G、180G、60G,此VMFS卷上同时存储有3台虚拟机,虚拟磁盘类型都是厚模式,此VMFS卷大小约1.6T,因快照文件的不断增长,致使VMFS卷的空间严重不足,最后因此而当机,管理员在检测到问题后,试图迁移虚拟机到另一VMFS卷上,以缓解空间不足的问题,不料途中vSphere报错,迁移失败,然后查看虚拟机发现此windows2003虚拟机的第三级快照出错。
事故解决过程:由于数据异常重要,虽只差两天的数据,但数据不可有一点丢失,数据有涉密性,也不可带出处理。
客户只得求助于数据恢复公司,但很少有数据恢复公司能涉及到vSphere底层结构,大多数宣称能解决问题的数据恢复公司也仅是半桶水而已,所以不敢妄然上门服务。
经电话沟通,了解事故的来龙去脉,马上制定的数据恢复方案,,当后使用天盾数据恢复中心自主研发的ESX快照反写软件进行三级快照合并,快照文件较大,漫长的合并完成后,经验证,数据仅是最后一个分区的最后一次数据库备份文件因空间不足而文件失效,生产库和其它文件均无任何问题,数据也是最新的,无一条记录丢失。