主要内容
1.0 微码升级方案及应急预案
微码升级目标版本为BlockOE 05.32.000.5.219;
Unified 系统(Block OE & File OE): 6 小时左右
Block 系统(Block OE): 4小时左右
注:具体升级时间会因为客户设备环境的不同而变化
1.1 微码升级方案
关于升级,我们通常有两种做法,一种是在线升级,这种方法不会影响生产,但是需要一些前提条件;另外一种方法是离线升级,这种方法需要停止主机端的应用,会影响到生产。
若是Unified(既有block又有file,也就是含NAS),则在线升级过程中会有10分钟左右的停机.
2.1.1 在线升级
在线升级需要的前期准备:
1. 客户需要检查所有的主机上是否安装多路径管理软件,要确保每台主机到SPA/SPB都有可用的路径;
2. 客户需要检查/确保主机端的多路径管理软件和升级后的flare code版本兼容;
3. 在线升级需要交替升级/重启两个SP,因此一定要选择一个业务不忙的时间窗口(两个SP的使用率加起来不能超过 40%);
在线升级的风险:
由于两个SP需要交替的升级/重启,在这个过程中,SP是没有冗余的,如果另外一个SP发生故障的话,可能会导致主机端暂时不能访问数据的情况。
2.1.2 离线升级
1.2 升级失败预案
如果在升级微码的过程中出现问题,现场可以立即联系EMC800工程师做微码回滚操作。
注:对于Unifiled 系统
Block端:在新的flare code 没有commit之前,是可以roll back到之前的code 版本的。
File端:file端code不能roll back。
建议客户升级Block端后,先在主机端检查无误后,再升级File端的flare code。
工程师按照如下步骤操作收集数据。
∙BEFORE PERFORMING ANY ATTEMPTS TO DIAGNOSE AND ADDRESS THE ISSUE, do the following: ∙Capture the diagnostic data file created by USM as the very first step in the NDU process. This will be on the station from which USM was run, in the
C:\EMC\repository\DiagnosticData\<serial number> folder and will be named
<date_time>.culham_blockOnly_Healthcheck_<serial
number>_<date_time>.zip
∙Generate and capture a new diagnostic data file using USM, Diagnostics, Capture Diagnostic Data. This will contain fresh SPcollects. Again, this will be on the station from which USM was
run, in the C:\EMC\repository\DiagnosticData\<serial number> folder and will be
named <date_time>.culham_blockOnly_Healthcheck_<serial
number>_<date_time>.zip
∙Escalate the issue and provide the 2 diagnostic data files that you captured.。