小型机更换内置硬盘实施方案一、检查工作内容:1、# lsvg -l rootvg //如何查看硬盘是否做过mirror?2、#bootlist -m normal -o //查看当前的引导顺序3、lsdev -Cc disk //检查硬盘状态4、errpt //检查错误日志5、diag //诊断硬盘6、lspv 记录hdisk0 序列号lscfg –vl hdisk0lssrc –g cluster 显示如下两个进程表示HACMP是启动状态:subsystem group PID statusclstrmge cluster 22454 activeclsmuxpd cluster 15874 active可观察CLUSTER的启动:/usr/es/adm/cluster.log, /tmp/hacmp.outCLUSTER的版本lslpp –l|grep cluster网络的状态netstat -ni二、更换硬盘操作:1、unmirrorvg rootvg hdisk02、reducevg rootvg hdisk0 或reducevg -d rootvg hdisk03、chpv -c hdisk04、rmdev -dl hdisk0bootlist -m normal hdisk1 关机换盘或通过diag进行热更换5、chdev -l hdisk0 -a pv=yes6、extendvg roovg hdisk0 或#extendvg -f rootvg hdisk0 强制把hdisk0加入到rootvg7、mirrorvg roovg8、chvg -Qn roovg9、bosboot -ad hdisk0bosboot -ad hdisk110、bootlist -m normal hdisk0 hdisk1验证:1、lsvg -l rootvg2、bootlist -m normal -o三、实施案例:案例1:XXX公司更换P55A内置146G硬盘,实施过程如下:hdisk0 有故障,需要更换1、取消rootvg 镜像chpv -c hdisk1 //去掉hdisk0的引导信息unmirrorvg roovg hdisk02、将坏的硬盘从roovg中去除reducevg roovg hdisk0 或reducevg -d rootvg hdisk03、通过diag工具对坏的硬盘进行热插拔更换1)运行diag 并依次选择菜单Task selection -> hot plug task -> scsi and scsi raid hot plug manager-> replace/remove a device attached to an scsi hot swap enclosure device, 选择要更换的硬盘Hdisk0 回车,保留当前界面。
2)hdisk0 硬盘的指示灯会亮(橙色),拔掉这块硬盘,将新硬盘插上。
3)回到1)当时的界面,回车4)再进入configure added/replaced devices 菜单进行一下配置,硬盘的物理更换就完成了。
4、通过lspv 查看当前硬盘的信息,正常情况下应该如下:hdisk0 none nonehdisk1 005a542a8a1c08ca rootvg active#chdev -l hdisk1 -a pv=yes 给新硬盘分配PVID号5、将hdisk0加入rootvgextendvg rootvg hdisk0 //如果hdisk1内有数据在做extend的时侯,hdisk1里面的东西就没了或#extendvg -f rootvg hdisk0 强制把hdisk0加入到rootvg中6、完成rootvg 的镜像mirrorvg roovg此工作耗时较长syncvg –v rootvg 同步VG 可不做#chvg –Qn rootvg 取消Quorumbosboot -ad /dev/hdisk07、更改引导列表bootlist -m normal hdisk0 hdisk1 cd0验证:# bootlist -m normal -ohdisk0# bosboot -ad /dev/hdisk1# bootlist -m normal hdisk1 hdisk0# bootlist -m normal -ohdisk1hdisk0# shutdown -Fr注:chdev -l hdisk1 -a pv=yes是安全的,如果它运行不成功,那创建VG肯定失败,因为mkvg 就是调用的它案例2:大容量硬盘替换小容量硬盘(这是网络上的一个帖子,转载仅供参考)说明:630机器,内置4个18G硬盘,2个做RAID,存储数据,一块做系统,另一块做热备。
因数据量增大,要扩充硬盘容量,将18G数据存储盘换成36G。
参考文档:/thread-2376-1-1.html四、其他说明:查看mirror是否完成了# lsvg -l rootvg# lsvg -l rootvg //如何查看硬盘是否做过mirror?rootvg:LV NAME TYPE LPs PPs PVs LV STA TE MOUNT POINThd5 boot 1 2 2 closed/syncd N/Ahd6 paging 2 4 2 open/syncd N/Ahd8 jfslog 1 2 2 open/syncd N/Ahd4 jfs 1 2 2 open/syncd /hd2 jfs 33 66 2 open/syncd /usrhd9var jfs 1 2 2 open/syncd /varhd3 jfs 1 2 2 open/syncd /tmphd1 jfs 1 2 2 open/syncd /homeHd10opt jfs 4 8 2 open/syncd /opt说明:lp=2pp 表示一份镜像,lp=pp表示没做,lp=3pp表示有二份。
lp=2pp,是指一份lp的数据,对应两份pp的数据,物理上是有2份拷贝的五、系统备份tctl –f /dev/rmt0 rewindsmitty mksysb六、数据盘迁移1、目标:将hdisk3 146G新盘替换掉原机的hdisk2 36G老盘,以达到扩容的目的。
hdisk2 /datavg增加新硬盘后migratepv -l hdisk2 hdisk3 把hdisk2的内容复制到hdisk3上syncvg -fv uservg2、假设这时候突然出现hdisk2的P H磁盘操作错误。
我们需要更换一块硬盘代替hdisk2,这时候我们该考虑一下如何做是安全性最高和最有效率的方法呢,并且也要考虑每种方法的局限性,我把我的考虑按照优先选择的顺序列出,请大家斧正。
一、优先选择migratepv.具体做法如下:1、加一块新盘到阵列上成为hdisk4.2、extendvg uservg hdisk43、migratepv hdisk2 hdisk4迁移hdisk2上所有的lv到hdisk4(你也可以用migratepv –l lvname hdisk2 hdisk4 逐一地将hdisk2上的lv迁移到hdisk4)4、syncvg -fv uservg使用migratepv的优点是思路清晰,简单,可以包括裸设备。
将整个pv上的lvs全部迁移到新加的硬盘上,而且不用考虑lv上层的fs级别的情况,并且在执行命令的时候不需要umount 相关的fs.而且也不会改变迁移的lv上层fs中目录和文件的owner和执行权限。
因此成为首选。
缺点是有可能hdisk2上某lv所在的pp严重损坏,可能迁移后无法使用。
或导致migratepv 失败。
AIX 更换硬盘系统管理员遇到的大多问题与磁盘有关。
因此,必须知道用于磁盘替换的一些规程。
一块磁盘要被替换的原因如下:磁盘失败了(failed)磁盘开始报告IO 错误,想替换它以避免完全失效磁盘不能满足需要,如,大小或速度情景1如果要替换的磁盘已做了镜像,推荐如下步骤:1. 删除该磁盘上所有逻辑卷的复件,使用rmlvcopy 命令或unmirrorvg 命令。
2. 从卷组中删除该磁盘,使用reducevg 命令。
3. 使用rmdev 命令删除该磁盘定义。
4. 物理移除该磁盘。
如果磁盘不是可热交换的(hot-swappable),可能要求重启系统。
5. 使备用的磁盘可用。
如果磁盘是可热交换的(hot-swappble),可运行cfgmgr;否则,需要重启系统。
6. 把新加的磁盘放入卷组,使用extendvg 命令。
7. 重建并同步所有逻辑卷的复件,使用mklvcopy 命令或mirrorvg 命令。
情景2如果要替换的磁盘没有镜像,但仍在起作用,推荐按以下步骤:1. 使备用磁盘可用。
如果磁盘是可热交换的(hot-swappable),可运行cfgmgr;否则,需要重启系统。
2. 把新加的磁盘放入卷组,使用extendvg 命令。
3. 把故障磁盘的所有分区迁移到新磁盘,使用migratepv 命令、或migratelp 命令。
如果磁盘是rootvg 的一部分,应考虑如下方面:- 如果要替换的磁盘包含一个BLV 的复件,必须使用chpv -c 命令清除掉。
- 必须在新磁盘上创建一个新的BLV 映像,使用bosboot 命令。
- 必须使用bootlist 命令更新bootlist 反映这些变化。
- 如果要替换的磁盘包含分页空间或主dump 设备,应禁用他们。
migratepv 命令完成后,应重新激活他们。
4. 从卷组中移除故障磁盘,使用reducevg 命令。
5. 使用rmdev 命令移除该磁盘定义。
情景3如果磁盘没有镜像,已完全损坏,在卷组中有其他可用磁盘,推荐以下步骤:1. 识别至少有一个分区位于故障磁盘的所有逻辑卷。
2. 关闭逻辑卷并使用umount 命令卸下所有相关的文件系统。
3. 使用rmfs 命令移除文件系统和逻辑卷。
4. 使用reducevg 命令从卷组中移除失败的磁盘。
5. 使用rmdev 命令移除磁盘定义。
6. 物理移除磁盘。
如果磁盘不是可热交换的,可能需要重启系统。
7. 使备用磁盘可用。
如果磁盘是可热交换的,可运行cfgmgr;否则,可能需要重启系统。
8. 把新加的磁盘放入卷组,使用extendvg 命令。
9. 重新创建所有的逻辑卷和相关的文件系统,使用mklv 命令和crfs 命令。
10. 如果有数据的备份,从备份中恢复数据。
情景4如果磁盘没有镜像,已经完全损坏,在卷组中没有其他可用的磁盘(卷组只包含一个物理卷、或所有的物理卷同时损坏),卷组不是rootvg,推荐以下步骤:1. 从系统中导出卷组定义,使用exportvg 命令。