当前位置:文档之家› IBM小型机维护指导书

IBM小型机维护指导书

江西建行IBM小型机日常维护第一篇:日常维护部分第二篇:故障处理部分第三篇:安图特公司技术支持电话第一篇日常维护部分目录第1章AIX系统管理日常工作(检查篇) (1)1.1 常用的命令 (1)1.2 语法介绍 (1)1.2.1 vmstat:检查内存、CPU、进程状态 (1)1.2.2 .................................... sar:检查CPU、IO31.2.3 PS:检查进程状态命令 (3)1.2.4 .............................. s vmon:显示进程占用内存41.2.5 .................................. iostat:显示磁盘IO41.2.6 ....................... n etstat, entstat:显示网卡信息51.2.7 ............................... n o:显示tcpip参数设置61.2.8 其它命令 (6)第2章AIX系统管理日常工作(LV篇) (7)2.1 IBM AIX系统管理的日常工作 (7)2.1.1 开关机步骤 (7)2.1.2 用户组及用户管理 (7)2.1.3 文件系统维护 (7)2.1.4 系统日常管理 (8)2.1.5 系统备份 (8)2.1.6 定时清洗磁带机 (8)2.1.7 定时检查设备指示灯状态 (9)2.1.8 简单故障的判断 (9)2.1.9 熟悉ibm aix操作系统 (9)2.2 关于IBM AIX的逻辑卷管理 (9)2.3 LVM命令 (10)第3章AIX系统管理日常工作(关键参数检查篇) (13)3.1 AIO参数检查 (13)3.2 磁盘阵列QUEUE_DEPTH参数检查 (14)3.3 用户参数检查 (14)3.4 激活SSA F AST-W RITE C ACHE (15)3.5 IO参数设置 (15)3.6 SYNCD DAEMON的数据刷新频率 (15)3.7 检查系统硬盘的镜像 (15)第4章AIX系统管理日常工作(性能分析篇) (17)4.1 性能瓶颈定义 (17)4.2 性能范围 (17)第5章AIX系统管理日常工作(SHUTDOWN篇) (18)5.1 概念 (18)5.2 关机命令 (18)第6章AIX系统管理日常工作(备份与恢复篇) (18)6.1 用SMIT备份 (18)6.2 手工备份 (18)6.3 恢复系统 (19)第7章HACMP的双机系统的管理和维护 (19)7.1 HACMP双机系统的启动 (19)7.2 HACMP双机系统的关闭 (20)7.3 察看双机系统的当前状态 (21)7.4 HACMP环境下的排错 (22)7.4.1 了解问题的存在 (22)7.4.2 判断问题的出处 (23)第1章AIX系统管理日常工作(检查篇)1.1常用的命令1.2语法介绍1.2.1vmstat:检查内存、CPU、进程状态# vmstat 1 15kthr memory pagefaults cpu----- ----------------------------------- -----------------------r b avm fre re pi po fr sr cyin sy cs us sy id wa1 0 28132 81277 0 0 0 0 0 0 132375 67 65 1 34 02 0 28132 81277 0 0 0 0 0 0 127 338 131 99 0 0 02 0 28132 81277 0 0 0 0 0 0 132 316 131 99 0 0 02 0 28132 81277 0 0 0 0 0 0 120 317 126 99 0 0 02 0 28132 81277 0 0 0 0 0 0 146 316 127 99 0 0 02 0 28132 81277 0 0 0 0 0 0 130 317 125 99 0 0 02 0 28132 81277 0 0 0 0 0 0 135 316 127 99 0 0 02 0 28132 81277 0 0 0 0 0 0 129 317 124 99 0 0 02 0 28132 81277 0 0 0 0 0 0 133 304 127 99 0 0 0r:正在运行的进程b:被阻挡的进程avm:活动的虚内存,单位4kbfre:自由列表,位4kbpo:页换出pi:页换入sy:系统占用CPUid:空闲CPUwa:等待的CPU1.2.2 sar:检查CPU、IO例如:sar -u 1 30sar -P ALL 1 10语法:sar -[abckmqruvwyA] inteval repetition-b buffer 活动-c 系统调用-k 内核进程统计.-m 消息及信号量活动-q 正在运行的队列数及等待队列数-r 页交换统计-u CPU利用-P CPU负载.1.2.3 PS:检查进程状态命令ps:显示当前SHELL重所有进程ps -ef :显示系统中所有进程,-f显示更详细信息ps -u oracle:显示oracle用户进程ps –emo THREAD:显示线程信息ps au;ps vg:按使用时间显示进程(最近一次调用)ps aux:按使用时间显示进程(进程启动)1.2.4 svmon:显示进程占用内存svmon –G:显示系统占用内存svmon -C command_name:显示某个用户进程占用内存svmon -P pid显示某个进程占用内存svmon –S:显示段占用内存1.2.5 iostat:显示磁盘IOtty: tin tout avg-cpu: % user %sys % idle % iowait0.0 4.0 0.9 1.3 95.4 2.5Disks: % tm_act Kbps tpsKb_read Kb_wrtnhdisk0 58.4 218.3 41.2172 920hdisk1 16.8 85.6 21.4428 0hdisk2 50.6 223.9 55.61100 20hdisk3 16.8 85.6 21.4428 0hdisk4 0.0 0.0 0.00 0hdisk5 43.4 279.1 69.81396 0hdisk6 0.0 0.0 0.00 0hdisk7 16.4 27.2 20.20 136hdisk8 0.0 0.0 0.00 0hdisk9 9.4 156.0 11.40 780hdisk10 16.4 27.2 20.20 136cd0 0.0 0.0 0.00 01.2.6netstat, entstat:显示网卡信息netstat en0:显示en0信息netstat –s:显示网络信息netstat -m显示网络 buffers.netstat -i显示网卡状态netstat -I en0 1显示eno网卡塞(1秒间隔)1.2.7no:显示tcpip参数设置no –a:显示tcpip所有参数当前设置no -o tcp_keepalivetime=7200000设置tcp_keepalivetime等于3600000秒no -d 恢复默认值注:该方法在重启后失效1.2.8其它命令第2章AIX系统管理日常工作(LV篇)2.1IBM AIX系统管理的日常工作系统管理员对小型机系统的正确管理是系统稳定运行的保障,作为系统管理员应注意以下几个方面:2.1.1开关机步骤在系统管理员控制下进行正确的操作。

(第5章有专门介绍)2.1.2用户组及用户管理2.1.3文件系统维护发现文件系统已满,应及时删除无用文件或扩大文件系统。

查看文件系统使用率命令:df –k ,查看%Used和%Iused1024-blocks Free %Used Iused %IusedMounted on/dev/hd4 32768 20180 39%2070 13% //dev/hd2 2293760 1230984 47%33045 6% /usr/dev/hd9var 32768 15832 52%367 5% /var/dev/hd3 32768 23300 29%110 2% /tmp/dev/hd1 32768 31384 5%72 1% /home/dev/informixlv 524288 199060 63%3521 3% /home/informix注意系统文件系统中的/ /var /tmp使用率不要超过90%2.1.4系统日常管理系统管理员最好用 smit来进行系统管理。

Smit是以菜单方式工作的工具包,它包括了日常管理工作的所有命令,操作简便。

2.1.5系统备份备份是保护用户数据不丢失的重要手段。

一般系统备份的要求如下:A. 每一台机器的操作系统至少有一个全备份。

B. 每天备份用户数据。

C. 操作系统配置修改后重新备份操作系统。

(系统备份方法在第六章专门介绍)2.1.6定时清洗磁带机可以每月定时清洗一次,将清洗带插入磁带机,清洗完毕后会自动退出磁带。

当磁带机需要清洗时,磁带机左边第一个起绿色指示灯会亮。

2.1.7定时检查设备指示灯状态RS6000小型机出现硬件故障时,系统前面板上会亮一个橙色的告警灯。

液晶面板上面会有显示错误代码2.1.8简单故障的判断详细信息见“第二部分:故障处理指导书”2.1.9熟悉ibm aix操作系统2.2关于IBM AIX的逻辑卷管理IBM AIX 存储管理的五个基本概念:物理卷Physical Volume,称为PV:指物理上硬盘,一个硬盘就是一个PV,名字为HDISK0、HDISK1。

物理分区(Physical Partitions):物理卷被划分成大小一样的物理分区PPs逻辑卷组 Logical Volume Group,称为VG:一个VG包含整数个PV,可理解为一个大硬盘。

逻辑卷 Logical Volume,称为LV:相当于对大硬盘进行逻辑分区,一个VG里可有若干个LV,对用户讲,LV上的数据是连续的,但PV上的数据可能是分散的。

逻辑分区(Logical Partitions):每个LV有若干逻辑分区(LPs)组成,每个逻辑分区至少有一个PV组成。

文件系统 :在逻辑卷的基础上,可建立文件系统JFS ,然后 MOUNT 到一个目录下,这样就可以文件存取的方式来使用这块硬盘了。

当然,您也可以不建文件系统,而直接把LV 当作裸设备,以TRUNK 方式来存取数据,许多数据库都是用这种方式存取数据。

LVM 的关系如下图:Volume GroupLogical View =VG with many LVscontaining PPs fromparticular PVs of disk typically8,16 or 32 MB)2.3 LVM 命令一般采用smit 命令可对PV 、VG 、LV 、JFS 等进行图形化管理,命令如下:smit lvm屏幕显示如下:Add a Logical VolumeLogicalvolume NAME [scratch]* VOLUME GROUP name testvg* Number of LOGICAL PARTITIONS [64]#PHYSICAL VOLUME names [hdisk1 hdisk2 hdisk3] +Logical volume TYPE [jfs]POSITION on physical volume middle+RANGE of physical volumes minimum +MAXIMUM NUMBER of PHYSICAL VOLUMES []#to use for allocationNumber of COPIES of each logical 2 +partitionMirror Write Consistency? yes +Allocate each logical partition copy yes+on a SEPARATE physical volume?RELOCATE the logical volume during yes +reorganization?Logical volume LABEL []MAXIMUM NUMBER of LOGICAL PARTITIONS [512]#Enable BAD BLOCK relocation? yes +SCHEDULING POLICY for reading/writingparallel +logical partition copiesEnable WRITE VERIFY? no +ALLOCATION MAP []Stripe Size? [64K]行命令:.lsvg:查看vg名字查看vg详细信息: lsvg <vgname>查看vg内的LVs: lsvg -l <vgname>查看vg内的PV: lsvg -p <vgname>查看激活的VG: lsvg –o. lspv:查看物理卷组pg名字查看PV 详细信息: lspv hdiskN查看PV内的LVs lspv -l hdiskN查看PV内的PP : lspv -p hdiskN. lslv:查看LV的信息查看 LV 名字: lsvg -l <vgname>查看LV 详细信息: lslv <lvname>查看PV 内的LVs : lslv -l <lvname>查看PV 内的 PP : lslv -p <pvname>查看镜像的 LV: lslv -m <lvname>第3章AIX系统管理日常工作(关键参数检查篇)3.1AIO参数检查# lsattr -El aio0minservers X MINIMUM number of serversTruemaxservers 80 MAXIMUM number of serversTruemaxreqs 4096 Maximum number of REQUESTSTruekprocprio 39 Server PRIORITYTrueautoconfig available STATE to be configured atsystem restart Truefastpath enable State of fast pathTrue●MaxServers = 10 * number of disks●MinServers = MaxServers /2其中MaxServers最大为80可用命令#smitty aio Change / ShowCharacteristics of Asynchronous I/O修改相应的值。

相关主题