某银行分行网络设备日常维护指导手册
2016年8月
目录
1. 网络维护概述 (3)
1.1网络设备维护人员分工与职责 (3)
1.2故障处理流程 (3)
1.3日常维护参考资料 (3)
2. 组织机构及职责 (3)
2.1组织机构 (3)
2.2组织机构职责 (3)
3. 网络维护内容 (4)
3.1分行网络拓扑及介绍 (4)
3.2日常维护指导 (5)
4. 网络故障排查诊断命令及常见故障排查方法 (6)
4.1故障排查命令 (6)
4.2故障诊断命令 (7)
4.1常见故障排查方法 (8)
1.网络维护概述
1.1 网络设备维护人员分工与职责
网络设备维护人员要求具有一定的IP网络基础,熟悉掌握相关IP 网络技术理论;清楚网络的结构设计,包括网络拓朴,设备连接,系统参数设置及软件使用;了解网络正常运行状况,注意收集网络正常运行时的各种状态和报告输出参数;熟悉常用的诊断工具,准确的描述故障现象.做好日常维护工作.一旦有异常情况发生,在第一时间按照流程通知分行,同时作为维护人员, 定期观测网络运行状态,在故障发生时,能迅速确定网络故障点,恢复网络的正常运行.
1.2 故障处理流程
网络设备故障处理流程,维护人员在第一时间内将相关信息反馈给省分行。
具体信息包括:设备型号,IP地址,软件版本信息,问题描述,相关检测命令的运行结果等.
1.3 日常维护参考资料
2.组织机构及职责
2.1 组织机构
组长:
副组长:
成员:
2.2 组织机构职责
(1)负责编制、修订所辖范围内突发网络事件应急预案。
(2)及时组织专业技术人员对所辖范围内突发网络事件进行应急处置;负责调查和处置突发网络事件,及时上报并按照相关规定作好善后工作。
(3)负责组建信息网络安全应急救援队伍并组织培训和演练。
3. 网络维护内容
网络建设完成后,搞好网络的运行管理是避免网络故障的关键.以下描述相关内容作为日常的维护工作的参考,及时掌握当前网络运行状况,更好的保障网络系统的安全稳定运行.
3.1 省分行网络拓扑图及介绍
省分行2台出口路由器共有3条专线上联总行,出口路由器与核心交换机呈口字型互联,核心交换机有专线连接灾备机房,通过防火墙连接人行等单位,同时接入IPP服务器,交叉下联三层接入交换机。
网络设计符合冗余性要求,在发生单点故障时保障网络正常可用。
3.2 日常维护指导
(1)机房温湿度范围:机房的温度范围是:15℃-25℃,湿度范围是:30%-70%,如果温湿度超过范围,及时上报并纪录。
(2)网络设备运行情况
网络设备运行状态灯
系统各模块状况
#show diag
版本号及运行时长
#show version
Flash中信息
#dir
系统运行温度, 硬件情况,系统外部电源情况
#show env all
CPU利用率,内存利用率
#show processes cpu
#show processes memory
#show buffer
配置信息
#show running-config
系统日志检查
#show logging
设备全部诊断信息
#show tech-support
4. 网络故障排查诊断命令及常见故障排查方法4.1 故障排查命令
查看vlan信息
#show vlan
查看接口信息
#show ip interface brief
#show interface descriprion
#show interface
查看聚合端口状态
#show etherchannel port-channel
查看生成树信息
#show spanning-tree
#show spanning-tree bridge
#show spanning-tree root
#show spanning-tree blockedports
查看HSRP状态检查
#show standby brief
#show standby
查看直连设备概要信息
#show cdp neighbor
查看路由信息
#show ip route ospf
#show ip ospf database
#show ip ospf neighbor
#show ip ospf interface
#show ip route
#show ip route summary
设备全部诊断信息
#show tech-support
4.2 故障诊断命令
查看路径信息
#traceroute x.x.x.x
查看连通性信息
#ping x.x.x.x repeat size
显示"",所发包全部成功
所有直连节点的时延平均值小于10ms;所有节点时延最大值小于50ms;丢包率在1/10000以内
用PING扩展命令检查与各远端交换机路由器的端口的连通性,测试包数量10000
#ping
Protocol [ip]:
Target IP address:
x.x.x.x
Repeat count [5]:
10000
Datagram size [100]:
Timeout in seconds
[2]:
Extended commands
[n]:
Sweep range of sizes
[n]:
4.3 常见故障排查方法
(1)路由器未检测到载波信号
1.传输线路不通
2.路由器的连接线未连接,或未连接正确.
3.路由器硬件故障
步骤1检测传输线路
步骤2检查你是否使用正确的电缆与端口
步骤3改换路由器另外端口,以确认是否为硬件故障(2)端口故障
1.判断串口故障
#sh int s0/0/0查看链路状态和通道情况
Serial0/0/0is up,line protocol is up//接口与协议都已启动(正常)Serial0/0/0is up,line protocol is down//接口启动,协议没有匹配成功(端口无物理故障,但通道不通)
Serial0/0/0is down,line protocol is down(notconnect)//接口与协议都DOWN掉,本端端口没有与对方建立物理连接,可能是对方设备没有开启,对方端口故障或者线路故障造成。
Serial0/0/0is down,line protocol is down//接口与协议都DOWN掉(协转没有工作)
Serial0/0/0is down,line protocol is down(disable)//端口出现物理性故障,需更换端口。
Serial0/0/0is administratively down,line protocol is down//接口关闭,可用命令打开
2.判断以太网端口故障
用R1#sh int fa0/0来检查以太网口及其链路的状态,如下所示:
R1#sh int f0/0
FastEthernet0is up,line protocol is up//连接正常
FastEthernet0is up,line protocol is down//连接故障,协议没有匹配成功(端口无物理故障,但通道不通)
FastEthernet0is down,line protocol is down(disable)//接口与协议都DOWN掉,本端端口没有与对方建立物理连接,可能是对方设备没有开启,对方端口故障或者线路故障造成。
FastEthernet0is administratively down,line protocol is down//接口
被关闭,可用命令打开
(3)路由器路由协议频繁flapping故障
1.ping 上联路由器接口,若延迟过大,则表明故障原因在于传输线路
2.近期是否有变更操作,逐跳排查是否存在路由环路,通过cost值、前缀列表等手段解决
3.尝试重启路由进程、重启路由器
4.抓包分析是否正常
5.路由器硬件故障,替换测试
(4)设备硬件故障
1.频繁/突然重启,并产生异常CRASH/Core信息及日志;
2.进入rommon状态
3.网络端口无响应,Console端口无响应
4.设备板卡、电源、风扇等工作异常,相关模块的LED指示灯异常板卡无法识别。
5.设备、板卡无法启动
(5)二层故障
目前对于我们网络影响较大的是二层环路的影响,由于私自添加HUB 等设备,在物理连接导致二层环路.
在这种情况下,可以通过sh logging 命令检查,发现某一mac在两个port之间flap,
通过断开某一个端口的连接来解决.。