当前位置:文档之家› 华为告警处理手册簿1.0

华为告警处理手册簿1.0

目录1. MSC SERVER处理分册 (2)1.1 告警箱处于离线状态 (2)1.2、FE端口故障 (3)1.3、WCKI时钟参考源丢失 (4)1.4、控制框与业务框通信失败 (5)1.5、BAM到主机通讯失败 (6)1.6、BAM到主机连接中断 (7)1.7、与NTP服务器断连 (8)1.8、Q922链路故障 (9)1.9、TCP链路故障 (10)1.10、CPU过载 (12)1.11、单板网口协商失败 (13)1.13、许可证文件即将失效 (14)1.14、计费中心长时间未取话单 (15)1.15、心跳中断 (16)1.16、双机倒换 (17)1.17、私网中断 (18)1.18、IP资源失效 (19)1.19、备份连接失败 (20)1.20、单板故障 (21)1.21、许可证即将过期告警 (22)1.22、许可证已经过期告警 (23)1.23、电源输出开关关闭 (24)1.24、H.248 SCTP链路故障 (25)1.25、MGW退出服务 (27)1.26、MTP目的信令点不可达 (28)1.27、MTP路由传输禁止 (30)11.28、MTP链路故障 (31)1.29、MTP缓冲区拥塞 (33)1.30、M2UA链路故障 (34)1.31、SCCP目的信令点禁止 (36)1.32、SCCP子系统禁止 (37)N => 联系对端局点确认其子系统是否恢复。

(39)2. MGW处理分册 (39)2.1 FE级联网口故障 (39)2.2 风扇框通讯故障 (40)2.3 NET单板时钟检测异常 (43)2.4 NET单板时钟失锁 (46)2.5 GE级联光口故障 (47)2.6 NET单板时钟失锁 (49)2.7 NET单板时钟配线故障 (50)2.8 级联光口故障 (52)2.9 GE通道光模块故障 (54)2.10 TDM通道光模块故障 (57)3.11 BLU时钟检测异常 (59)2.12 信令链路故障告警 (60)2.13 SPF扣板链路故障 (63)2.14 L2UA链路组故障 (65)2.15 L2UA链路故障 (66)2.16 单板软件异常告警 (68)2.17 SIWF故障告警 (70)2.18 控制平面拥塞 (72)2.19 单板故障 (73)2.20 告警箱断链 (75)2.21 单板上存在故障的半永久 (76)2.22 参考源丢失 (78)2.23 虚拟媒体网关迁移出业务态 (80)1. MSC SERVER处理分册1.1 告警箱处于离线状态告警含义1. 告警解释当BAM与告警箱之间通信中断时间超过10秒钟后,系统将产生该告警。

2. 告警参数无。

对系统的影响告警箱无常运行,不能对BAM发送的告警做出正确响应,如不能发出声光告警。

系统自处理过程无。

相关告警无。

告警处理1. 可能原因BAM与告警箱之间链路中断。

2. 处理建议通知分公司维护人员检查BAM和告警箱的连接。

1.2、FE端口故障告警含义1. 告警解释系统监测到FE端口出现故障,将产生此告警。

2. 告警参数对系统的影响如果FE端口故障,通过该端口连接的设备之间通信中断。

系统自处理过程系统的FE通信基于双平面,如果一个端口故障,将另一端口进行通信。

相关告警无。

告警处理1. 可能原因硬件故障。

2. 处理建议对于WSMU和WIFM板,需要检查网线的连接情况。

对于其它单板,需要检查WHSC板的运行情况。

DSP BRD: FN=1, SLN=2;(输入单板的框号槽号)1.3、WCKI时钟参考源丢失告警含义1. 告警解释当WCKI时钟参考源丢失时而产生此告警。

2. 告警参数对系统的影响可能使系统不能正常工作。

系统自处理过程时钟参考源丢失,可能导致时钟系统不能正常工作。

相关告警无。

告警处理1. 可能原因•外部时钟源工作不正常。

•连接外部时钟源的时钟线有问题、或时钟连线不正确2. 处理建议1.观察设备面板CKI单板BITS时钟输入端口是否正常。

2.检查外部时钟源是否工作正常,如果不正常,更换时钟源。

3.检查时钟线连接是否正确,如果连线正确,请更换时钟线。

1.4、控制框与业务框通信失败告警含义1. 告警解释当控制框和业务框之间的通信中断时产生此告警。

2. 告警参数对系统的影响控制框和业务框之间的通信中断。

系统自处理过程无。

相关告警无。

告警处理1. 可能原因•可能控制框与业务框的HSC之间连线不正确•可能业务框工作不正常。

•可能业务框没有及时发心跳消息给控制框。

2. 处理建议1.检查控制框与业务框的HSC之间的连线是否正确,或更换网线,如果问题解决,这说明是连线有问题。

2.观察业务框的WSMU板是否运行正常,如果不正常,更换WSMU单板看问题是否解决,如果仍然没有解决更换HSC板,如果仍然没有解决,那可能是背板有问题,需更换背板解决。

3.检查CPU是否被某个任务长时间占用,导致没有发送心跳消息,或者有网络风暴,导致控制框无常接受到消息1.5、BAM到主机通讯失败告警含义1. 告警解释当BAM到主机通讯失败时,系统发出此告警。

2. 告警参数对系统的影响BAM与主机之间无法通讯。

系统自处理过程无。

相关告警该告警由ALM-2364 BAM到主机连接中断引发,ALM-2364 BAM到主机连接中断表示BAM 和交换机断连,因此必然导致该告警的产生。

告警处理1. 可能原因交换机有一个框的两个连接都断了。

2. 处理建议1、检查设备面板是否显示正常,绿色代表正常,灰色代表BAM与主机连接失败。

2、检查BAM机器网卡和LAN switchs:3、检查BAM机器网卡和LAN switchs是否工作正常。

并保证所有网线连接正常。

告警是否恢复?1.6、BAM到主机连接中断告警含义1. 告警解释当BAM与主机中断时,系统发出此告警。

2. 告警参数对系统的影响BAM与主机之间无法通讯。

系统自处理过程无。

相关告警该告警连带产生 ALM-2362 BAM到主机通讯失败。

告警处理1. 可能原因交换机某一个框的一个连接断开。

2. 处理建议1、检查设备面板是否显示正常,绿色代表正常,灰色代表BAM与主机连接失败。

2、检查BAM机器网卡和LAN switchs:3、检查BAM机器网卡和LAN switchs是否工作正常。

并保证所有网线连接正常。

告警是否恢复?1.7、与NTP服务器断连告警含义1. 告警解释时间同步进程与NTP服务器断连,时间同步已停止。

2. 告警参数无。

对系统的影响系统时间无法和NTP服务器同步。

系统自处理过程无。

相关告警无。

告警处理1. 可能原因•NTP服务器被停止或服务被关闭。

•系统和NTP服务器之间的网络断连。

2. 处理建议(1)、在MSOFT3000跟踪维护中用PING NTP服务器IP地址,检查网络是否正常。

(2) 检查NTP服务器是否被停止,NTP服务器的时间服务是否被关闭。

(3) 检查系统和NTP服务器之间的网络是否断连。

1.8、Q922链路故障告警含义1. 告警解释系统单板之间通过Q.922链路进行通信,底层为FE。

当两个单板间的Q.922链路发生故障时,产生该告警。

当WSMU启动时,WHSC板会自动被复位,此时也会产生该告警。

2. 告警参数对系统的影响•使用该链路通信的两个模块之间通信中断。

•该链路传输的业务发生中断。

系统自处理过程无。

相关告警无。

告警处理1. 可能原因•Q.922链路发生故障。

•WSMU启动。

2. 处理建议1.检查是否复位了WSMU板?Y=> 正常告警,不用处理N=> 转步骤(2)2.检查FE网口的状态是否正常?观察设备面板HSC端口状态。

Y=> 转步骤(3)N=> 更换不正常状态网口所在的单板3.检查单板的运行状态,如果单板发生故障,更换单板。

DSP BRD: FN=1, SLN=2, PSN=FB;(输入HSC单板框号、槽号、前后插板)1.9、TCP链路故障告警含义1. 告警解释系统监测到TCP链路出现故障时产生该告警。

WSMU板通过TCP链路与BAM和iGWB进行通信。

2. 告警参数对系统的影响•告警模块与目的模块之间的通信中断;•基于该TCP链路的业务中断。

系统自处理过程无。

相关告警无。

告警处理1. 可能原因•网络连接网线故障;•网卡故障。

2. 处理建议(1) 检查WHSC单板工作状态是否正常?Y=>可能为对端设备如BAM、iGWB网卡故障。

N=>更换故障单板。

DSP BRD: FN=1, SLN=2, PSN=FB;(输入HSC单板框号、槽号、前后插板)(2) 根据告警参数确认故障链路位置,检查TCP链路两端网卡的指示灯是否正常?Y=>请联系华为当地办事处技术支援人员。

N=>可能是网线连接问题。

(3) 判断是否网线松脱,拔插一下两端的网线接头,确保网线连接正常,检查故障是否排除?Y=>网线连接问题,结束。

N=>可能是网卡故障。

1.10、CPU过载告警含义1. 告警解释单板CPU占用超过设定的阈值(使用命令SET CPUTHD设置)时,产生该告警。

2. 告警参数对系统的影响部分呼叫会丢弃,产生呼损。

系统自处理过程系统启动流量控制机制,降低CPU占用率。

相关告警无。

告警处理1. 可能原因•系统容量不足;•处理模块分配不合理。

2. 处理建议(1) 根据告警参数确认发生CPU过载告警的单板,确认是否大部分同类型单板都CPU占用率偏高?检查该单板的CPU大小:DSP CPUR: LT=MN, MN=2;(输入该单板模块号)(2) 调整业务配置,将过载单板部分业务的调整到其它单板。

1.11、单板网口协商失败告警含义告警解释当单板的网口或外网口以半双工模式工作时产生此告警。

告警参数3.举例参数“框号=0, 槽号=0, 端口号=2”表示位于0框0槽WIFM板的第2个网口(外网口)协商失败。

注意:系统板和WIFM板配置有3个部端口,即端口0、1和2。

其他单板配置有两个外部端口,即端口0和1。

对系统的影响BAM与主机之间的以太网数据包不正常丢失,可能导致系统从BAM加载文件失败。

系统自处理过程无。

1.可能原因单板起来之后,会和LAN Switch进行网口工作模式协商,如果LAN Switch工作在半双工模式,单板端口也会工作在半双工状态。

2.处理建议检查LAN Switch设置,将其设为全双工。

1.13、许可证文件即将失效告警含义1. 告警解释许可证在X天后到期。

当以下两种情况中的任意一种发生时将产生此告警:•MSC服务器运行在试用许可证模式下。

•许可证文件在30天之到期。

2. 告警参数对系统的影响许可证文件很快到期。

当许可证到期,MSC服务器运行在默认许可证配置下。

系统性能会降低。

系统自处理过程无。

1. 伴随告警无。

相关主题