···常见告警故障处理及分析MOTOROLA基站的告警按故障设备可分为三类:设备告警、内部告警、外部告警。
一、设备常见告警设备告警是硬件告警最常见也是最重要的告警,告警设备一般为基站的主要器件,它的告警类型就是它的设备类型。
1. DRI 29:[Front End Processor Failure - Watchdog Timer Expired] 前端处理器故障DRI硬件故障,出现此告警时DRI可能会反复自启,可能会退服,应先reset or ins DRI应进行INS或RESET处理,若告警未消失,更换TCU。
2. DRI 40-47 :[Channel Coder Timeslot 0(-7) Failure] 0-7时隙信道编码器失败。
M-CELL基站经常出现此类告警,应进行INS或RESET处理,不行再更换TCU900。
此告警在GSR4时出现,升级到GSR5可能会消失。
3. DRI 51 :[Baseband Hopping TDM Link Error]基带跳频TDM链路错误。
此告警有几种可能性:TDM-Highway BUS或KSW可能有问题。
DRIM的FEP,CCDSP可能有问题。
此告警须在现场具体测试分析。
测试后判定故障点。
此告警在GSR4时出现,升级到GSR5可能会消失TDM——Time Division Multiplexing时分复用:该总线用于把来自BTS的呼叫与信令数据传送到MSC,反之亦然。
可分为两个独立的部分:交换机公共通路&出局公共通路。
交换机公共通路:处理路由到交换机的数据,数据来自外部信源 (通过E1/T1接口)或由GPROC内部产生。
出局公共通路:这是一个被交换的数据,现在被路由出BSC/RXCDR (通过E1/T1接口)或通向内部GPROC。
4. DRI 81:[Transmitter Synthesizer Failure]收发单元故障此告警为收发单元TCU故障,故障原因有可能为:-接收Calibration频点丢失-信道盘的CEB故障-射频电缆连接失败处理方法:远程ins或reset TCU,告警消失并监测;若告警未消失,更换TCU 5. DRI 86 :[Transmitter Failure]输出功率失败,引起DRI退出服务。
状态:D-U此告警是信道盘的功率放大器失败。
应更换信道盘。
6. DRI 91 :[Power Amplifier Power Low But Functioning]信道盘的功率放大器输出功率低于门限,状态B-U。
此告警有可能由于高温等原因引发,有些站经常性出现DRI[91]的盘则需要更换,以免因小区功率不平造成掉话。
有时侯在现场看不见此告警,须从OMC 的事件窗口检查。
7. DRI 92 :[Power Amplifier Temperature High But Funncioning]信道盘的功率放大器高温告警,但可以工作。
信道盘的功率放大器的高温多数是因机房高温,或机箱内的风扇故障造成的。
在出现此告警后,信道盘的性能会下降。
如温度过高,信道盘会自动闭塞。
因此常出现此告警的信道盘应于以更换。
8. DRI 112 (114)[Receiver Synthesizer Failure]接收单元合成器故障此告警为收发单元内部故障,其主要原因大概有:-收发信单元内部直流供电故障-收发信单元内部硬件故障处理方法:远程ins或reset TCU,告警消失并监测;若告警未消失,更换TCU9. DRI 150: [ Receive Matrix Branch 1 control Link Failure]接收矩阵支路控制失败,状态: B-U此告警M-CELL和Horizon中均有出现,伴随切换掉话,切换成功率低,呼叫建立成功率低导致的话务量减少。
有时也会导致信道盘的path_balance值偏高。
其主要原因有:-有故障的接收矩阵即SURF-收发信单元与接收矩阵之间的同轴电缆断路-收发信单元与接收矩阵之间的同轴电缆短路-信道盘中的均衡器板控制电路出现故障-SURF内部前-后端接口短路-SURF内部前-后端接口断路根据现场判断具体情况更换硬件。
10. DRI 152: [Control Processor to Power Amplifier Communication Failure] 处理器与功率放大器的通信失败此告警是信道盘中的CEB及对PA的控制失败。
首先对信道盘进行INS或RESET处理,不行再更换信道盘。
11. DRI 209 : [Timeslot Configuration Failure]信道分配失败 D-U 小区资源管理器CRM为MS分配无线信道时在射频硬件上分配时隙失败。
产生的原因有:-收发信单元TCU故障-DRI软件故障处理方法:远程ins或reset TCU,告警消失并监测;若告警未消失,更换TCU12. DRI 218 :[Timeslot Configuration Failure]不健全的信道接收校验数值此告警的出现时用指令:disp_cal_data <location> <device_name> <dev_id> <dev_id> <dev_id> 可看到基站接收数据校准值中出现80(错误的校准数据),还找到根本的原因,远程对硬件reset或ins均无作用,现场人员有时需更换新硬件设备而有时只需对信道盘开关电即可恢复,初步判断为硬件TCU(Horizon目前还未发现)接收单元问题。
13. DRI 234 :[Active Link Connection Failure]主用链路与BTP的链接失败。
状态:D-U此告警主要发生在M-CELL上,是主用BTP到DRI/TCU900的链接失败。
其原因主要分为:* FOX/FMUX/BTP之间的连接和使用的光纤类型的问题。
*TCU900/FOX/FMUX/BTP本身的问题。
*还有则是由于某种原因,使处理机运行过程出现问题,使其与TCU900失去联系。
这类情况可用LOCK-UNLOCK恢复。
14. DRI 235 :[Standby Link Connection Failure]备用链路与BTP的链接失败,对网络不造成影响。
但如果出现整个机柜告警应当引起重视。
以免基站主用出现故障倒换到备边时,出现整个机柜不能工作。
此告警只出现在M-CELL,是备用BTP到DRI/TCU900的链接失败。
其原因主要分为:* FOX/FMUX/BTP之间的连接和使用的光纤类型的问题。
*TCU900/FOX/FMUX/BTP本身的问题。
*有时侯如有大部分DRI出现此告警,有可能是没将BTP做成冗余形式。
DRI 239 :[Process Safe Test Audit Failure]有可能是因为机房内高温造成,若不及时进行处理,会继续出现92#告警15. DRI 243 :[Unlocked Device Not In Service]信道盘退服 D-U 此告警出现在没有主告警的情况下信道盘退服可能的原因是:系统错误导致的信道盘退服处理方法:发现告警后,RESET THE DRI观察,如果告警仍然存在这更换信道盘。
16. GCLK 2 :[Clock Reference Failure]时钟参考失败此告警为基站MSI板的时钟提取丢失其主要原因有:-E1/T1链路故障-没有MSI/NIU的时钟信号-没有XCDR的时钟信号-GCLK 时钟提取电路失败处理方法:更换MCU或NIU,若仍然出现告警则需通过传输处理17. GCLK 4 : [ Phase Lock Lost]时钟参考信号锁相丢失此告警有时会引起切换掉话或切换成功率低,有时没有影响,大多数是因为传输大网与移动网对时钟要求相距较大引起。
其主要原因有:-大多数情况是在E1/T1链路上偏移或不稳定的时钟超过所允许的极限而引起的时钟失锁。
-不正确的时钟源或-GCLK硬件故障-GCLK 晶体振荡器由于老化不能长时间对信号源进行锁相处理方法:一般情况下先进行时钟重新校准或SWAP BTP到备边,若无作用则请传输中心处理。
18. GCLK [8] :主备时钟频差过大。
此告警是由BTS的本振时钟主备频率偏差过大,应及时对时钟进行校准。
M-CELL: 8000HZ.19. GCLK 14 : [Phase Lock Failure]时钟参考信号锁相失败此告警有大多数时间会引起切换掉话或切换成功率低其主要原因有:-GCLK硬件故障-有问题的前时钟源-规范问题20. GCLK 18: [Not Operational]主时钟不工作此告警是由于基站主控板MCU不能建立正常的同步时钟初始化。
出现的原因:可能是由于固件故障,或是硬件老化。
出现此问题时应reset MCU,若告警未消失则需更换MCU;若告警消失,则不需在作进一步的观察。
GCLK 24[Bad Clock Source or OCXO (oscillator) ]:不精准的时钟源或有故障的时钟振荡器。
出现此告警时先reset site 或主控倒到备边,若还存在告警则需传输帮助解决。
21. GCLK 26: [GCLK Calibration Request] GCLK校准失败此告警有大多数时间会引起切换掉话或切换成功率低其主要原因有:-GCLK 校准超出要求范围(即不能进行校准)-有问题的GCLK时钟源或时钟源超出传输要求规范-在MCU第一次加电时不能进行校准,因此不能计算LTA值-GCLK长时间不能进行锁相,超出允许时间-GCLK 硬件故障处理方法:更换MCU另:LTA——Long Term Average.长期平均值。
BTS的GCLK频率寄存器为产生一个16.384MHz的时钟所需的值。
22.BTP [39]: 软件故障此告警出现时会引起BTP D-U Code Load Failure或反复code load .其主要原因有:-下载的软件故障-主控GPROC故障处理方法:1.进emon reset site,并观察2.更换MCU(或SWAP BTP)二、内部告警内部告警的告警设备一般为基站的辅助设备如风扇、保险、开关、电源模块等。
1. IAS 86#[cabinet fan failure]:基站风扇故障2. IAS [81] :PSU供电单元输出失败。
通过计算机检测电源模块,判定故障及时更换。
3. IAS [95] :低噪音放大器保险坏。
M-CELL对于GSM900的选件中没有采用低噪音放大器。
所以此告警对DCS1800基站有影响。