软交换机的维护与管理摘要:通信专网中的程控交换机是专网的汇接枢纽和连接公网的入口,对维护的预防性、及时性要求很高。
本文从程控交换机的环境要求、日常维护、数据制作、软件硬件的常见故障处理等几个方面介绍自己在程控交换机维护工作中的一些心得。
关键词:程控交换机;环境;维护;数据;故障作为通信专网中的汇接枢纽,不管是行政交换机还是调度交换机,都是影响面大、直接关系到生产运行、安全调度、行政管理和职工生活的重要设备。
因此对设备的维护也提出了很高要求。
本文结合自己在程控交换机维护工作中的实践,探讨一些在交换机维护管理和故障处理上的心得。
1.环境要求保证交换机的环境要求,注意日常保养,力使设备在最佳状态下运行。
环境要求主要包括:温度、湿度、电源、防静电、防电磁干扰、防尘、防火、防鼠等。
1.1温湿度要求机房温度一般要求在18℃-25℃之间。
温度偏高机器散热不畅,使晶体管的工作参数产生漂移,影响电路的稳定性和可靠性,严重时还可造成元器件的击穿损坏。
一般交换机都带有温度保护的功能,检测到温度超标有可能造成部分或整机停运。
湿度一般要求相对湿度保持在40%-60%的范围内。
空气潮湿,易引起设备的金属部件和插接件管部件产生锈蚀,并引起电路板,插接件和布线的绝缘降低,严重时还可造成短路。
空气太干燥容易引起静电效应,造成交换机的损害。
机房内不要安装暖气,要保证空调容量足够。
维护人员应每日检查并记录机房温、湿度。
我局交换机运行之初,空调室外机安装位置不当散热不良,下班后出现大量用户分机无声,维护人员赶到机房,发现空调停运,机房温度高达30℃,设备有大量告警,自动闭锁部分机框作为温度保护措施。
重新开启空调,人工启动关闭的机框,降温后恢复正常。
后彻底改造,将室外机搬迁、加装一台空调,保证设备运行稳定运行。
1.2防静电、防电磁干扰程控交换机内部电路大部分采用半导体MOS,CMOS等元器件。
这类器件对静电感应灵敏,易受静电感应电压损坏。
在维护中曾经发生过静电引起的电路板故障。
此类故障有可能涉及到交换机的各个部位,小至一个单元,大到公共控制部分的处理器,因此要从各方面注意减少静电。
机房应设防静电地板,地板支架与接地网接触良好,不可用化纤类地毯、窗帘。
工作人员进入机房要按规定着装、换鞋,减少在设备周围的人员走动,特别是在干燥的冬季。
避免不必要的拔插电路板,接触板件要带防静电手环或先碰一下接地的金属框架放掉人体所带的静电。
不要随意碰触板件的焊点和元件。
不用的板件要妥善保存,有保护塑料袋的要入袋。
程控交换机临近用电设备产生的电磁辐射和其他电干扰,对程控交换机的硬件和软件都有可能造成损害,设备安装以及拆包装取电路板时要与电动机、变压器等用电设备及电子设备保持足够距离,必要时可应采取屏蔽措施,避免电磁干扰。
交换机的机外布线、通信电缆也会受到电力线干扰,要避免长距离并行。
1.3电源、接地及防强电按规定定期监视设备输入电压,检测机房、设备、配线架等的接地电阻是否在要求的范围内。
外线必须经过配线架保安器才能接入。
1.4防尘机内积灰有可能造成绝缘降低、接触不良,甚至电路短路、部件损坏等。
因此要保证机房清洁,定期吸尘、用拧干的抹布擦拭机框、终端,每周清洗空调和交换机内的隔尘网,一定要干燥后才可放回机内。
根据需要,每年或两年停机进行一次全面清扫吹尘。
1.5防火、防鼠及其他方面的要求2.日常维护严格按照各类规程和维护操作规范要求,认真做好每项日常维护工作,及时消除隐患,提高运行质量。
2.1坚持定检,严密监视设备运行状况,及时发现处理各类异常。
除了各类有关的制度标准、通信规程以外,各家交换机厂方也提供了完善的维护制度,包括日常维护,周、月度、季度、年度维护,操作手册等,要详细掌握、认真执行。
坚持各项软件维护、硬件维护,各项定期检查、测试,根据需要调整一些电路板的位置。
要提高责任心,例行的设备巡视需全面,例如,系统声光告警——指示电源、温度、公共控制设备故障等等,电路板指示灯和液晶显示——指示某块板状态或故障类型,话务台指示告警,维护终端告警和各类维护信息,计费系统工作状态等。
及时发现异常,根据维护告警信息对问题部位进行检修。
即使看似不影响交换机运行的问题也应彻底查清。
许多次要告警都是重要告警或紧急告警的前奏,积极主动发现消除各类缺陷,可将一些重大故障消除在萌芽状态。
我局程控交换机维护中,要求每日用维护命令查看公共设备电路状态,曾经出现过一块处理器至网络接口板偶尔有端口自动关闭,用命令打开后正常,通过维护终端查看历史信息,发现是在午夜自行例检时,测试未通过关闭的。
将其分别插在两个CPU中进行人工测试,均有错误信息,更换此块卡板后正常。
后经厂方确认为硬件故障,避免了故障扩大。
2.2保障维护资料完善准确,设备、电缆标示明确详细,均能更新及时。
完善各类维护资料是日常维护的必需,也可保证故障快速定位。
除一般通信站要求的必备资料外,设备机框分布图、板位布置图、设备端口容量资源与使用情况、号码资源与使用情况、配线架配线资料等均应完善。
设备内外和配线架的电缆应有规范清晰的标示。
我局良田小区交换机在一次设备停机清扫后,恢复拔下的一块网络板时,因其连接了两个外围机框,电缆插头上“0”和“1”的标志不明显,维护人员将两个插头插反造成两个外围机框的用户错位,测试电话时发现号码错位,检查出问题后我们将所有设备电缆、机框、电路板上的标示、标签均重新做了完善。
3.数据制作全面掌握交换机数据系统,数据制作合理,保证运行水平及服务质量。
3.1深入学习并不断积累理论知识及实际经验,才能在数据制作中得心应手。
日常维护中,要理清各种数据制作思路,掌握数据的制作流程、各个参数的含义、各类呼叫处理流程、交换信令原理、整个呼叫过程中所牵涉到的各类数据间的关系,不能只死记一些命令。
在理解掌握的基础上才能有创造性的运用,出现问题时也能迅速查出根源。
3.2数据设置合理、规范、清晰。
制作数据时要严格按照厂方配置数据的规范来操作。
合理安排,提高交换机的处理效率、电路的利用率,还要注意话务在各机框(模块)间较均衡的负荷分担。
例如,将同一局向的多条中继电路分配到不同的中继板中,可保证某一块板故障不至影响整个局向;一个机框(模块)中安排均衡的办公电话和住宅电话用户。
整套数据要规范清晰,便于修改和检查,例如,在路由表中,可将同类路由的路由号划分范围连续编排,入公网的路由、专网数字中继的路由、至各个变电站的路由等等各有一定范围,后来者增删或修改数据时可一目了然。
3.3灵活设置数据,满足各种用户需求。
在熟悉整个数据系统各类参数的基础上,灵活应用,结合交换机提供的新业务功能,保证不同用户功能的完善。
特别是用于电力调度的交换机,因具有与行政交换机不同的应用面,从而形成了调度交换机特殊的功能要求。
包括:调度电话的优先权和调度用户对网内中继线和用户线的各种控制功能、中继线排队优选功能、中继线自动连选功能、自动迂回功能、主叫号码显示功能、强拆功能、强插功能、会议电话功能、故障紧急切换功能等,不同机型的实现形式不同,但要保证根本的目的:实现调度呼叫用户和调度用户无阻塞,调度通话优先,以保证对通信系统使用的控制支配权。
行政交换机也应根据实际需要适当的开通某些功能,不仅为用户,有时也给维护检测提供方便。
3.4定期检查所有数据,是否符合用户要求、是否配合系统的功能、发展的需要。
交换机在运行中,维护人员应根据各种情况的变化如容量的增大、功能的发展等及时检查调整数据,每次做完数据也要仔细核对和进行测试。
数据的漏洞有时可能会带来严重后果,而且即使对不影响通信的小问题,也应树立“优质服务”的意识,不放过任何细节。
例如,我局MD110交换机的用户在拨叫一路CO中继时拨号音不能及时被切断,用户反映拨叫时伴有短促“嘟”的声音,此现象虽对接通无大影响,但用户使用时感觉异常。
直接在中继线上并测试话机拨号正常,于是检查数据。
首先查看ROCAP:ROU=ALL;(路由参数)其中SIG参数第一位为4,说明主叫方听市话交换机拨号音,拨完第1位后切断拨号音;又查看NADAP;发现号码长度没有设置。
经分析由于没有设置号码长度,使MD110交换机不能有效地在分机拨完第一位号码后切断市话拨号音,而是由市话中继设备在收到第一位号码后才切断市话拨号音,这就产生了时差,而出现了在拨号过程中能听到“嘟”的一声拨号音漏声,我们增设号码长度NANLS:EXL=0,(出局)MIN=4;(最小号码长度),上述问题解决。
4.故障处理要在深入了解交换理论、设备原理、软硬件结构、部件功能等基本知识和具体细节的基础上,充分利用设备提供的维护工具,不断总结经验,提高故障查处能力。
下面根据日常工作中的积累,将一些常见的故障及其处理做如下讨论:4.1软件故障软件故障有一部分是可以通过重新启动的方法来消除的。
我们把在交换机运行过程中突发的、仅存在于处理单元内存中的软件故障,称为动态软件故障。
这类故障大部分可以通过重新启动解决。
一般由以下三个方面的原因造成:一是由于交换机出现某些干扰后软件运行故障;二是在交换机系统进入维护应用阶段后由于操作人员维护水平问题或由于用户的某些误操作造成的故障;三是环境因素对交换机的影响。
重新启动的方法包括:利用维护操作命令、利用电路板开关、利用初始化按钮、重新装载按钮。
由于这些方式均会对通信产生不同程度不同范围的影响、危害,特别是通过硬件按钮重新启动,使用时要谨慎。
还有一些故障,经过重新启动后暂时恢复正常,但类似现象的故障不明原因反复发生,这种情况就要深入仔细的查找根源,确定是如前所述偶尔的动态软件故障,还是系统本身的软件缺陷、硬件问题等。
由于软件设计缺陷引发的故障需要通过厂商提供的补丁程序或软件升级来解决。
例如,我局交换机曾多次出现大量用户摘机有啸叫声,并且终端上有软件缺陷的提示信息,关闭、打开用户板后恢复正常。
经联系厂方远端维护做软件打补丁后正常。
需要维护人员查找并消除的软件故障一般是交换机运行过程中或操作维护过程中产生的数据错误,这就需要通交换机运行过程中或操作维护过程中产生的不断积累经验,保证数据的正确性、软件状态的一致性和正确性。
4.2用户故障零散的用户故障首先在配线架隔开内外端,测试判断是内线故障或外线故障。
常见的外线故障有断线、短路、接地等。
内线的故障大体可分用户端口关闭、用户板端口电路损坏、用户板底座或背板故障、电缆连线或插接件损坏、交换机相关功能部件故障。
可由易到难逐段排除。
4.3维护终端不工作维护终端通过串行数据接口或V.24接口与交换机进行通信,以我局Meridian1交换机为例,排除终端计算机本身或键盘等问题后,与交换机通信中断时,先查看串行数据链路板指示灯。
闭锁灯亮,第一步可以试着在维护话机上用命令打开;如果多次关闭打开不成功,第二步关掉终端,利用串行数据链路板上的开关重新加电,再打开终端;如果不成功第三步可以在夜里话务量小时做初始化,若故障为串口自保护关闭则可恢复。