无线CDMA产品网络日常维护作业标准化指导书(深圳电信版)使用区域深圳电信产品族无线CDMA产品使用对象维护工程师版本 2.0编写部门无线产品服务部/NTS 审核部门无线产品服务部适合产品CBSS 更新日期2010-11-02华为技术有限公司Huawei Technologies Co., Ltd.目录目录 (2)无线设备日常维护SOP简介 (3)无线设备日常维护SOP工序概况 (4)1.维护前准备 (5)2.设备状态检查 (6)3.系统安全检查 (11)4.告警分析处理 (12)5.预警实施检查 (13)6.设备负荷评估 (14)7.专题分析 (17)8.日常维护报告输出 (19)附件1 日常维护SOP Checklist (20)无线设备日常维护SOP 简介⏹ 维护SOP 是什么:无线维护SOP 是对“维护项目化”开展的技术方案支撑,解决每张网络日常维护“做什么”,“怎么做”,并使维护动作标准化。
⏹ 无线设备日常维护SOP 定位:通过在日常维护中落实维护的标准动作,提前发现并消除网络隐患,防范大的设备风险发生,保证网络稳定、安全运行。
⏹ 维护SOP 层次结构图:维护项目化(SPD 关注) 日常维护管理 例行客户拜访重大问题管理 维护项目管理…日常维护SOP (维护工程师关注),框架如下维护好网络的关键技术动作做什么 每项关键动作的具体活动工程师具体操作指导工序大类详细步骤工序活动做什么 怎么做1 2 43无线设备日常维护SOP 工序概况工序概况图序号 工序大类 工序活动建议频度1 维护前准备 组网信息收集 一次版本配套检查维护工具准备 维护帐号准备 备件安全检查 2设备状态检查 BSC 单板状态检查 月度基站运行状态检查 数据一致性检查 BAM 服务器检查 时钟状态检查 配置数据合理性检查 链路状态检查 License 检查3 系统安全检查BAM 防病毒“2+1”方案检查 季度数据备份 4 告警分析处理紧急重要告警识别 季度异常设备告警处理接口传输告警处理 基站告警处理 重点告警处理 历史告警汇总分析5 预警实施检查预警措施执行 季度规避措施检查 6 设备负荷评估 业务单板资源负荷分析 月度信令单板资源负荷分析 传输资源负荷分析 7专题分析 设备侧语音质量检查 季度设备侧数据业务速率检查 设备侧短消息配置检查 接口板复位专题8日常维护报告输出 输出日常维护报告 季度8 日常维护报告输出准备工作关键动作结果输出1 维护前准备2 设备状态检查3 系统安全检查4 告警分析处理5 预警实施检查6 设备负荷评估7 专题分析1.维护前准备工序活动图维护前准备工序号工序大类1 维护前准备序号工序活动关键动作参考文档1.1组网信息收集1、获取组网拓扑图,包括:(1)BSC和其他相关网元之间的组网结构;(2)操作维护组网图;(3)BSC和BTS、BSC和核心网、BSC间的传输类型和中间传输设备;2、获取网络规模信息,包括控制器下基站类型、配置类型、数量;3、了解组网中的设备对接,需要关注对接中的特殊配置和兼容性要求;4、获取工程设计文档,包括板位图、机房走线图、机房平面图、DDF端口分配表;5、获取控制器脚本文件和License配置信息1.2版本配套检查1、收集所有网元,网管的版本信息,下载对应版本的版本配套表;2、检查全网网元版本配套情况(BSC/BTS/M2000/工具);1.3维护工具准备1、安装相关网元版本的LMT、M2000客户端;2、工具准备:NHC/HCT健康检查工具,告警分析工具、单板日志健康检查工具;1.4维护帐号准备申请帐号密码信息(M2000/BSC LMT登陆账户、BAM windows系统账户、FTP 下载账户);1.5备件安全检查获取备件库中备件数量和现网运行的单板数量,发给备件接口人计算备件库存是否安全;注意事项11.1 组网信息收集1.2 版本配套检查1.3 维护工具准备1.4 维护帐号申请1.5 备件库存检查2.设备状态检查工序概况图设备状态检查工序号工序大类2-A 设备状态检查序号工序活动关键动作检查方法2.1BSC单板状态检查检查BSC单板CPU占用率执行DSP BRDSYSLOAD命令,输出结果中的“当前负荷”和“CPU占用率”小于60%;检查DSP的运行状态执行DSP DSPSTAT命令,输出结果中业务板的DSP的运行状态为“运行正常”;检查DSP的CPU占用率执行DSP DSPCPUUSAGE命令,DSP的CPU占用率小于60%检查PCF的缓冲占用率执行DSP BUFUSAGE命令,缓冲区占用率应小于60%单板的时钟状态检查(VIP项)执行DSP CLKSTAT检查SCU的时钟状态是否正常(:"从GCK获取的8K参考时钟(背板0)状态","从GCK获取的8K参考时钟(背板1)状态","从GCK获取的8K参考时钟(面板)状态"有任意一个不是('Normal','正常'),则为故障)检查基站单板状态执行DSP CBTSBRDSTAT命令,基站所有单板状态都为可用,或者查看告警台,不存在未恢复的“单板与主处理模块的操作维护链路中断”告警;2.2基站运行状态检查检查基站星卡状态执行DSP CBTSBRDSPECSTAT命令,结果中的GPS收星数需大于3,或告警台不存在未恢复的“收星不足告警”等时钟相关告警;检查基站RSSI值(VIP项)在M2000查看基站RSSI统计(RSSI性能测量-RSSI性能统计-主集RSSI平均值、分集RSSI平均值),RSSI值应在[-90, -115]之间;检查基站VSWR 告警台上不存在未恢复的“驻波告警”;基站软件版本(VIP项)执行CHK CBTSSWVER命令,返回的报文,报文的“备注”内容为“软件版本不同”,判断为故障——特别注意:如果出现了免升级问题,就可能出现判断错误。
天馈异常(VIP项)通过告警进行检查——告警库中有告警ID:18411、18412、18413、18414、18415、18416、19370、17588、17587,14486,14487,14488,14489,则需处理天馈异常基站资源信息(VIP项)执行DSP RES: BTSID=?,返回的结果,显示基站资源信息,其中,操作状态不是“使能”、“Enabled”或“Enable”的判为故障2.1 BSC单板状态检查2.2基站运行状态检查2-B工序活动图设备运行状态检查工序号 工序大类2-B 设备运行状态检查序号工序活动关键动作检查方法2.2基站运行状态检查基带框单板在位状态 (VIP 项)执行DSP CBTSFRMSTAT: BTSID=?返回报文的内容;根据DSP CBTSCFG :;和DSP CBTSFRMSTAT :BTSID=?的内容,并且报文中的“操作状态”是“absent ”、“Offline ”、“Unavailable ”、“离线”、“故障”或“不可用”,判断为故障。
BTS 射频参数检查(VIP 项)执行DSP CBTSCFG 命令,选择CBTSRFPARA 项,查看结果。
此项必须要结合手工检查两块射频模块配在同一个扇区标识内,而且两块射频模块配置的载波频点不相同,则分集旁路开关必须为on, 单个射频模块站点没有关系,此开关为OFF 的大功率、单扇区多射频模块站点的RSSI 会很大;2.3数据一致性检查BTS 和BSC 的数据一致性执行CHK CBTSIFCFG 命令,输出对比结果一致; 检查前后台数据一致性;执行STR CRC 命令,全部单板数据一致;检查主备单的数据一致性; 执行CHK CONSISTENCY 命令,全部单板主备数据一致;2.4BAM 状态检查检查SQL server 补丁版本: 在SQL Server 企业管理器->SQL Server 实例上单击右键->选择<属性>,显示的SQL server 的版本号应等于或大于8.00.2145;计算机名称在windows 和SQL 中一致 在SQL 查询分析器上执行sp_helpserver ,查询计算机名称和windwos 保持一致;检查BAM 双机状态 执行DSP DUALSTAT 命令,BAM 双机内外网连接应为“正常”,数据同步建立状态为“成功” ;检查BAM 进程状态 BAM Manager 的进程全部启动,实时监控为启动; 检查BAM 磁盘空间BAM 空余磁盘空间必须大于10G ,不存在“磁盘空间超大”告警;检查FTP 服务是否正常(VIP 项)检查BAM FTP 服务是否正常:(1)在LMT 上执行SAV CBTSCFG 命令,基站脚本能够成功保存并上传到BAM ;(2)查看M2000话统,可以查询最近半个小时的话统;2-C2.3 数据一致性检查2.4 BAM 状态检查2.2基站运行状态检查工序活动图设备运行状态检查工序号 工序大类2-C 设备运行状态检查序号 工序活动 关键动作检查方法2.4BAM 状态检查检查BAM Manager 的实时监控开关:实时监控需要打开 检查BAM Manager 的实时监控开关:实时监控需要打开 2.5License 检查检查BSC 时钟源状态执行DSP SATCARD 命令,框槽号为GCU 板框槽号, 输出结果中GPS 卫星数大于“3”;检查系统当前时钟源配置执行DSP CLKSRC 命令,输出结果中选源策略应为“自动”, 当前时钟源与局点实际配置一致;RFN 时钟状态检查(VIP 项)执行DSP RFNCLKSTAT 命令,如果是0号子系统,要求字段本地1PPS 校准脉冲状态,外部1PPS 校准脉冲状态,同步时间信息接收状态均为正常;如果是其他子系统,要求字段本地1PPS 校准脉冲状态,同步时间信息接收状态均为正常2.6配置数据合理性检查检查PCF 配置(1) 执行IPBRD PING 命令,能够ping 通PDSN 和ANAAA的IP ;(2) 执行DSP PDSNINFO ,PDSN 状态为“正常”; 检查BSC 链路配置(1)执行LST N7LNK 、LST TKC 命令,配置与实际规划一致;(2)执行LST NBRBSC 、LST NBRBSCLNK 命令,配置与实际规划一致,BSC IP 在同一网段;(3)执行LST NBRAN 、LST NBRANLNK 命令,配置与实际规划一致;检查单板可靠性配置(1)执行LST BRD ,查主备单板可靠性:GCUO 、SCUO 和XPUO 单板必须配置的主备模式;(2) 负荷分担可靠性:资源类单板和接口板在一个框内数目需大于2;检查信令点配置检 执行LST SPUOPC 命令,检查:(1)每对SPU 子系统都必须配置对应的信令点;(2)一个信令点需同时配置在多个SPU 子系统上;检查框间链路连线 执行CHK FRMLNK 命令,检查中心框和从框之间的框间连线,从框的主备SCU 单板都应连接到中心框,是否影响倒换=否;查配置数据合法性 执行CHK CDV 命令,输出结果不存在严重级别问题ETH IP 和网关IP(VIP 项)执行LST IPBRDROUTE,LST ETHLNK 命令,检查FE IP (ETH IP )是否和网关IP 在同一个子网(如果ETH IP 和网关IP 不在同一个子网,则为故障)2.6 配置数据合理性检查2.5 License 检查2.4 BAM 状态检查2-D工序活动图设备运行状态检查工序号工序大类2-D 设备运行状态检查序号工序活动关键动作检查方法2.6配置数据合理性检查A口数据配置(VIP项)1、执行ADD N7LNK (LST N7LNK);ADD TKC(LST TKC)命令,七号信令时隙配置使用命令ADD N7LNK配置的用于七号信令链路的时隙段(开始时隙号~结束时隙号),根据框号,接口板槽号,E1号与ADD TKC中的记录相应匹配,如果匹配不到,则认为配置正确;如果匹配到,则判断从开始时隙段到结束时隙段与未安装电路表的配置是否一致,如果一致(必须每一位都一致),则配置正确,如果不一致,则为故障)2、执行lst n7lks查询N7链路集掩码;检查N7链路集掩码是否为“M1111”(非IP化):N7链路掩码必须为“M111”;(IP化);lst n7lks查询N7链路集掩码;A12数据配置(VIP项)执行lst PDSN, LST PCF, LSTETHLNK,LST BFD,LST ARPPRT命令:1、虚拟PDSN场景,实际及虚拟PDSN均需要配置上2、所有添加的PDSN的密钥需配置一致3、端口配置(1、所有外出FE/GE接口必须配置成全双工100M/1000M模式;2、电接口拉远距离必须小于50米)4、是否配置了ARP/BFD检测,有结果就表示有配置A3A7数据配置(VIP项)1、执行LST NBRBSC,相邻BSC类型和实际组网方式应相同,应为”IPBSC”;2、具有相邻关系的两个BSC之间,“实体属性”ENTATTR必须是一个为客户端,另外一个为服务器端。