华为OMC分析流程华为技术服务有限公司2020年5月26日目录一、OMCR分析总体流程图 (3)二、网络评估和检查 (4)1、网络评估流程图 (4)2、网络结构分析 (5)3、网络性能评估 (5)4、告警检查及硬件排障处理 (6)5、网络参数检查 (8)6、邻区检查 (8)三、发现网络问题 (8)四、分析和解决问题 (9)1、分析和解决问题的流程 (9)2、掉话问题分析流程 (10)3、切换问题的分析流程 (14)4、TCH 拥塞的分析流程: (16)5、SDCCH拥塞分析流程 (19)6、接入类问题分析流程 (20)五、附件:............................................... 错误!未定义书签。
一、OMCR分析总体流程图图1 OMCR总体流程图二、网络评估和检查1、网络评估流程图图2 网络评估流程图2、网络结构分析采集本业务区和相邻业务区的相关信息表,包括BSC号、LAC 号、基站号、Cell_id、载频数、硬件配置、经纬度等相关信息;同时将这些信息集中在一个数据库文档中。
这份数据库文档为后续性能指标分析、最差小区分析等工作提供分析依据和数据。
采集本业务区和相邻业务区的行政电子地图;同时依据数据库文档中的基站信息表,制作相应的Mapinfo图层,例如:按归属业务区、归属MSC、归属LAC,制作对应的专题图层,按本业务区及相邻业务区基站的分布及MSC间切换区域、BSC区域、LAC区的划分等等。
MSC、BSC、LAC区的容量分布尽量做到均匀, 结构简单, 清晰。
基站分布尽量呈网格结构, BSC, MSC、LAC区边界尽量避开话务密集区或重要的地区。
3、网络性能评估整个OMC的分析思路是:从面到点的进行问题定位和分析。
在了解一个网络的网络质量时我们一般都先通过话统来了解其网络运行情况,先对BSC整体性能/C1报表这个统计功能子项进行研究和对比分析,如果在BSC整体性能/C1报表统计中发现某个重要指标(如掉话率、切换成功率)有异常情况时,我们再对其相应更详细的内容具体分析。
分析网络性能的时候不能只看某一天和某一段时间的话统数据,这样分析比较片面。
而应该分析一段时间内的话统指标。
一般我们取一周的忙时话统数据平均值来把握网络的性能,同时观察在话务量基本稳定的情况下,有无明显的指标波动情况存在。
●系统性→自上而下,从整体到局部●整体性→查看一周以上的指标变化趋势和每天的变化趋势●相关性→各种话务统计指标之间的联系指标名称和评估标准:如切换成功率、掉话率、拥塞率、无线接通率等指标。
表1 KPI指标4、告警检查及硬件排障处理网络优化通常应当是在硬件设备运行正常的前提下进行,但是由于网上设备的突发故障,无法保证运行正常,但往往硬件故障将会对网络指标有很大影响,所以我们在明确整网运行情况后,需要对告警信息进行查阅,以便及时发现问题进行故障排除。
BSC告警模块接收各个应用层发送过来的告警信息,对之进行分析,去掉已屏蔽的信息,然后产生相应的告警和告警恢复信息下发到告警箱和下发给后台显示。
BSC告警系统实现原理:分散控制,集中管理。
如下图所示:图3 告警分析流程图目前BAM对故障告警有过滤机制,原理是:BAM中有一个故障告警队列,当前台将故障告警发到BAM后,BAM首先检查自己的故障告警队列,看是否有同样故障告警在队列中,如果队列中已经有了该故障告警,则BAM认为该故障告警为重复故障告警将其丢弃,如果队列中没有该故障告警,则将该故障告警写入队列,同时将该故障告警转发到SERVER上去;当前台将恢复告警发到BAM后,BAM首先检查自己的故障告警队列,看是否存在与其对应的故障告警在队列中,如果队列中没有与其对应的故障告警,则BAM认为该恢复告警为重复恢复告警将其丢弃,如果队列中存在与其对应的故障告警,则从队列中清除与其对应的故障告警,同时将该恢复告警转发到SERVER上去。
告警按照功能类型可分为四类,分别是:电源类、模块功能类、告警箱类、外部环境类。
告警信息按故障的严重程度, 告警信号的性质可分为四级:紧急告警:需紧急处理,否则会影响重要功能实现。
对应红色指示灯,急促铃。
重要告警:需要及时处理,否则会影响重要功能实现。
对应红色指示灯,次急促铃。
一般告警:发送此类告警的目的是提醒维护人员及时查找告警原因,消除故障隐患。
对应黄灯,断续铃。
提示告警:对此类告警,维护人员不用及时处理,只要对交换机的运行状况心中有数。
对应绿灯,单次铃。
通常我们要关注有没有BSC的一些故障告警、CPU占用情况和BTS的一些可能会影响业务的告警,如时钟失锁、TRX通信故障、分集接收通道告警、驻波比告警、无线链路告警、Lapd告警、OML断链告捷等,并结合BSC、BTS维护台观察单板状态是否正常、查询单板软件是否正确、时钟是否正常、信道占用是否正常。
通过结合分析指标很差的小区,可以较快的确定一些硬件及软件故障,通过换板、软件重新加载等手段排除故障、改善指标。
5、网络参数检查可以按功能分为四大类:网络识别参数、系统控制参数、小区选择参数和网络功能参数。
6、邻区检查定期邻小区检查的方法。
方法一:华为NASTAR 网优工具检查方法二:华为BSC一致性工具检查三、发现网络问题网络问题分析步骤→了解一个网络的网络质量时,我们可以通过对BSC整体性能/C1报表这个统计功能子项进行研究和对比分析→如果在BSC整体性能/C1报表统计中发现某个重要指标(如掉话率、切换成功率)有异常情况时,我们再对其相应更详细的内容具体分析。
→检查单项指标超标、故障绝对次数(掉话、拥塞、切换失败等)多的小区→综合百分比、故障绝对次数(掉话、拥塞、切换失败等)这两个参数来决定是否进一步处理。
发现网络问题可以从两个方面重点分析收集:设备告警信息和用户投诉信息及话务统计。
设备告警可以从维护台上的告警台上显示,同时华为提供声光告警,可以及时了解到设备硬件问题。
用户投诉一般通过服务热线1001得到。
话务统计通过◆常见网络问题列表→BTS硬件故障、驻波比告警等→小区掉话率高→小区切换差→小区拥塞,包括SDCCH拥塞和TCH拥塞→小区覆盖差→小区上下行不平衡→小区存在干扰→用户投诉话音质量差、单通、串话等话音问题。
四、分析和解决问题1、分析和解决问题的流程实际工作中,可灵活应用此问题分析树,结合网络的其他特征,快速定位问题。
同时和其他网优手段的结合:●路测:模拟用户在移动中通话●分析对象:覆盖、质量、切换、信令●CQT测试:在不同地点大量拨打电话2、掉话问题分析流程掉话分析思路图:图4 掉话分析思路图掉话分类●掉话大体分为4种,特征如下:→边缘掉话:接收电平低、TA值大→近端电平低掉话:接收电平低,TA值小→质量差掉话:接收电平高,接收质量差→突然掉话:开始一直正常,突然掉话根据四种掉话特征,再分别查看相关话统项。
如边缘掉话要分析是否漏做邻区、邻区是否太忙等。
近端低电平掉话则要查看是否存在覆盖不足的问题。
质量差掉话的重点是查找、解决干扰问题。
突然掉话有一定偶然性。
◆边缘掉话产生原因:→MS超出了基站的有效覆盖区,孤站、漏做邻区导致的孤站、过覆盖导致的孤岛效应。
解决方案:→增加基站,形成连续覆盖;→补作邻区关系,使手机可以切换到其他小区;→提高天线挂高、使用高增益天线、调整天线下倾角;→修改参数,如“SACCH复帧数”、“下行链路失效计数器”、“边缘切换门限”,“切换统计时间”等,部分的改善掉话性能。
核心是形成良好覆盖,消灭孤岛,使切换快速执行。
◆近端低电平掉话产生原因:→密集楼群,复杂地形导致覆盖不好解决方案:→增大有效辐射功率→调整方位角和下倾角,将天线主瓣对准主要用户群→调整与掉话相关参数注明:这种掉话一般不会太多,市区产生的这种掉话可能是为了降低干扰而降低了基站发射功率或者增大天线下倾角。
增大有效辐射功率时要考虑对其他小区的干扰。
◆质量差掉话(电平高)产生原因:→上行或下行存在干扰→传输误码较高。
干扰源:→不同频段直放站→雷达、热溶机等设备产生的干扰→频率计划不合理→设备故障产生的干扰。
干扰是造成掉话的主要原因。
解决方案:→排除网外干扰;→优化频率计划;→调整天线方位角、下倾角,减少越区覆盖;→解决传输误码问题。
针对不同的原因,或调整频率计划避开干扰,或请用户督促有关部门解决网外干扰。
直放站和越区覆盖是最常见的干扰原因。
掉话指标查找:●找出掉话率高小区;●检查高掉话小区的话务量和掉话次数;●在“掉话性能测量”任务中,查看其掉话性能;●查看“干扰带分布情况”;●根据掉话的4种典型特征,给该小区的掉话情况分类;引起掉话的主要原因:●干扰(网内干扰、外界干扰、设备本身的干扰)●覆盖不好(盲区、孤岛)●切换不合理(相邻小区的规划、切换的参数)●上下行不平衡(塔放、功放、天线方向)●参数设置不合理(无线链路失效计数器,SACCH复帧数)●设备问题(载频板、功放、塔放这是造成掉话的几个原因,根据怀疑的原因,查看有关话统项,去逐步排除。
◆干扰(网内干扰、外界干扰)查看话统项:→分析话统中的干扰带出现的规律:随时间、话务量的变化。
→轮流关闭载频观察话统项干扰带变化。
→因质量差而发生的切换占全部切换的比例。
接收质量性能测量:针对载频,统计平均接收质量等级,作为参考。
→掉话性能测量:记录了掉话时的平均电平与质量,作为参考。
如果有一个以上空闲信道出现在干扰带三、四、五中,一般就有干扰。
若是网内干扰,一般都会随着话务量的增加而增大,通常情况下若是网外干扰,与话务量增加没有关系。
这里还需要说明干扰带是基站载频信道在空闲状态下通过射频资源指示消息向BSC上报的,若当前信道忙也难以上报资源指示消息,因此干扰带的统计也应结合话务量综合考虑。
小区性能测量/小区间切换性能测量,或出小区切换性能测量中,统计了各种原因引起的出切换尝试次数,如果质量差引起的切换次数过多,说明有干扰,而且上行质量差切换过多,说明有上行干扰,下行过多,说明有下行干扰。
解决方法:→进行实际路测,检查干扰路段和信号质量分布。
→使用频谱仪分析查找。
→开启跳频,DTX,功率控制等手段降低干扰。
→解决设备问题(如:TRX板自激、天线互调)。
分析是哪些小区信号的重迭覆盖引起的干扰。
根据实际情况,通过调整相关小区的基站发射功率、天线倾角、邻区关系、切换参数,或调整频点规划等避免干扰。
◆覆盖(盲区、孤岛)检查话统项:→功率控制性能测量中,平均上、下行信号强度过低;→接收电平性能测量,接收电平低的次数所占比例过大;→小区性能测量/小区间切换性能测量中,发起切换时电平等级过低、平均接收电平过低;→掉话性能测量中,掉话时电平过低,掉话前TA值异常;→定义邻近小区性能测量,可以定位到哪个邻区的平均电平过低;判定是覆盖问题导致掉话后,要确认确实存在覆盖问题还是人为因素引起的覆盖问题,如天线指向不合理造成孤岛、漏做邻区、切换参数不合理导致未能及时切换掉话。