LTE切换问题分析套路
1、搭建镜像环境进行问题重现,通过问题分析中提炼出来的关 键特征一定要镜像到。
1、关键特征一定要模拟到,可以通过代码打桩等方式。
2、网络KPI问题要包括接入、(站内、站间S1、站间X2)切换、 2、多用户场景要考虑近、中、远点。
重3、建根;据代码走读发现的疑点,构造场景进行复现。
3、镜像环境要使用出问题站点的配置
说明
1、话统分析,参照局点日常监控KPI指标进行切换KPI指标监控 。
1、切换问题有如下几种
2、切换KPI不仅要关注全网指标还要关注TOP小区指标。
1)、升级或其它不明原因导致切换指标突然恶化; 2)、切换指标逐渐恶化,可能是业务量逐渐增加、或新用 户/新终端类型等不断加入;
3)、切换指标一直就比较差,需要优化性能;
1、切换问题除了分析成功率,还要分析总次数和失败次数的变 化。
关联指标分析主要尝试揭开问题的全貌,并找到一些线索 2、同时分析随机接入、接入、掉话、重建等相关指标是否有数 和可疑点。 量及成功率的异动
1、采一批TOP站点的故障/告警/操作日志;
2、分析故障/告警/操作的时间点和KPI恶化的时间点的对应关 系
如果是TOP小区/基站问题,把TOP站点和正常站点的参数 进行对比
因为TOP小区的问题现象会更明显,那么触发这些问题的 因素或场景也会更明显。
镜像重现也要使用这些TOP小区的配置文件。
因为TOP小区的问题现象会更明显,那么触发这些问题的 因素或场景也会更明显。
参照“LTE切换问题定位专家指南”,确认切换流程是在哪一个 步骤失败的,缩小问题定位范围。
1、确定是整网问题、还是TOP站点问题,还是特定载频问题; 1、确定问题范围可以用于提炼问题发生的场景,也可以
MOCN场景下是否特定运营商、特定核心网;
用于评估问题的影响。
2、如果是TOP站点问题,进一步确定是否TOP小区问题,以及确 2、通过问题范围细化还可以初步判断是切换源侧问题还
定是单向切换问题还是双向切换问题;
是切换目标侧问题。
3、如果是TOP小区问题,进一步确定是否TOP两两小区问题;
4、如果是TOP小区问题,进一步确定是否TOP用户;
分析切换KPI恶化/变化的时间点和趋势,如果是突然恶化,分 析恶化点网络是否有什么动作;如果是逐渐恶化,分析是否业 务量在逐渐增加,或有新用户/新终端在不断加入。
突然恶化的问题,分析网络的动作除了排查RAN侧的动作 (如版本升级、参数修改、RF调整、告警)外,还要分析 核心网的动作,对于配置了异系统互操作的网络,还要分 析3G2G网络的动作。
1、通过问题分析提炼出问题触发场景后,针对性进行代码走读 敢于怀疑一切。代码走读出来没有异常,不一定没有异常
。
。
1、如果是软件类问题,尝试复位基站后问题通常能够解决;
2、在常规套路定位不能解决后,尝试复位、下电、换单板这三 板斧
过程
规定动作
切换KPI监控及问题确认
问题现象和范围确认 问题范围确定
切换KPI恶化/变化时间分析
关联指标分析
故障&告警&操作日志排查
问题分析
Release notes分析 参数核查 Tห้องสมุดไป่ตู้P小区分析
问题分析
TOP小区分析 切换流程问题细化分析 镜像环境重现 代码走读 典型场景问题分析 个别站点异常
分析动作
如果是R版本或补丁版本升级导致的问题,对Release notes 中合入的问题逐个进行排查,确认是否存在切换指标修改的相 1、列出影响切换指标的问题修改,并确认是否版本间指 关问题(如果是V版本升级,因为版本间差异太多,该动作可以 标定义存在变化 跳过)
按照“参数核查通用指南”进行分析 找出TOP小区,分析问题的日志从这些TOP小区中采集;