1CSFB问题定位“三步法”1.1“三步法”快速定位问题出现阶段结合CSFB的业务流程,针对CSFB问题小区可通过“4G寻呼分析”、“4G释放分析”、“2G接入分析”三个步骤快速定位问题出现的阶段。
其中涉及的指标公式如下CSFB寻呼成功率=Extend Service Request次数+Service Notification次数Paging Request次数×100%S1释放成功率=RR Connection Release次数Extend Service Request次数+Service Notification次数×100%CSFB被叫回落成功率=Paging Response次数Paging Request次数×100%1.2第一步:4G寻呼分析1.2.1分析流程4G寻呼阶段是CSFB最常出现问题的环节,现网约40%的CSFB问题均与4G寻呼有关。
导致4G寻呼问题的原因除了无线弱覆盖、重叠覆盖引起的质差等常见原因外,2/3/4G互操作、联合TAU以及核心网BUG,也会引发寻呼失败问题。
因此4G寻呼问题的分析需要从2、3/4G网络协同角度入手,结合核心网SGs/S1口信令,逐段排查可能的问题原因。
常规的4G寻呼问题分析流程如下所示1.2.2各环节分析要点(1)确认核心网寻呼是否下发现象:➢主叫侧听到“用户正在通话中”或“用户已关机”的录音通知分析要点:➢从主叫侧CALL Proceeding时间,推算被叫侧寻呼下发时间。
现网4G的SGs口寻呼策略为3.5秒一次,一共发3次,因此从开始寻呼到寻呼失败约有10秒的周期,分析寻呼失败原因时需要重点分析这10秒期间终端的状态。
➢从被叫MME的SGs口和S1口确认是否有Paging Request。
如果没有发现寻呼消息,或在寻呼超时前,寻呼消息下发小于3次,则进一步检查以下两项⏹检查被叫侧当时是否正在发起数据业务请求(service request)、正在进行TAU或3/4互操作。
目前诺西MSC的并发处理机制不完善,当寻呼与用户主叫业务或TAU并发时,将直接停止寻呼,并给主叫侧播放“用户通话中”的录音通知。
⏹检查eNodeB是否存在S1口闪断告警或RRU偶断连告警,会影响空口寻呼消息的下发。
(2)确认寻呼消息下发的TAC是否正确现象:➢用户所处地点无线环境良好,移动性低,平时CSFB寻呼成功率也较高,但偶尔出现“您拨打暂时无法接通”的情况分析要点:➢核查用户是否处于TAC/LAC边界、3/4G覆盖边缘,以及TAU频次是否过高,如果寻呼下发时用户正重选到新TAC还未发起TAU则网络侧会将寻呼发往旧TAC/LAC。
➢检查用户上一次CSFB通话后是否及时返回4G进行了TAU,如果用户未能返回4G,且在2G侧未及时LAU,则MSC仍然将用户关联在4G网络上,会造成后续寻呼由于核心网不清楚用户已返回2G,还会将寻呼发往4G侧。
➢此类问题可通过CSFB平台的SGs口详单进行确认,筛选SGs口详单上CDR TYPE=1(即SGsAP-PAGING)和CDR TYPE=5(即SGsAP-LOCATION-UPDATE)的详单,并根据详单上寻呼下发的TAC和TAU后的NEW LAI判断寻呼是否下发正确。
其中LAI需先转为16进制,取最后四位就是TAC。
(3)寻呼消息解码失败现象:➢用户所处环境长期寻呼成功率低,主叫侧听到“暂时无法接通”的录音通知➢现场明显弱覆盖RSRP<-115dbm,或SINR<0分析要点:➢从终端底层LOG可看到PDCCH上收到P-RNTI DCI但PDSCH解码失败,主要原因在于终端在空闲态只能根据6个RE来进行信道估计,因此SINR低于-3时,寻呼消息解码高概率失败。
➢通常弱覆盖和低SINR地点均位于室内,测试人员难以直接发现问题地点,可根据路测LOG和经验值判断是否存在室内低SINR隐患。
SINR与RSRP基本是线性相关的,即RSRP 减少1dbm,SINR降低1db,因此,若路测中发现RSRP=100dbm时,SINR<10,或RSRP=-90时,SINR<20,则可推算用户位于室内-110dbm以下的环境时,一定会出现SINR<0的问题➢造成低SINR的主要原因是4G重叠覆盖度高,当4G重叠覆盖度超过5时,SINR将小于5,因此覆盖调整是解决低SINR的根本方法。
目前新开站机械下倾角普遍较小,建议站间距小于500米且地形开阔的地区,站高超过35米的站点总下倾(机械+内置)不小于12度,如遇天线美化罩或下倾已调至最大的情况,需工程改造拆除美化罩、更换大倾角天线支架或下降天线高度。
(4)核心网用户状态变更不及时现象:➢用户处于连接态时,正常情况下CSFB的寻呼消息应以Service Notification信令从专用信道下发,此时终端对于从共用信道下发的Paging不响应。
分析要点:➢检查寻呼消息是否与终端发起数据业务和释放信道同时发生,诺西MME采用并发机制处理用户的连接状态变更请求和寻呼消息,因此导致将Paging信息发给连接态用户的BUG。
➢此类问题可通过增加不活动计时器时长,降低数据业务发起和释放频次进行缓解。
但修改不活动计时器会引起掉线率的恶化。
(5)检查TMSI是否有效现象:➢用户已收到paging消息,其中携带的TMSI与用户一致,但终端不发起Extend ServiceRequest。
➢TMSI失效会导致用户连续多次寻呼失败,直至下一次正常的TAU后恢复正常。
分析要点:➢在2G弱覆盖或干扰的情况下,如果终端在2G进行LAU时发生失败,终端会认为TMSI 已失效,当用户返回4G后进行TAU的TAU Request信令中会携带“TMSI not available ”属性,要求MSC重新分配TMSI。
但由于诺西MSC存在位置更新信令流程粘连的BUG,可能不响应这次联合TAU的TMSI分配请求,导致TAU ACCEPT信令中未包含TMSI值。
而终端因为没有可用TMSI所以不响应寻呼消息。
➢此类问题易出现在2G高干扰地区,在用户前一次CSFB通话回落失败时,终端会自动在2G发起原因为IMSI ATTACH的LAU,但由于高干扰会继续导致LAU失败,从而引发TMSI失效。
(6)ESR发送失败现象:➢用户在4G侧RRC接入失败,导致Extend Service Request消息无法发出分析要点:➢检查eNodeB是否存在硬件故障➢4G侧参数核查,重点检查时隙、子帧、功率类参数设置➢根据网管RRC失败原因的分类统计,确认RRC接入性差的原因1.3第二步:4G释放分析1.3.1分析流程4G释放阶段是从终端上发Extend Service Request开始,到网络下发RR Connection Release结束,主要影响因素在于4G侧eNodeb参数设置和设备故障,但也存在由于4G规范对并发流程考虑不足导致的并发流程冲突问题。
其常规分析流程如下1.3.2各环节分析要点(1)未收到RR Connection Release信令现象:➢终端上发Extend Service Request信令后,在上下文建立阶段、释放请求阶段出现异常,导致终端未能收到RR Connection Release信令,无法进行回落。
问题分析:➢此类问题主要与S1口的eNodeb和MME设备相关,4G网管统计能够提供CSFB上下文建立成功率和CSFB释放准备成功率的指标,正常情况下上述指标均在99.9%左右,如发现有小区该指标低于99%,则需要进行硬件故障和参数核查。
(2)4G并发流程冲突现象:➢终端收到RR Connection Release信令中未携带CSFB频点信息。
问题分析:➢检查终端发出Extend Service Request信令后,是否发生了切换。
由于4G协议中未明确定义切换后MME要将CSFB请求转至新eNodeB,所以导致新小区由于不知道用户要进行CSFB业务,从而在释放信令中不携带CSFB频点。
➢检查终端发出Extend Service Request信令前,是否正在进行TAU。
4G协议并为明确定义TAU与CSFB业务冲突时的处理机制,因此当TAU与CSFB并发时,网络侧下发的TAU 流程的RR Connection Release会被终端认为是CSFB的RR Connection Release。
(3)CSFB开关或频点设置错误现象:➢终端上发Extend Service Request信令后,没有收到RR Connection Release信令。
问题分析:➢检查eNodeB的CSFB开关、网络优先级、频点组序号参数为空或为01.4第三步:2G接入分析1.4.1分析流程相比普通的2G呼叫,CSFB业务流程的差异主要发生在UE从4G侧回落2G过程中的驻留小区选择过程,大部分问题也都发生在这个过程中,一旦选择好合适的2G小区进行接入,后续的过程与普通2G呼叫是一致的。
4G小区占用的合理的情况下,UE回落2G过程中可能存在的问题如以下流程所示:1.4.2各环节分析要点(1)驻留2G小区失败现象:4G的RRC Connection Release消息中包括2G频点组,但UE驻留2G失败返回4G,或者在TD发起呼叫分析要点:➢4G小区配置的2G频点组是否合理,有无缺少应有频点的问题➢2G侧覆盖是否存在问题,如弱覆盖或者下行C/I较差➢2G侧C1参数设置是否合理(2)LAU失败现象:➢占用不合理的小区,如与UE距离远、场强非最好➢成功占用SD发起LAU,但SD掉话未能完成LAU过程➢发起接入请求后SD占用失败,有下行系统消息5、6、5ter,但是没有上行的MR发送➢发起接入请求后,系统没有响应,未能占用SD信道➢鉴权请求不下发,核心网计时器超时后结束LAU过程➢鉴权请求延时很长时间下发,由于SD信道没有开启切换,导致SD掉话分析要点:➢占用的小区的频率是否在RRC Connection Release消息中;更好的小区的频点是否在RRC Connection Release消息中;2G测试在这个位置占用那些小区;场强好的小区下行C/I是否较差导致不被选择➢小区是否存在软硬件故障,KPI指标是否异常;小区是否有上行干扰,其强度足够导致本次接入的C/I无法满足➢核心网是否存在04号告警(3)LUA成功,系统释放SD资源现象:正常情况下,TA与LA不一致时,UE回落2G后会发起位置更新,并在LAU请求中标记CSFB标识,完成位置更新过程后系统不释放SD资源,UE继续进行CSFB呼叫的接续。
➢位置更新完成后系统释放了SD资源导致后续过程无法继续。