VoLTE端到端质量分析SIP-503错误码原因分析研究目录1.SIP-503消息错误码分析背景 (2)2.SIP-503失败原因分类 (2)3.SIP-503流程分析 (4)3.1.无线链路失败导致掉话 (4)3.2.VoLTE走盲重定向导致掉话 (5)3.3.X2切换失败导致的掉话 (5)3.4.Sip信令丢失导致未接通ue-not-available-for-ps-service (6)3.5.2G侧资源异常导致未接通 (8)3.6.基站弱场起呼功能导致 (8)3.7.BSRVCC切换失败 (9)3.8.VoLTE参数配置问题 (10)3.9.VoLTE流程冲突问题(1) (11)3.10.VoLTE流程冲突问题(2) (12)3.11.VoLTE流程冲突问题(3) (13)3.12.VoLTE流程冲突问题(4) (13)3.13.VoLTE流程冲突问题(5) (14)4.SIP-503失败案例总结 (15)4.1.邻区配置问题导致SIP-503失败原因:tx2relocoverall-expiry (15)4.2.干扰问题导致SIP-503失败原因:tx2relocoverall-expiry (16)4.3.传输问题导致SIP-503 S1切换导致VoLTE掉话 (19)4.4.站内切换与modify并发SIP-503导致视频失败 (23)4.5.站内切换并发导致未接通 (24)5.SIP-503失败原因处理流程总结 (26)1.SIP-503消息错误码分析背景2016年中国移动集团开展VoLTE百日会战工作期间,我司在VoLTE质量提升过程中结合炎强平台从TOP小区、DT/CQT遍历拉网测试信令分析中总结经验,旨在帮助各办事处尽快解决信令分析中遇到的问题。
随着VoLTE优化工作的开展,我们发现有些SIP-503错误码与无线测关联较大,如外部邻区、帧头偏移未对齐导致的干扰,传输时延、切换并发等问题都会导致SIP消息报错,而这些SIP消息报错的时间点之前eNB就发起了异常的信令释放。
因此,本文档希望纠正概念中泛指SIP503都是核心网的问题。
2.SIP-503失败原因分类目前,通过甘肃、贵阳两地测试分析结果来看,SIP503错误消息也是各类无线测试中最常见的错误消息,与用户的未接通、掉话等异常行为直接相关。
基于信令平台对可能发生503错误消息的所有场景整理出SIP503消息报错为四大类13种场景,做了统一信令回溯和原因分析,并开展了对应的优化策略和研究,针对每一类问题场景给出了明确的解决方案。
四大类(eNodeB上发UE上下文释放请求、bSRVCC不兼容引发的切换失败、VoLTE参数配置问题、流程冲突承载建立\释放或者修改与切换并发失败)详细情况如下表:3.SIP-503流程分析3.1.无线链路失败导致掉话在呼叫建立阶段,eNodeB上发UEContextReleaseRequest,携带原因值radio-connection-with-ue-lost。
➢处理建议:接续过程中,主叫或被叫UE失步,eNodeB在检测到UE无线链路异常后发起RRC连接和UE上下文释放流程,后续UE重回4G网络发起TAU和QCI5默载建立流程。
需要核查问题小区明细,排查小区覆盖、干扰问题。
➢信令流程说明:在呼叫建立阶段,eNodeB上发UEContextReleaseRequest ,携带原因值radio-connection-with-ue-lost , 表明eNodeB为UE失联,MME指示eNodeB释放了UE上下文,并且通过S11接口把承载失败问题传送给SAEGW, SAEGW通过Gx接口告知PCRF,PCRF通过Rx接口通知SBC,随后SBC通过Gm接口给UE发送了503 SIP错误码,造成呼叫失败。
3.2.VoLTE走盲重定向导致掉话在呼叫建立阶段,eNodeB上发UEContextReleaseRequest,携带原因值interrat-redirection。
➢处理建议:该问题为UE重定向到2/3G引起,发生区域均在我司设备区域,目前我司620版本仍无法区分不同QCI的A2/B2(重定向、eSRVCC只能配置一个),部分区域考虑数据业务驻留比未部署eSRVCC。
预计6月中旬版本升级后可解决此问题。
➢信令流程说明:在呼叫建立阶段,eNodeB上发UEContextReleaseRequest ,携带原因值interrat-redirection, 表明UE重定向到了2/3G,MME指示eNodeB释放了UE上下文,并通过S11接口把承载失败问题传送给SAEGW, SAEGW通过Gx接口告知PCRF,PCRF通过Rx接口通知SBC,随后SBC通过Gm接口给UE发送了503 SIP错误码,造成呼叫失败。
3.3.X2切换失败导致的掉话在呼叫建立阶段,eNodeB上发UEContextReleaseRequest,携带原因值tx2relocoverall-expiry。
➢处理建议:该问题为X2切换过程中,UE由于无线环境较差无法成功接入目标小区,发起重建流程,eNB 侧X2切换计时器超时发起UE上下文释放。
需要无线侧核查切换涉及的源小区和目标小区明细,排查邻区关系配置、邻区切换参数配置、小区覆盖及干扰问题。
➢信令流程说明:在呼叫建立阶段,eNodeB上发UEContextReleaseRequest ,携带原因值tx2relocoverall-expiry, 表明发生了X2切换请求,但是X2切换计时器tx2relocoverall超时,MME指示eNodeB释放了UE上下文,并通过S11接口把承载失败问题传送给SAEGW, SAEGW通过Gx 接口告知PCRF,PCRF通过Rx接口通知SBC,随后SBC通过Gm接口给UE发送了503 SIP错误码,造成呼叫失败。
3.4.Sip信令丢失导致未接通ue-not-available-for-ps-service在VoLTE呼叫建立阶段,存在是Sip信令丢失在SGI/S1AP/UU口导致未接通,具体现象为sip 信令(如invite/183session progress/prack/update/180 ringing/终端未发送invite 200ok 等)连续发送多次之后未收到响应,触发两种现象:1.PCRF通知DRA放弃本次会话,携带的错误码为“INSUFFICIENT BEARER RESOURCES”(不足的承载资源),该类问题多见于183 session progress/180ringing/终端未发送invite 200ok消息丢失;2.SCCAS用“SIP:Status 500 server internal Error”内部错误消息携带的原因为“ NOResponse From Peer”通过SCSCF告知SBC,从而触发PCRF放弃本次会话,导致VoLTE 未接通触发CSFB。
该类问题多见于update/prack等消息。
➢处理建议:该问题多见于无线环境较差,干扰严重,或者传输异常,eNB资源不知导致无法正常的进行正常的VoLTE呼叫,针对该类问题主要通过排查覆盖(可通过开启MR确定是否弱覆盖小区针对VoLTE用户较少的站点可以通过cdl 确定,核查邻区是否缺失,掉线指标是否正常),干扰,传输故障,基站是否拥塞等。
➢信令流程说明:在VoLTE呼叫建立阶段,主叫SBC连续下发四次180 Ringing,未收到被叫响应的invite 200ok,或连续多下发183 session progress触发PCRF通知DRA放弃本次会话,携带的错误码为“INSUFFICIENT BEARER RESOURCES”(不足的承载资源)。
在VoLTE呼叫建立阶段,主叫SBC连续下发UPDATE未收到响应导致scc as定时器超时(一般设置为6s)SCCAS用“SIP:Status 500 server internal Error”内部错误消息携带的原因为“ NO Response From Peer”通过SCSCF告知SBC,从而触发PCRF放弃本次会话,导致VoLTE未接通触发CSFB。
详情如下:3.5.2G侧资源异常导致未接通在 VoLTE呼叫CS域过程中,VoLTE用户资源准备并修改完成的情况下,收到MGCF响应的invite 503携带的原因为“NO Circut/channel avialible”导致未接通。
➢处理建议:该问题为2g侧资源问题导致,需核查2g侧资源情况。
➢信令流程说明:在 VoLTE呼叫CS域过程中,VoLTE用户完成update流程后收到Mgcf的Mgcf响应的invite 503携带的原因为“NO Circut/channel avialible”,释放本次会话。
3.6.基站弱场起呼功能导致在目前核心网不支持bSRVCC,在弱覆的情况下易导致未接通,我司与华为通过在弱覆盖情况下限制qci 1的建立并利用终端和ims cs Retry功能完成弱场起呼。
但是这也触发invite 503。
➢处理建议:建议在核心侧剔除该类问题导致的未接通。
在分析该类s1错误码为“radio resources not avialible”,核查该站点是否开启弱场起呼功能。
➢信令流程说明:SBC收到主叫上发的invite消息后,通知eNB建立无线承载时收到核心eNB响应的ERAB setup respone携带原因为“radio resources not avialible”触发invite 503,终端收到后触发CSFB,从而避免了bSRVCC。
详情如下:3.7.BSRVCC切换失败bSRVCC切换失败,MME下发的切换准备失败消息“Handover Preparation Failure”中,携带原因值:un-specified。
➢处理建议:由于目前IMS版本不支持bSRVCC切换,切换失败后终端触发CSFB流程,按集团要求5月底基站升级版本后,基站侧可识别并规避bSRVCC切换。
➢信令流程说明:振铃以前进行bSRVCC切换,IMS不支持导致MME回复“HandoverPreparationFailure”携带原因值:un-specified。
3.8.VoLTE参数配置问题在e-RAB建立时,eNodeB返回e-RAB建立失败,携带原因值not-supported-QCI-value➢处理建议:VoLTE参数配置问题,需要从信令平台上提取相关小区明细,核查对应eNodeB上VOLTE相关参数配置。
➢信令流程说明:VoLTE呼叫建立时,MME通过下发E_RABSetupRequest消息给eNodeB请求建立QCI=1的e-RAB,eNodeB回复E-RABSetupResponse给MME,携带原因值not-supported-QCI-value,eNodeB VOLTE 业务相关参数配置存在问题。