LTE吞吐率排障指导书1.吞吐率问题表现吞吐率异常是指用户的应用层或MAC层吞吐率偏低或存在较大波动,吞吐率波动可以从DU Meter等工具的吞吐率统计上直观的看出:吞吐率偏低峰值吞吐率外场测试相对基线值偏低超过5%,实验室测试达不到基线值;定点吞吐率,相同路损的平均吞吐率相对基线值偏低10%以上或者和友商对比,相同路损的点偏低超过5%吞吐率波动终端静止,RSRP波动超过6db,或者吞吐率出现超过30%的波动。
吞吐率掉坑吞吐率裂缝2.相关LOG的获取可以通过UE测收集测试LOG和后台收取UE capp trace,对问题进行定位分析。
3.流量问题定位指导3.1吞吐量问题定位流程实际环境中传输侧(从Server到eNodeB)的组网架构庞大复杂,千差万别。
为方便描述下行定位流程,下图仅给出一简单的组网示意图,以说明数据流向。
图4下行数据流向图流量定位的大体思路为:首先,判断该数传业务是UDP的还是TCP的,如果当前是TCP 流量不足,则先用 UDP单线程上下行灌包“探路”,看UDP上下行流量能否达到峰值,此举是为了扫清道路上的“小石头”,比如网卡限速、空口参数配置错误等等。
一般来说UDP 流量无法达到峰值,TCP流量也很难上到峰值。
UDP流量问题定位,本指导书采用的是“追根溯源”法,即从服务器到。
5端到端排查,看“水”流到哪里“节流” 了。
其次,如果UDP流量能够达到峰值而TCP不行,则将问题原因锁定在TCP本身传输机制上,关于TCP 本身问题的具体排查方法见3.3。
流量问题定位的思路如下:3.1.1 基本参数及告警排查在Uu口跟踪消息”RRC_UE_CAP_INFO”里查找。
对于上行来说,CAT 5 UE 最高能达到28阶,CAT 3和CAT 4 UE只能达到24阶。
2)基站告警排查基站本身设备、传输、射频、干扰等告警都会对吞吐率有影响,在碰到吞吐率问题时,先尝试恢复基站告警,如果告警没有条件恢复则逐个分析是否会影响吞吐率,或者更换好的基站进行测试。
3)小区是否多用户如果本小区存在其他用户在做业务,测试UE的RB将会减小,因此在测试之前应该先检查小区内是否存在其他用户,测试过程中也应该注意是否有其他用户接入。
用户数监控方法如下图:待补充4)License是否限速查看License是否过期;查看License支持的吞吐率能力是否受限;查看License是否支持Cat3、4能力的UE。
5)上行闭环功控是否生效(针对上行问题)问题现象:闭环功控不生效时中远点速率较低,RB个数较少,但是近点能达到峰值。
具体来说,在RSRP=-100dBm的时候,如果是闭环功控,20M带宽小区用户RB数可以到90个,10M带宽小区可以到40个RB;如果是开环功控,最多只有10个左右。
检查方法:待补充6)基站参数核查基站内部很多参数都会对吞吐率有影响,可以把问题站点的参数和基线版本以及其它正常站点进行核查,找出配置不一致的参数,然后逐个进行分析,或者修改参数后重新进行测试。
基站参数检查的具体操作请参考系统参数说明。
3.2区分是否是TCP问题3.2.1 最简单的方法-UDP灌包1. 操作方法采用Iperf,将该软件分别放置在服务器和UE PC的C盘目录下,然后打开DOS窗口,输入cd c:\,将当前路径调整到Iperf所在的C盘下;在接收方侧(上行为服务器,下行为UE PC)输入iperf -s -u -i 1,然后回车,表示建立起接收服务;在发送方(上行为UE PC,下行为服务器)输入iperf -c xx.xx.xx.xx -u -i 1 -b 100m -t 999 其中xx.xx.xx.xx为接收方IP,-u表示用UDP,-i 1表示每秒显示一次,-b表示灌包的流量,-b 100m 表示每秒灌100Mbit的包,即灌包速率为100Mbps,-t表示持续时间,-t 999表示持续999秒注意:发送方的灌包速率和持续时间可以根据需要进行调整;2.判断方法若吞吐率明显大于TCP业务吞吐率(如大于10%),则判断为TCP问题,进入TCP类问题定位;若吞吐率与TCP业务基本持平,或者比TCP还低,则进入非TCP类问题定位;3.2.2 不能做UDP灌包,则尝试多线程传输或同时传输多个文件1. 操作方法通过多个DOS窗口传输或者用多线程软件传输,如Flashget或Filezilla等,推荐使用Filezilla;2.判断方法若吞吐率明显要大于单线程TCP吞吐率,则判断为TCP问题,进入TCP类问题定位;若吞吐率与单线程基本持平或还低,则进入非TCP类问题定位;如以上两种方法都不能用,则按TCP类问题定位。
3.3TCP问题定位3.3.1 TCP参数检查1、操作系统:如果是Windows XP则继续,如果是Vista、Win7或其它操作系统,则跳过本步骤(Vista、Win7等操作系统可以自优化TCP参数,无需手工设置);2、查看/设置TCP参数a. 在发送方和接收方都通过DrTCP工具,在Adapter Settings中找到对应网卡,按如下设置:b. 在发送方再利用工具TCP parameter setting.reg进行修改,双击导入;以上两步操作完后再统一正常重启电脑,这样配置才能生效。
如果服务器侧无法修改,则只修改UE PC。
3、如果修改了TCP参数后吞吐率问题依旧,则继续下一步的判断3.4非TCP类问题定位经过基本参数及告警排查,且排除TCP类问题时,可以根据问题具体现象做进一步定位,吞吐率问题可以概括为如下四个现象:调度次数不足、调度RB数不足、MCS阶数偏低及IBLER 不收敛,对于下行还可能是下行MIMO模式错误,不能使用双码字。
先确定问题现象后,然后根据不同的问题现象采取不同的步骤进行定位,在以下定位步骤未能解决问题后,提交AR报总部定位。
3.4.1如何判断调度次数不足对于下行,2:2配置下DL Grant次数需要接近600次。
对于上行,2:2配置下在峰值区域,UL Grant次数需要接近400次;在非峰值区域,因为上行HARQ重传时,调度器不需要下发UL Grant,而IBLER一般收敛到10%,所以UL Grant在350左右或以上都是正常的。
调度次数在CDS中观察方法如下:影响因数1:发端设备性能受限如果使用UDP灌包仍存在调度次数或RB数不足,很可能是发端设备如服务器或便携性能受限,或者发端设备和灌包工具配合存在问题,可以做如下尝试:使用多线程或者更换性能更好的服务器/便携;为防止服务器/便携和灌包工具的兼容性问题,可以更换IPERF、GPERF等工具,且关掉后台程序;上行灌包时,便携需要接电源,防止电力不足灌包速率不够;上行灌包时,将包长设置为1000吞吐率异常调度次数不足调度RB不足MCS阶数偏低iBler收敛异常发端侧性能受限检查干扰UE主分集不平衡检查干扰下行相关性检查传输受限对于下行可以通过命令来查看从S1口过来的入口数据是否足够,如下图所示:待补充3.4.2如何判断误码率过高在峰值区域,误码率需要为0或很小;在非峰值区域,误码率10%为正常水平,如果误码率持续高于15%以上为异常情况。
如果在极远点,MCS阶数为0的时候,误码率较高也可以认为是正常现象。
3.4.3如何判断MCS阶数过低MCS阶数是否合理在拉距的条件下较难判断。
在路损超过120dB~125dB缩RB的时候一般维持3~5阶数,但是缩着RB不能再缩小,其MCS阶数也会降低。
比较方便的方法是排除法:在UE以满功率(23dBm)发送的条件下,如果调度次数和RB个数都比较正常但总吞吐率偏低,那么可以认为问题出在MCS阶数上。
上行MCS结束过低:上行干扰排查UE未接入情况下(所有UE关机,小区里没有业务),打开NPO的“小区性能检测”,选择“干扰检测”,拖取干扰指标查看是否存在上行干扰。
如果干扰短期内无法解决,可以根据干扰抬升的底噪dB数,叠加到路损上,再和该折算后路损的上行吞吐率基线进行对比。
当外场定点RSRP有超过6dB的波动:一般都是由于无线环境比较恶劣引起,建议选取另外的测试区域或者调整UE的位置或者天线。
下行MCS阶数过低:邻区干扰大观察:(1)在UE_NCell Info中看是否有多个小区,且超过1个小区的RSRP和本小区的RSRP差在3dB之内。
如果是,则表明存在较强的邻区干扰。
(2)在检测到的邻区当中,不能出现和本小区PCI模三相同的邻区及PCI相同的邻区。
(3)查看下行各子带CQI是否有某一段CQI的值特别低的,如果存在,说明存在较严重的窄带干扰。
解决方法:(1)较强的邻区干扰只有通过调整天线方向角等来解决。
(2)严重的窄带干扰通过扫频,找出干扰源,进行排除。
干扰排查和恢复更详细的指导可以参见扫频指导书。
下行MCS阶数过低:RRU相关信号处理出现异常(1)RRU的通道不平衡会导致终端的解调能力下降,导致MCS偏低,可以通过下面的方法来观察。
观察两天线接收的RSRP差,当两根天线差值持续在5dB以上时,认为通道不平衡,需要通过调整终端天线来解决。
(2)终端入口功率一般在-50dBm~-90dBm,如果入口功率超过-50dBm容易导致削波,使得下行SNR偏低;如果入口功率低于-90dBm,也会使得下行SNR偏低,影响下行性能。
3.4.4下行MIMO模式异常初始接入按tm2模式配置,当信道质量变好时,会重配置成tm3模式,当出现终端失步,切换,重建时,会重新配置为tm2模式,再自适应到tm3模式。
MIMO模式从空口消息进行观察,如右上图:下行MIMO模式异常,一方面检查eNodeB是否及时配置MIMO模式为TM3,如果保持在tm2,则下行只能使用单码字,如果没有重配到TM3,重点检查MIMO相关参数,是否和基线值保持一致;下行MIMO模式异常,另一方面检查UE上报的Rank是否合理。
正常情况下,在两天线RSRP相差不大于3dB;收发相关性小于0.5;AvgSNR大于15dB时,系统可以使用双码字。
如果没有使用,需要查看UE上报的Rank及eNB收到的Rank,并采集相关数据反馈总部分析。