LTE故障排查及日常问题处理ppt课件.pptx

上传人:牧羊曲112 文档编号:2001745 上传时间:2022-12-30 格式:PPTX 页数:34 大小:3.07MB
返回 下载 相关 举报
LTE故障排查及日常问题处理ppt课件.pptx_第1页
第1页 / 共34页
LTE故障排查及日常问题处理ppt课件.pptx_第2页
第2页 / 共34页
LTE故障排查及日常问题处理ppt课件.pptx_第3页
第3页 / 共34页
LTE故障排查及日常问题处理ppt课件.pptx_第4页
第4页 / 共34页
LTE故障排查及日常问题处理ppt课件.pptx_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《LTE故障排查及日常问题处理ppt课件.pptx》由会员分享,可在线阅读,更多相关《LTE故障排查及日常问题处理ppt课件.pptx(34页珍藏版)》请在三一办公上搜索。

1、LTE故障排查及日常问题处理,目录,LTE故障排查流程和故障处理方法,常用故障分析思路,业务类故障处理,设备类故障处理,故障排查流程,LTE故障排查流程,故障处理方法,LTE故障处理方法,目录,LTE故障排查流程和故障处理方法,常用故障分析思路,业务类故障处理,设备类故障处理,故障分析思路,常用故障分析思路,目录,LTE故障排查流程和故障处理方法,常用故障分析思路,业务类故障处理,设备类故障处理,接入类故障,接入类常见故障处理,现阶段未规模放号,问题主要为单用户类故障,网络KPI中的接入类问题不在这里讨论。由上表可以看到,接入过程涉及几乎LTE所有网元,每个网元都可能出现接入失败的问题。因此,

2、快速掌握该阶段的问题定位能力,尽快进入网络运维阶段,是本次接入类问题交流的重点:首先掌握LTE接入的基本流程。掌握快速找到问题的方法。,接入类故障,接入流程总体介绍-Attach流程,终端开机后,首先选择合适小区驻留,然后发起Attach流程。RRC建立原因值为:Mo-SignalingAttach流程可以分为四个步骤:随机接入RRC连接建立鉴权等NAS过程E-RAB建立 在Attach时数据卡终端通常只建立一个默认承载,支持VOIP的LG终端以及有些智能终端如HTC往往同时还建立专有承载。,接入类故障,接入流程总体介绍-Service Request流程,RRC建立原因值分为:Mo-data

3、:上行有数据需要发送Mt-Access:响应寻呼Service Request流程可以分为三个步骤:随机接入RRC连接建立E-RAB建立,因为核心网侧已有终端的注册信息和能力信息,Service Request流程通常不需要进行鉴权和UE能力查询。,用户Attach之后,如果UE回到Idle模式,再发起业务时使用Service Request流程。,接入类故障,信令跟踪快速找出接入失败原因,1.善于利用释放消息中的Cause找原因,2.信令对比快速查找异常点,互操作类故障,CL互操作常见故障,4G信令,4G业务,3G信令,3G业务,优化切换新增,eAN无会话时需进行鉴权(可选),切换时延,终端

4、需要支持CL双模能力,即支持LTE业务和eHRPD业务。单卡单号双IMSI,需要在3G和4G同时开户。终端优选LTE网络驻留,移动过程中,根据网络信号情况选择覆盖更好的网络。eHRPD接入时,基于PDN连接采集计费信息。 HSGW生成基于PDN级的时长和流量信息的HSGW-CDR;PGW基于PDN连接生成离线计费PGW-CDR,或与OCS进行在线计费。实现eHRPD和LTE网络之间的切换,关键技术在于切换前后P-GW保持不变:eHRPD接入,P-GW支持与3GPP AAA/HSS之间的S6b接口,将用户当前PDN连接的P-GW ID (P-GW IP或者PGW FQDN)和APN等信息更新到3

5、GPP AAA /HSS,用于切换到LTE网络后,MME从HSS得到源PGW ID,向源PGW发起会话建立。LTE接入,MME支持与HSS之间的S6a接口,将用户当前PDN连接的P-GW ID (P-GW IP或者PGW FQDN)和APN等信息更新到HSS,用于切换到eHRPD网络后,HSGW从3GPP AAA /HSS得到源PGW ID,向源PGW发起会话建立。,互操作类故障,CL互操作时延问题处理要点,互操作类故障,CL互操作关键短板,CL双模用户从3G区域回到3G/4G共覆盖区域,如果用户一直处于激活态,将无法回到4G享受高速业务服务。,用户网络行为,当前状态,PS业务LTE与CDMA

6、状态迁移,暂不支持,LTE-HPRD(激活态):LTE-HPRD(空闲态):eHRPD-LTE(空闲态):eHRPD-LTE(激活态):X目前无配套终端。,短板:3G激活态难以回到4G,阶段一【由3G网络主动发起快速重选】1、基于eHRPD与LTE同站址建设,以eHRPD估算LTE信号强度。2、eHRPD配置LTE同层邻区。3、迟滞切换机制,避免频繁切换。4、CBSS10.0版本提供,2014年3月。,华为方案,阶段二【由终端主动发起快速重定向】1、终端在激活态主动测量LTE信号强度,主动进行切换。2、eHRPD配置LTE同层邻区。3、暂无配套的终端,暂不考虑。,流量类故障,LTE吞吐量计算,

7、LTE物理层速率(bits) = 每个传输控制块大小(bits) x 传输控制块的个数/ 每子帧x 1000 子帧数/ 每秒 1000000= ? Mbps,每TTI中TB个数与码字个数相同,LTE规定最大2个码字,参考TS36.213 Table 7.1.7.1-1,【下行理论吞吐量】,Max Throughput= (75376*10)*2*100/1000000=150.752Mbps,Max Throughput= 75376*10*100/1000000=75.376Mbps,【上行理论吞吐量】,36.306协议:下行UE能力对应的物理参数,36.306协议:上行UE能力对应的物理参

8、数,流量类故障,LTE吞吐量故障处理,下行流量问题排查,上行流量问题排查,Iperf进行UDP灌包,Iperf反向灌包,空口排查,返回日志分析,空口排查,1、检查Server出口量是否足够。2、检查eNodeB入口流量是否足够3、UDP环回,eNodeB进行灌包4、服务器/PC性能不足,来水不足,1、BLER目标10%,峰值速率时为0。2、RSRP/SINR/CQI排查3、AMBR是否限速4、在线用户数/License5、同频干扰/UE天线不平衡6、其他算法。快速ANR/频选调度/PDCCH符号数/ICIC,空口排查,通过TCP手段排查,1、RTT排查2、发送窗口/接收窗口,TCP排查,TCP

9、排查,从PC向服务器反向灌包,同时关注反向RSSI,流量类故障,案例1:接收窗口未优化导致TCP速率低,流量类故障,案例2:丢包导致TCP流量掉坑,某局点E398下行TCP速率掉坑:,1、服务器侧:tcp.analysis.retransmission过滤:,2、使用tcp.seq = xxxx作过滤条件,进行多点抓包文件过滤,找出错误发生位置。,3、空口丢包(A.PDCP丢包定时器时长,RLC模式;B. UE PC), S1AP_INITIAL_CONTEXT_SETUP_REQ,4、LST STANDQCI查询QCI对应的RLC PDCP 参数组ID,LST RLCPDCPPARAGROU

10、P:,在大流量情况下,丢包定时器设置过短,加上非确认UM模式,导致空口丢包。 将PDCP丢包定时器设置为1500ms, AM模式,速率“掉坑”现象不再出现。,切换类故障,切换原理概述与常见故障,切换类故障,切换失败故障处理,邻区漏配切换失败故障,信号陡降切换失败故障,弱覆盖切换失败故障,UE侧表现,基站侧表现,解决方法,邻区漏配【表现】随着UE移动服务小区RSRP越来越差,SINR越来越差,而邻区RSRP越来越好。【解决方案】手工添加邻区配置打开ANR算法开关,弱覆盖【表现】当邻区无线质量满足切换门限时,服务小区和邻区的RSRP都十分弱。【解决方案】调整功率配比调整天线倾角增加基站、载频,如果

11、从“邻区质量满足切换门限”到“服务小区质量陡降”之间的时间间隔太短(如小于1秒),可通过修改服务小区与邻区的偏置CellIndividualOffset(为大于0的值)来提前切换如果从“邻区比服务小区质量好”到“服务小区质量陡降”的时间间隔比较短(如小于0.5秒),则可通过修改服务小区的延迟触发时间IntraFreqHoA3TimeToTrig来提前切换,eNodeB侧:收到测量报告,但不发起切换(X2口没有切换请求,空口没有下发切换命令),当邻区无线质量满足切换门限时,服务小区的RSRP突然陡降,eNodeB侧表现为下发切换命令后收不到切换完成消息,或者连测量报告也收不到,eNodeB侧表现

12、为下发切换命令后收不到切换完成消息,或者连测量报告也收不到,目录,LTE故障排查流程和故障处理方法,常用故障分析思路,业务类故障处理,设备类故障处理,传输类故障,传输类故障处理,传输类故障,传输故障处理思路,总体思路:分层/逐段排查定位分层法:根据协议层,逐层定位,定位出实际故障点;逐段法:完成故障隔离,对数据流进行分段,逐段环回,逐段定位;具体排查项:物理层故障排查ARP/IP层故障排查IPPATH异常处理SCTP异常处理,传输类故障,传输故障逐层排查方法简介,抓包,传输类故障,传输问题案例,问题现象:一线测试时发现终端入网20s后自动发起释放,无法进行上网业务。问题处理步骤:,从信令上分析

13、,UE的Attach流程已经完成,过了20秒之后eNodeB在S1口上发送上下文释放消息,原因值是User Inactivity ,由于释放原因是User Inactivity,并且释放时间固定为20s,查看基站脚本信息,发现UE不活动定时器配置为20s,因此确定是由于UE不活动定时器超时导致释放。2. 终端与服务器之间进行ping操作,发现终端无法Ping通服务器,确定用户面链路不通,导致UE不活动定时器超时,UE释放空口链接。3. 当前站点已经开启了GTPU静态检测和IPPATH的Ping检测,可以确定eNodeB与UGW之间的IPPATH链路不存在异常,需要进行端到端的问题定界。4. 基

14、站侧通过IP跟踪确定Ping报文的收发情况,通过下图可以看到终端发起的Ping报文基站已经发送给UGW,但是没有收到UGW返回Ping 响应报文。,5. 经过核心网定位发现报文已经从UGW发送出去但是一直没有收到响应,通过排查发现核心网下一级的LAN Switch发现是由于没有配置回程路由导致所有下行报文都无法返回。,1,信令面正常,eNBMME OK,2,用户面异常,IP层手段PING检测,中射频类故障,中射频类故障处理,1,2,3,RSSI,外部干扰,互调,驻波,CPRI接口,中射频类故障,RSSI故障处理,RSSI过低,RSSI不平衡,RSSI过高,RSSI,RSSI理论值,1,2,方法

15、1,方法2,1、记录空载时的RSSI值;2、通过ADD CELLSIMULOAD加载模拟负载;3、在M2000跟踪RSSI差值是否大于4dB。,1、通过STR RFTEST进行反向通道干扰检测;,中射频类故障,驻波故障处理,中射频类故障,CPRI接口故障处理,中射频类故障,中射频故障处理案例,维护通道类故障,维护通道类故障处理,DHCP,站点,2、自动发现,M2000,S/W,CME,中心机房,Support网站,1.1、提取版本包,1.2、组织配置数据,1.4、打开开站工具、上传数据、启动开站,上报ESN,4、调测License下发,1、安装上电,3、自动配置,Config,S/W,限制和约

16、束:在开站之前,必须:硬件安装完毕,M2000调测完毕,eNodeB与M2000之间的传输正常;eNodeB的软件版本必须从Support网站上取得,并且已经上传到M2000 Server。,1.3、导出开站列表,1.VLAN自学习失败2.DHCP自发现失败,典型故障,维护通道类故障,VLAN自学习失败故障处理,【eNodeB】上电主动发起DHCP,无VLAN,网关上设置VLAN,报文被网关丢弃。,【eNodeB】上电主动发起DHCP,无VLAN,被网关丢弃。,ARP广播,ARP广播,eNodeB被动学习VLAN,学到VLAN,VLAN学习原理,VLAN自学习失败案例,【问题现象】从Switc

17、h(A设备)侧检测不到基站和ATN间交互的数据流量;【问题原因】A设备端口设置为1000M/FULL,与eNodeB协商失败,ARP无法广播,如果网络中存在ARP表项,而eNodeB未学习到VLAN,则需要网络老化APR后,再次广播ARP,否则eNodeB无法自启动,维护通道类故障,DHCP自发现失败故障处理,【实现原理】1、为了避免DHCP广播包冲击M2000,引入路由器进行DHCP Relay,转化为单播报文。2、DHCP过程目的是实现eNodeB的OMCH的建立。即获取IP、路由等。2、eNodeB上电后,4步完成DHCP过程。常见问题需分析具体消息中的取值DHCP DISCOVERDHCP OFFERDHCP REQUESTDHCP ACK,【相关案例】某局点,在站点安装完成并加电后,使用M2000进行自开站,发现某站点在发送OFFER报文后,在DHCP配置管理中一直未出现上报的REQUEST报文。【问题原因】在M2000抓包看,已收到eNodeB上报REQUEST报文,但在上报的REQUEST中未携带OPTION54字段,因此导致该站的REQUEST报文被M2000抛弃。同时,在基站侧镜像抓包后证明基站发送的REQUEST报文已携带OPTION54字段。【结论】IPRAN修改了DHCP报文,丢弃了OPTION54字段。,协作共赢,电信华为,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号