外场业务类问题快速定位手册.doc

上传人:文库蛋蛋多 文档编号:2805875 上传时间:2023-02-25 格式:DOC 页数:23 大小:1.52MB
返回 下载 相关 举报
外场业务类问题快速定位手册.doc_第1页
第1页 / 共23页
外场业务类问题快速定位手册.doc_第2页
第2页 / 共23页
外场业务类问题快速定位手册.doc_第3页
第3页 / 共23页
外场业务类问题快速定位手册.doc_第4页
第4页 / 共23页
外场业务类问题快速定位手册.doc_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《外场业务类问题快速定位手册.doc》由会员分享,可在线阅读,更多相关《外场业务类问题快速定位手册.doc(23页珍藏版)》请在三一办公上搜索。

1、 外场业务类问题快速定位手册 项目名称外场业务类问题快速定位手册文档编号版 本 号V1.00作 者刘俊伟版权所有大唐移动通信设备有限公司本资料及其包含的所有内容为大唐移动通信设备有限公司(大唐移动)所有,受中国法律及适用之国际公约中有关著作权法律的保护。未经大唐移动书面授权,任何人不得以任何形式复制、传播、散布、改动或以其它方式使用本资料的部分或全部内容,违者将被依法追究责任。版本:V 1.00 文档更新记录日期更新人版本备注2013-02-01刘俊伟V 1.00文档创建目 录1编写目的42预期读者和阅读建议43文档约定44参考资料45缩写术语46外场问题定位46.1接入失败46.1.1首板斧

2、:46.1.2二板斧:46.1.3三板斧:56.2业务速率低66.2.1首板斧:66.2.2二板斧:66.2.3三板斧:76.3切换失败86.3.1首板斧:86.3.2二板斧:86.3.3三板斧:96.4切换业务中断:96.4.1首板斧:96.4.2二板斧:106.4.3三板斧:107对应图:11附件:L2远程日志228实现遗留问题231 编写目的外场开站阶段业务会出现各种各样的问题,一般问题可能由参数设置的不合理导致或开站初期网络没有优化导致空口信噪比恶劣。为了达到快速分析解决问题的目的,特别将分析解决问题过程分为3个步骤。对于不能快速解决的问题就提取L2远程日志、告警日志、信令CDL、业务

3、类CDL、ATPLog等回传给研发定位。2 预期读者和阅读建议外场测试人员3 文档约定文档描述中涉及的终端除了特殊说明为NBT外,一般指定为商用终端。附件增加L2远程日志的提取方法及日志类型说明。文档附件携带了L2远程日志类型、提取等相关内容供参考。4 参考资料ENB L2调试手册5 缩写术语6 外场问题定位外场遇到的问题可以分为随机接入失败问题、业务速率低问题、切换失败问题、业务中断问题。在遇到这些问题可以分别采取下面的步骤进行分析、排查到达快速解决和响应的目的,提升客户满意度。在遇到问题时我们分为3个步骤进行分析,借用古人的“3板斧”来比喻我们解决一些简单问题,所谓的“首板斧”是指通过基站

4、与终端对业务类问题进行比较详尽的描述分析,通过一些合理的建议解决一些简单问题;“二板斧”是通过最简单的核查参数设置来排除一些认为的误操作导致的问题;“三板斧”是通过提取基站L2子系统的一些定位信息来进行分析解决问题。这几个步骤不是独立的,需要综合起来对问题进行分析。下面分了几种类型的问题进行说明。6.1 接入失败6.1.1 首板斧:查看小区及相关设备状态a. 查看对应小区的状态是否为未激活状态开站初期经常出现错误,导致终端无法搜索到小区。b. 查看小区对应RRU的通道状态是否为通道故障状态通道如果出现故障,则没有下行信号,无法搜索到小区。c. 查看小区的参考信号功率影响终端接收下行SIB,终端

5、无法接收SIB时重点关注参考图16.1.2 二板斧:查看接入相关参数配置a. 查看小区的广播传输MCS等级影响SIB、MSG2的接收,无法读取SIB时需要查看;特别的,当终端为NBT时,由于NBT限制广播的PRB不能超过8个PRB,如果MCS配置的过低就会导致分配的PRB变多,有可能超过8个PRB,这样NBT就无法读取广播消息。 参考图2b. 查看小区加载开关及带真实用户的模拟加载开关如果小区加载开关打开而带真实用户的加载开关关闭,就会影响下行信号,此时终端无法读取SIB及其他下行信令消息,需要确认小区加载开关是否打开,参考图3 确认带真实用户的模拟加载开关是否打开,参考图4c. 查看安全开关

6、、加密算法、完保算法询问终端是否支持对应鉴权及加密算法,特别对于祖冲之算法是否支持,另外在开启安全加密算法时需要打开HL的安全开关,参加图;另外,EEA1:SNOW 3G算法;EEA2:AES算法;EEA3:祖冲之算法;需要特别指出完整性保护算法、加密算法优先级数值越大说明优先级越高。查看完整性保护是否配置成eia3(祖冲之算法),并询问终端是否支持,参考图5查看加密算法是否配置为eea3,并询问终端是否支持,参考图6d. 查看PRB限制情况可能只有MIB消息,上下行PRB的限制导致上下信令无法调度,接入必然失败;查看PRB限制开关是否打开,参考图7;再查看上下行PRB是否设置的比较少,参考图

7、8e. 查看随机接入参数影响基站初始接入,初始接收目标功率影响MSG1的检测、前导码最大传输次数影响终端MSG1发送的次数、功率爬坡步长影响终端MSG1多次发送时的功率调整步长、响应接收窗口大小影响MSG2发送及终端接收、MSG3最大传输次数影响MSG3的发送,参考图9f. 查看UE定时器和常数接入过程失败时,LMT上有定时器超时告警,查看高层接入定时器设置,参考图106.1.3 三板斧:基站工具查看接入失败过程、终端配合分析接入过程并提取L2相关Log及日志a. 提取对应小区的CDL,查看UU口消息或RRC层与其他层的信令消息,判断接入失败在哪一层b. 提取L2随机接入异常日志,即板卡DSP

8、核4、核5的66号日志,记录了AS层随机接入过程中L2记录到的异常情况,后续的版本会将该异常信息记录到CDL中,便于分析发现曾经发生的接入失败问题。c. 提取L2随机接入日志;即板卡DSP核4、核5的67号日志,但需要在MAC测试开关中设置日志类型为随机接入日志。该日志记录AS层的接入过程,及NAS层信令调度、资源分配及反馈信息。该日志内存有限会出现循环覆盖的情况,仅限于现场抓取接入问题进行分析。日志的抓取参考附件文档。d. 提取ATP的log;ATP比较适于查看RRC层及NAS层信令流程,在登录板卡时如果是查看随机接入相关只需要登陆SCT板卡即可,如果分析业务类问题需要登录对应小区的BCP板

9、卡,才能看到消息。e. 查看终端的接入流程:在终端侧可以通过对应的接入流程查看接入是卡在哪个步骤,最好配合机房人员共同分析。6.2 业务速率低6.2.1 首板斧:通过打BO、查看PDCP速率、上下行业务状态进行分析a. 遇到速率低问题时,停止原来业务,通过打上下行BO或下行PDCP发包来分析空口速率是否可以达到峰速,如果可以到达峰速,说明非L2层问题,需要排查其他网元及其配置(S1链路过来的数据速率及核心网业务服务器发包的状态);如果不能到达很好的速率,需要就需要分析业务的状态。b. 查看业务类型确认业务采用FTP下载还是UDP灌包c. 查看做业务的方式如果是FTP下载,需要确认采用什么软件进

10、行业务,链接多少线程,线程过少或配置缓冲区较小会导致TCP数据量不足;d. 如果是FTP下载或TCP相关业务,需要确认传输带宽,传输最大带宽应至少为空口峰值速率的23倍,否则易出现传输丢包,应用层数据不足或不稳;e. 时延在TCP协议中有重大意义。因为TCP数据包需要反馈,时延越长,线程的发包量增长速度越慢。通常来说缩短时延能提升单线程速率。基站一些参数配置会影响时延,可以先为下行FTP用户打上行BO,此时的上行时延为最小值。 f. 如果终端上报的CQI比较低,需要查询终端侧的RSRP、SNR,如果这些值比较低说明此时终端位于远点或差点;如果终端RSRP、SNR都是比较好的值,说明处于好点或极

11、好点,如果CQI仍然比较低,就需要核对参数是否配置错误。g. 如果终端检测或上报的Rank大多为1,则无法切换到双流,此时可能是终端所在位置空间相关性较高,无法支持双流,建议调整位置;h. 终端笔记本性能对FTP速率也有较大影响,曾多次出现UDP灌包能到峰速但FTP到不了的情况,然后什么都不变更换终端笔记本后FTP速率提升20M的情况。请尽量使用性能好的笔记本i. 服务器首先需确认服务器是千M网卡。其次需确认当前服务器是否有很多用户同时下载,服务器负荷较重可能影响速率,如果条件允许建议尝试使用空闲服务器进行测试,或同时使用两个FTP软件从两个服务器同时下载。如果服务器长时间未重启,建议重启服务

12、器(之前出过重启服务器后ping时延缩短10ms的情况)。6.2.2 二板斧:查看小区相关业务参数a. 查看MAC测试开关中的AMC、MCS、CQI修正、HARQ对上下行业务非常有影响的参数,参考图11;如果关闭AMC并固定了MCS就可能会导致速率降低;如果关闭了HARQ,当有BLER时会影响影响业务速率;如果关闭CQI修正,但终端上报CQI比较低时,就会导致业务速率低。b. 查看MIMO方式固定MIMO方式一定要与传输模式一致否则导致业务不通或高BLER,不同的MIMO方式会影响UE的峰值速率,参考图12c. 查看CFI的配置多用户情况下CFI的配置较小就会影响UE的调度,影响其速率,但在单

13、用户追求速率时,可以设置为1,有助于提升速率,参考图13、14d. 查看CQI与ACK同时传输指示如果设置为不支持,则会影响CQI上报,影响AMC的效果,一般设置为支持,参考图15e. 查看BSR上报周期对于下行FTP/TCP业务,较小的周期(5ms),有助于缩短RTT,提升速率,但注意,若已经打了上行BO,这就不起作用了,参考图16f. 查看TA定时器及MAC测试开关中的TA配置影响上行数据业务,过长的TA周期会导致终端上行数据出窗,引起上行误码,进而影响到上行业务速率,对于下行FTP/TCP业务,也有可能有影响,参考图18、19g. 查看DRX配置有效指示开启DRX会导致终端峰值速率下降,

14、查看对应的业务RB的DRX是否开启,参考图20h. 查看GAP配置如果有异频邻小区存在,配置GAP时会影响终端的上下调度,从而影响峰值速率,高层切换时或A2上报时才配置终端测量gap,需要查看是否配置了异频邻区,参考图21i. 查看ICIC算法开关开启ICIC算法,当UE处在小区边缘,也会影响UE的速率,参考图22j. 查看上下行目标BLERBLER的高低对终端速率影响比较大,参考图23k. 查看上行PRB底噪情况LMT上可以查询到上行PRB级的底噪,便于查看干扰的情况。l. 查看流控开关打开了流控开关会按照RRC配置限制UE的总速率,参考图24m. 查看PRB及MCS限制查看LMT上的PRB

15、及MCS设置,限制两个参数就会影响UE的速率,参考图25、26n. 查看PDCP丢弃定时器有效指示当空口质量不好或数据量过大时配置了对应的丢弃定时器会导致数据在PDCP层面丢弃,不合理的配丢弃置会导致数据被错误,目前推荐配置1500ms,参考图27o. 查看RLC发送端、接收端ARQ最大重传次数、探询重传定时器、重排定时器、当空口质量不好时配置定时器不合理会导致数据在RLC层面产生拥塞,参考图28p. 查看PDCP头压缩指示目前大部分终端不支持,不建议打开,参考图296.2.3 三板斧:从终端侧进行配合分析并提取L2的日志及Loga. 对于FTP业务异常,也可以通过发起上下行UDP业务(上下行

16、BO或下行PDCP发包),查看上下行空口通道状态上下行单方向的上UDP业务可以分析出速率低的原因是上行链路还是下行链路异常导致的,并详细确认空口业务状态。b. 对于现场的突发的问题可以提取Ping日志L2的Ping日志分为Ping过程日志及Ping数据包日志,需要分别设置L2的远程日志类型为Ping过程日志及PDCP数据内容日志(基于1227版本)3.20.00.22.02。c. 对于曾经发生过的问题可以提取对应时间点的业务CDL。d. TCP业务分析日志,对于FTP业务来说当怀疑底层数据包处理有异常时可以通过配置CDL中的TCP业务分析日志,查看对应UE的Teid来查找对应的数据包,分析是否

17、存在丢包的可能e. 提取ATP的BCP板卡日志即 *.logt文件回传观察业务状态。f. Wirshark 抓包分析丢包,可以分别安装在服务器侧及终端侧用来查看是否存在有丢包的现象6.3 切换失败6.3.1 首板斧:从基站及终端侧查看切换失败过程a. 查看切换类型是S1、X2还是站内切换,确认切换过程是否带业务,确认切换是同频切换还是异频切换。b. 查看切换失败在源小区还是目标小区查看源小区的MR是否收到,重配置消息终端是否收到,目标小区是否检测到重配置完成消息;如果切换失败在源小区,需要重点查看切换参数及下行空口信道状况;如果失败在目标小区,需要重点查看接入参数及上行空口信道状况。c. 从终

18、端侧查看切换停留在哪个步骤终端是否发送了MR、终端是否收到了重配置消息、终端随机接入过程是否完成、终端是否上报了重配置完成消息。6.3.2 二板斧:查看源、目标小区相关参数a. 查看X2、S1链路状态是否正常区分切换类型并确认X2、S1链路的状态;在切换前务必保证X2、S1链路状态正常,特别是X2状态,S1链路异常小区触发退服,X2链路状态异常,只有事件类告警,因此发起X2切换前要查看链路状态b. 查看源小区协议定时器S1、X2切换相关定时器,如果发现S1、X2切换时出现定时器告警,需要查看是否定时器设置过短,参考图30c. 查看源小区eNB内部定时器RRCRRM定时器,过短的定时器会导致切换

19、失败,参考图31d. 查看源小区异频载波信息查看异频邻小区的参数,会导致终端在源小区无法发送测量报告或即使上报了测量报告也会被RRC拒绝而不发送重配置消息;当发现终端不发测量报告或基站不发送重配置消息(门限参数设置过高无法触发切换或终端无法测量邻小区功率),参考图32e. 查看源小区邻区关系查看邻区参数是否设置合理,会导致终端在源小区无法发送测量报告或即使上报了测量报告也会被RRC拒绝而不发送重配置消息;当发现终端不发测量报告或基站不发送重配置消息(门限参数设置过高无法触发切换或终端无法测量邻小区功率)参考图32f. 查看源小区eUE测量小区参数配置参数是否合理影响UE的测量判决;如果终端不发

20、测量报告时需要关注,参考图33g. 查看源小区A1、A2、A3、A4、A5事件配置;当有异频时,B1、B2事件配置影响UE的测量上报及切换的发起,如果基站不发重配置消息时需要重点关注,参考图34h. 查看目标小区的接入相关参数影响到随机接入过程6.3.3 三板斧:提取CDL、L2切换日志a. 提取源及目标侧CDL信令日志可以查看切换信令流程;切换问题分析最有效工具,如果无法确认切换在哪个步骤失败,就提取信令CDL进行分析b. 提取源及目标侧L2的DSP66日志从PDCP层面查看信令及AM模式下数据倒换相关过程;如果带着业务切换时最好提前打开,可以看到PDCP层面数据倒换的信息,特别是切换后业务

21、不通或陡降的情况,需要提前打开c. 提取目标侧L2的随机接入异常日志即DSP66号日志L2层面分析切换过程中AS接入失败相关过程信息;如果切换是在目标侧接入失败时需要提取d. 登录ATP的SCT板卡查看源及目标侧Log查看高层信令流程6.4 切换业务中断:6.4.1 首板斧:查看发包源端数据发包的情况a. 查看RRU通道状态RRU通道故障会导致业务中断,如果在LMT上发现有RRU通道故障告警时需要在LMT上查询b. 查看发包源发包是否继续每次遇到业务中止,都首先要查看发包的情况,FTP软件下载状态,确认线程是否下载完成;服务器侧数据发送是否正常c. 查看下行PDCP吞吐量当发包服务器仍在发包中

22、,需要查看PDCP的吞吐量,确认服务器数据包是否到达基站,如果PDCP有速率说明业务中断可能是底层问题d. 可以尝试Ping服务器,看能否ping通服务器。e. 查看业务中断后是否可以恢复,如果业务中断可恢复,查看中断是否有周期性的规律f. 通过下行PDCP发包的方式上行打BO,来确认上下行空口状态,看上下行方向是否单通g. 查看空口残留BLER多少对于FTP业务如果短时间内突发大量的残留BLER就会导致业务中断,如果业务可以单通,就要观察上下行的BLER高低,通过BLER来确认问题h. 查看抓包工具的数据包情况(终端笔记本Dumeter网卡数据统计或核心网服务器侧wireshark数据统计)

23、服务器发包但数据包无法到达基站时,通过抓包工具查看数据包是否到达基站;或终端笔记本侧数据是否发送到了终端(终端笔记本网卡可能有问题)6.4.2 二板斧:查看小区参数设置邻区X2路由关系配置是否正确,错误会出现掉坑6.4.3 三板斧:通过UDP发包或PDCP及RLC发包模拟业务查看业务状态a. 当业务中断后尝试单方向UDP业务查看是否单通当业务中断后可以通过尝试UDP业务,来确认业务状态,如果上下行业务可以单通说明服务器、PDCP可能没有问题;问题可能是空口的残留BLER及MAC、RLC层面的问题,而且可以排除UE的TA超时状态;如果业务不通就要通过确认发包服务器、PDCP层面是否收到了数据及此

24、时终端是否处于TA超时状态b. 提取CDL查看之前是否存在TA_Expired消息如果TA超时可以通过CDL中记录的TAEXPIRED消息就可以确认c. 提取L2的资源分配及调度异常日志,可以确认MAC层面的问题。d. 可以提取对应小区的业务CDL、告警日志、信令CDL、L265号日志、ATP *.logt7 参考图集合:图1图2图3图4图5图6图7图8图9图10图11图12图13图14图15图16图17图18图19图20图21图22图23图24图25图26图27图28图29图30图31图32图33图34附件:L2远程日志错误!链接无效。8 实现遗留问题目前的L2远程的日志需要辅助工具进行解析;CDL分为信令及业务面,这两部分都在不停完善更新中,如果打算了解CDL相关内容可以查看eNB_CDL实现设计报告。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号