华为RAN故障处理流程.ppt

上传人:小飞机 文档编号:6449157 上传时间:2023-11-01 格式:PPT 页数:60 大小:1.08MB
返回 下载 相关 举报
华为RAN故障处理流程.ppt_第1页
第1页 / 共60页
华为RAN故障处理流程.ppt_第2页
第2页 / 共60页
华为RAN故障处理流程.ppt_第3页
第3页 / 共60页
华为RAN故障处理流程.ppt_第4页
第4页 / 共60页
华为RAN故障处理流程.ppt_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《华为RAN故障处理流程.ppt》由会员分享,可在线阅读,更多相关《华为RAN故障处理流程.ppt(60页珍藏版)》请在三一办公上搜索。

1、RAN故障处理,RAN 6.0,Page 2,现场开局或维护工程师时经常会遇到各种各样的RAN设备调试问题,如何定位问题?如何解决问题?本课程为大家介绍了RAN故障的主要分类和处理流程,前 言,Page 3,学习完此课程,您将会:掌握RAN故障处理的流程和方法掌握RAN设备常见故障的定位方法,目 标,Page 4,内容介绍,第1章 故障处理的一般流程第2章 RNC常见故障分析第3章 NodeB 常见故障分析,Page 5,故障处理概述,故障处理的一般流程信息收集在处理故障前,一般需要收集必要的故障信息 故障判断在获取故障信息后,需要对故障现象有一个大致的定义,以确定故障的范围与种类 故障定位故

2、障定位是“从众多可能原因中找出故障原因”的过程故障排除故障排除是指采取适当的措施或步骤清除故障、恢复系统的过程。如检修线路、更换单板、修改配置数据、倒换系统、复位单板等,Page 6,故障处理概述,故障的分类,Page 7,故障处理概述,故障定位常用手段查看告警、指示灯和错误提示RAN设备为每一条告警提供了丰富的告警处理的操作步骤,按照告警处理的详细操作步骤可以排除大部分故障接口和协议跟踪业务演示辅助分析仪器、仪表辅助分析性能测量辅助分析测试辅助分析对比/互换 主备倒换/复位,Page 8,故障处理概述,当设备出现异常时,而现场又无法及时定位解决,往往需要求助后方技术支持。这就需要现场搜集尽可

3、能多的相关信息,信息越全面,对问题的定位越有利,可以减少定位人员与现场操作人员之间的交互,以便快速定位解决问题。告警信息主机错误日志BAM错误日志维护台操作日志自诊断输出信息单用户的CDR(呼叫数据记录)信息标准接口信令跟踪消息数据配置信息,Page 9,故障处理一般流程,发现故障:多种途径、越早越好判断故障:确定故障位置、范围、种类定位故障:确定故障原因解决故障:清除故障、恢复系统,故障处理一般流程,Page 10,故障处理一般流程,告警:反映系统的“硬伤”话务统计:全面的系统监控用户投诉:越少越好全面巡检:设备“体检”,发现故障的途径,Page 11,故障处理一般流程,RNC故障一般是全网

4、性故障,影响多个基站或所有基站NodeB故障一般只影响本基站覆盖区域或周边基站切换指标判断是否为NodeB故障的方法新开局或扩容时,可以通过“替换法”快速定位是否是RNC问题导致NodeB故障维护期间,除了数据修改发生错误外,其他RNC故障一般不会对单个NodeB造成影响,故障范围判断,Page 12,故障处理一般流程,RAN侧问题传输类故障小区类故障业务类故障链路类故障对接类故障时钟类故障天馈类故障,操作维护问题OMC类故障加载类故障网络优化问题接入类故障掉话类故障拥塞类故障切换类故障,常见故障种类,Page 13,故障处理一般流程,告警信息分析包含故障或异常现象的具体描述、可能的发生原因、

5、有哪些修复建议等等,涉及硬件、链路、中继、CPU负荷等RAN的各个方面,是进行故障分析和定位的重要依据之一指示灯状态分析反映诸如端口、电路、链路、光路、节点、主备用等的工作状态,常常与告警信息分析配合使用 话务统计分析定位、解决网络问题(尤其是呼叫问题)最有效的手段,故障定位的常用方法,Page 14,故障处理一般流程,仪器、仪表辅助分析以直观、量化的数据直接反映故障的本质主要仪器有:信令分析仪、误码仪、测试手机、天馈分析仪等接口跟踪利用跟踪的结果,常常可以直接得到呼叫失败的原因,找出问题的症结所在,或者从中得到启发,为后续分析提供宝贵的思路 业务测试判断RAN侧的业务处理功能和相关设备是否正

6、常最直接的方法,故障定位的常用方法,Page 15,故障处理一般流程,对比/互换对比:将故障的部件或现象与正常的部件或现象进行比较分析,查出不同点,从而找出问题的所在,一般适用于故障范围单一的场合互换:将处于正常状态的部件(如单板、光纤,甚至整个基站等)与可能故障的部件对调,比较对调后二者运行状况的变化,以此判断故障的范围或部位,一般适用于故障范围复杂的场合 倒换/复位:只能作为应急措施,迫不得已时谨慎使用相对于其他方法而言,倒换或复位不能对故障的原因进行精确定位倒换或复位后,故障现象一般难以在短期内重现,从而容易掩盖故障的本质,给设备的安全、稳定运行带来隐患,故障定位的常用方法,Page 1

7、6,故障处理一般流程,联系华为技术支持热线:8008302118(中国)0755 28560998填写GCRMS问题单反馈问题的时候,请注意提供或收集以下信息局点的详细名称(全称)联系人姓名、电话号码故障发生的具体时间故障现象的详细描述告警文件、接口跟踪文件、话统结果等原始信息NodeB的软件版本故障后已采取的措施和结果问题的级别及希望解决的时间,故障定位的常用方法,Page 17,小结,故障处理的一般流程发现故障判断故障定位故障解决故障故障定位的主要方法解决一般故障告警信息分析、指示灯分析对比/互换解决复杂故障话务统计分析、仪器分析接口跟踪、业务测试紧急恢复系统倒换/复位,Page 18,内

8、容介绍,第1章 故障处理的一般流程第2章 RNC常见故障分析第3章 NodeB 常见故障分析,Page 19,内容介绍,第3章 RNC常见故障分析3.1 操作维护类故障3.2 加载类故障3.3 接口链路类故障3.4 业务类故障,Page 20,操作维护类故障,BSC6810操作维护系统组成操作维护类故障指用户在安装和使用BAM软件、LMT软件过程中发生的故障,Page 21,操作维护类故障,BAM故障的一般分析思路当BAM运行正常且各模块启动方式为“自动”的情况下,主用BAM服务器上安全监控管理器应该显示各个模块已启动.当BAM软件的某些模块状态不正常时,可以通过查看运行日志的方法进行故障定位

9、,各模块运行日志存放在BAM软件安装目录下的Serviceslog中例:D:WCDMARNCBAMVersionAServicesLog 打开各模块的调试窗口,查看调试信息,Page 22,操作维护类故障Case1,重新安装驱动程序后BAM运行异常故障现象BAM软件安装,并且运行正常之后然后重新安装了网卡的驱动程序,发现BAM程序运行异常故障定位及处理安装BAM时记录了安装网卡的标识,这个标识是安装网卡驱动程序时分配的,当BAM程序启动运行时会读取这个网卡标识,并根据网卡标识从网卡中读取IP地址,当重新安装网卡驱动后,网卡的标识会重新分配,这时BAM读取的还是以前的网卡标识,所以找不到网卡,读

10、取IP也就失败重新安装网卡驱动后,需要使用BAM设置工具更新网卡标识,Page 23,内容介绍,第3章 RNC常见故障分析3.1 操作维护类故障3.2 加载类故障3.3 接口链路类故障3.4 业务类故障,Page 24,内容介绍,第3章 RNC常见故障分析3.1 操作维护类故障3.2 加载类故障3.3 接口链路类故障3.4 业务类故障,Page 25,接口链路类故障,Iub接口协议栈结构,Page 26,接口链路类故障,Iu-CS接口协议栈结构,Page 27,接口链路类故障,Iu-PS接口协议栈结构,Page 28,接口链路类故障,光口的扰码开关未打开导致IU接口的信令链路不通故障现象 某局

11、,RNC版本是BSC6810V200R009ENGC01B065+SP02与CS核心网对接时,SAALLNK不通。当RNC和CS直连时,跟踪SAAL信令,发现只有进RNC的消息,没有出RNC的消息.故障定位及处理 检查RNC侧和CN侧的光扣板的类型,确定两者是一致的。直接用光纤连接RNC和MGW,但问题依旧。检查RNC侧和CN侧的数据配置是一致的。自环时跟踪SAAL,现象也是只有进RNC的消息,没有出RNC的消息,即4个BGN,一个END。所以可以断定应该是RNC侧的问题。仔细回想和CN对接的整个过程,当BSC6810V200R009ENGC01B065升级SP01补丁的时候,和CN对接是成功

12、的并可以打通电话。但是当升级SP02补丁后才出现上述描述的问题。所以怀疑SP02补丁是否有限制。询问研发,才知道当升级SP02补丁的时候承载CS的接口板相应的光口属性中的扰码开关必须是打开的。而查看本RNC的光口属性,扰码开关是关闭的,所以用命令SETOPT修改光口属性中扰码开关为ON,修改完后对接成功可以打通电话。,Page 29,接口链路类故障,SAAL链路CDVT配置太少导致Iu接口信令链路闪断 故障现象SAAL链路断了在1s之内又恢复,一天会发生好多次 故障定位及处理 SAAL链路丢包的主要原因有:光纤接头脏、光纤接头连接不好、时钟问题和两端流量配置不一致等;如果丢包严重就会导致SAA

13、L断链,由于设置了紧急验证所以断链后又能马上建链成功,所以就出现了信令链路闪断 由于链路只是单向丢包,所以首先怀疑流量配置问题,检查RNC和CN的流量配置发送流量类型都为RTVBR、峰值速率和平均速率等都相同,只有CDVT配置不一样,CN配置为300000,而RNC配置为10240,CDVT的单位是0.1s,即RNC的CDVT只有1ms,怀疑是ATM信元时延抖动导致链路丢包,把RNC侧的CDVT换成102400(即10ms)后丢包现象消失,问题解决,Page 30,内容介绍,第3章 RNC常见故障分析3.1 操作维护类故障3.2 加载类故障3.3 接口链路类故障3.4 业务类故障,Page 3

14、1,业务类故障,BSC6810 光口 匹配 RAB 失败故障现象数据配置完成后,RNC和核心网间可以收发信令,但是信令到RAB指派时,RNC响应失败,原因为:iu-transport-connection-failed-to-establish.RNC上有两条告警:HigherOrderPathTraceIdentifierMismatchRegenerationSectionTraceIdentifierMismatch,Page 32,业务类故障,故障定位及处理 因为信令可以收发,就没有考虑到光口物理配置的问题。但是从RAB指派失败的原因看,问题还是出在传输层。目光返回到RNC的光口告警上

15、。BSC6800的光口设置用SETOPT命令,只能选择SDH或者sonet.而6810的SETOPT命令中可以设置J0/J1的格式以及发送内容。通过与核心网接口格式比对发现:BSC6810的缺省配置是16字节,但是发送内容都是“空”;核心网的J0/J1均为16字节,而发送字为“MGWSDHDEFAULT”。这与BSC6810缺省配置不同。将OPT格式改为与核心网配置一致后,问题解决。,Page 33,业务类故障,SAAL链路CDVT配置太少导致Iu接口信令链路闪断 故障现象某局点需要进行CS域2Gto3G切换,现场使用BSC6810和iDBS。在测试过程中发现切换失败。期间RAN侧没有收到任何

16、切换相关的信令。故障定位及处理 由于没有收到来自2G的切换信令,问题可能出在GSM侧和核心网侧。现场没有Probe等路测工具进行路测,但核心网使用的是华为G9设备,于是要求核心网同事跟踪了A口、IU口以及其它相关接口的信令.在A口信令中看到GSM侧上报了handoverrequired,里面包含切换原因值和切换目标LAI与RNCID,但是紧接着核心网回复了handoverrequiredreject,原因值是invalidcell。由此可见GSM侧能够正常触发切换流程,只是在核心网处理过程中被拒绝。在检查handoverrequired内容时发现RNCID错误,因为GSM工程师将十进制RNCI

17、D直接用做16进制数值输入。告知GSM工程师将切换参数中的RNCID进行修改,使2G3G的配置一致,随后2G到3G的切换顺利完成。,Page 34,内容介绍,第1章 故障处理的一般流程第2章 RNC常见故障分析第3章 NodeB 常见故障分析,Page 35,内容介绍,第3章 NodeB常见故障分析3.1 传输类故障3.2 操作维护类故障3.3 小区类故障,Page 36,传输类故障,RAN 传输网络,Page 37,传输类故障,传输电路中断基站和RNC之间传输环节越多,传输中断可能性越大传输码不同如果一方使用CRC4校验,而另一方未使用,则传输不通传输误码率高,频繁闪断E1接头接触不良工程质

18、量问题,会造成传输时有时无,话音质量差,严重时会造成基站传输中断使用微波、XDSL的基站一般误码率较高,阴雨天气闪断更频繁传输接地不好,故障现象及常见原因,Page 38,案例1:传输不通,传输类故障,故障现象传输不通,E1出现告警故障处理 可能由单板故障,E1端口故障或者线缆故障引起1.检查单板和E1端口的报警信息DSP BRDDSP E1T1如果单板故障,更换单板2.单板正常但E1仍有报警,先进行本端环回测试SET E1T1LOP(Loopback Type=LOCAL)LOP E1T1(RNC)DSP E1T1(NodeB)SET E1T1LOP(Loopback Type=NOLOOP

19、)如果是E1端口故障,更换单板,Page 39,故障处理3.单板和E1端口正常,仍有报警,此时进行远端环回,并在RNC侧监视 SET E1T1LOP(Loop type=remote)DSP E1T1(RNC)如果是传输网络故障,请检查传输线路及传输设备,案例1:传输不通,TX,RX,RX,TX,RNC,NodeB,Step 2:Local Loop Back SET E1T1LOP(Loop type=local)DSP E1T1,Step 2:Local Loop Back SET E1T1LOP(Loop type=local)LOP E1T1(Activate loop)SET E1T

20、1LOP(Loop type=noloop),Step 3:Remote Loopback DSP E1T1,Step 3:Remote Loopback SET E1T1LOP(Loop type=remote),Step 1:Check Board and ports DSP BRD DSP E1T1,Step 1:Check Board and ports DSP BRD DSP E1T1,Transport network,传输类故障,Page 40,内容介绍,第3章 NodeB常见故障分析3.1 传输类故障3.2 操作维护类故障3.3 小区类故障,Page 41,操作维护类故障,No

21、deB 提供两种操作维护方式:近端操作维护方式远端操作维护方式,背景知识,Page 42,操作维护类故障,维护人员能够使用LMT以远端和近端方式登录到NodeB,以便对NodeB进行必要的维护操作。主要包括射频通道的校正、时钟源的设置、基站单板的操作维护、基站的版本升级。远端操作维护指利用NodeB和RNC之间的传输链路,维护人员使用LMT在RNC(BAM)侧登录NodeB。近端操作维护是指维护人员使用LMT通过网线直接登录到NodeB,维护人员必须事先知道基站近端维护IP地址。,背景知识,Page 43,操作维护类故障,故障现象软件升级过程中,软件包下载时间长达几个小时,有时甚至下载失败。,

22、案例1:下载软件包时间太长,有时甚至下载失败,Page 44,操作维护类故障,故障处理单击“开始/运行”,输入,看是否能ping通。如果是近端维护,推荐使用交叉网线直接连接LMT所在的计算机和NodeB的主控板网口,排除网络质量的干扰。如果是经由RNC通过IPoA进行维护,则需要检查IPoA带宽是否太小。(LST IPOAPVC和LST ATMTRF),案例1:下载软件包时间太长,有时甚至下载失败,Page 45,操作维护类故障,故障现象方式1):使用操作维护系统通过IPoA链路登录到基站后,利用MML命令(SET IP)来设置近端维护通道地址,然后利用MML命令(LST IP)来查询近端维护

23、IP地址是否设置成功。方式2):利用配置管理系统打开数据配置文件,修改基站属性,将近端IP地址修改成需要设置的地址后重新下载数据配置文件,重新启动基站。,案例2:下载数据配置文件重新启动基站后,无法使用近端方式登录NodeB,Page 46,操作维护类故障,故障处理单击“开始/运行”,输入,看是否能ping通。如果是近端维护,推荐使用交叉网线直接连接LMT所在的计算机和NodeB的主控板网口,排除网络质量的干扰。如果是经由RNC通过IPoA进行维护,则需要检查IPoA带宽是否太小。(LST IPOAPVC和LST ATMTRF),案例2:下载数据配置文件重新启动基站后,无法使用近端方式登录No

24、deB,Page 47,内容介绍,第3章 NodeB常见故障分析3.1 传输类故障3.2 操作维护类故障3.3 小区类故障,Page 48,小区类故障,当NodeB侧配置的本地小区资源可用的时候,NodeB将通过资源状态指示或是审计过程将资源状态反馈给RNC,由RNC发起小区建立流程,建立逻辑小区。当逻辑小区建立并可用后,该小区才能提供业务服务。与小区建立过程相关的因素和条件主要包括如下几点:1单板工作状态逻辑可用2传输数据正确配置3传输链路正确连接RNC配置的小区建立参数合理NodeB本地小区配置参数正确,背景知识,Page 49,背景知识,小区类故障,Page 50,小区类故障,故障现象逻

25、辑小区无法建立,在NodeB操作维护系统,通过MML命令查询到本地小区资源可用,NCP、CCP的状态均正常在NodeB操作维护系统使用MML命令ADT RES请求RNC下发资源审计,RNC下发资源审计命令,但是不下发CELL SETUP REQUEST消息,案例1:NodeB状态正常,但RNC不下发CELL SETUP REQUEST消息,IUB口无RNC的小区建立消息,Page 51,小区类故障,故障处理查看NodeB的审计消息中上报的最大下行功率是否小于RNC配置的值。在NodeB的操作维护系统,通过MML命令(DSP CELL)查看该小区的本地小区号是否和RNC协商的一致。,案例1:No

26、deB状态正常,但RNC不下发CELL SETUP REQUEST消息,IUB口无RNC的小区建立消息,Page 52,小区类故障,故障现象RNC下发CELL SETUP REQUEST消息NodeB上报CELL SETUP RESPONSE消息之后RNC 下发两条COMMON TRANSPORT CHANNEL SETUP REQUEST消息收到NodeB上报的两条COMMON TRANSPORT CHANNEL SETUP RESPONSE消息后,RNC没有下发SYSTEM INFORMATION UPDATE REQUEST消息,而是下发CELL DELETION REQUEST消息从N

27、odeB侧和RNC侧观察,此刻均无告警,案例2:NodeB上报小区及公共传输信道建立响应后,RNC删除小区,Page 53,小区类故障,故障处理在NodeB操作维护系统使用MML命令(LST AAL2PATH)获得AAL2PATH的配置数据。将NodeB的AAL2 PATH的配置数据与RNC侧的配置数据进行比较,把不一致的数据修改为一致。检查NodeB和RNC之间配置了AAL2的E1/T1或STM1物理端口连接是否正确。如果有错则需要重新对接。检查NodeB的ALCAP配置的ATM物理地址是否同RNC侧的相应配置数据一致,如果不一致则修改为一致。,案例2:NodeB上报小区及公共传输信道建立响

28、应后,RNC删除小区,Page 54,小区类故障,故障现象3812E机柜做室内分布,属于异频同覆盖,功放为38W。两个小区的最大发射功率在RNC和基站上均配置为430,结果加载脚本后导致该站第二个小区无法建立。告警消息显示:小区建立失败,RNC侧提示为功率不匹配,NODEB侧提示为射频资源不足。,案例3:基站配O2站型时两个小区最大发射功率配成430 导致第二小区无法建立,Page 55,小区类故障,故障处理根据RNC侧告警提示可以判断,问题出在功率配置上,两个小区的配置都为430,即20W,两个小区总功率为40W,但基站用的是38W的功放,承载单载波时机顶功率仅为30W,由于两个小区共用一个

29、功放,这样一来,小区配置功率之和大于机顶硬件发射功率。因此导致其中一个小区建立失败。调整数据配置,两个小区的功率之和要小于30W。例如一个小区配成430,另一个配成400即可,但考虑到室内覆盖效果,建议将30W的功率平均分配到两个小区之上,即在RNC和NODEB上将每个小区最大发射功率配成417即可。,案例3:基站配O2站型时两个小区最大发射功率配成430 导致第二小区无法建立,Page 56,本章总结,处理故障前先要把思路理清,切忌盲目操作,造成故障扩大化故障处理时一定要做好记录,否则即使排除了故障也不知道为什么及时总结故障处理经验,才能有效地提高故障分析水平,Page 57,NodeB故障

30、预防措施,与其“亡羊补牢”不如“防患于未然”,Page 58,NodeB故障预防措施,硬件方面:严格按照工程规范施工,千万别碰“高压线”!特别关注中继电缆接头质量一定要对所有中继端口逐一做导通测试特别关注天馈接头制作质量和防水处理一定要保证系统的接地、防雷(电源、中继、天馈)措施落实到位日常运行状态检查NodeB维护台首先进行多基站故障查询,然后对有问题的基站逐一检查;根据故障描述和处理建议排除故障;如果暂时无法排除,必须明确每一个问题的原因NodeB新建、扩容后,一定要对新建、扩容部分的基站、载频做业务测试,Page 59,服务心经与您共勉,预防为主早发现发现问题强推动出了问题反应快减少历时影响轻群策群力搞得定一方有难大家应先申请来后操作客户意见要多听既取话单又备份操作过程记录清多查多看慎修改存在即有合理性操作过程重严谨前因后果先想明完成操作详记录原有业务要验证计费验证别含糊注意汇报及时性客户满意是关键服务市场是灵魂,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号