[信息与通信]RCPESDH案例培训10.ppt

上传人:sccc 文档编号:5614847 上传时间:2023-08-02 格式:PPT 页数:71 大小:1.84MB
返回 下载 相关 举报
[信息与通信]RCPESDH案例培训10.ppt_第1页
第1页 / 共71页
[信息与通信]RCPESDH案例培训10.ppt_第2页
第2页 / 共71页
[信息与通信]RCPESDH案例培训10.ppt_第3页
第3页 / 共71页
[信息与通信]RCPESDH案例培训10.ppt_第4页
第4页 / 共71页
[信息与通信]RCPESDH案例培训10.ppt_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《[信息与通信]RCPESDH案例培训10.ppt》由会员分享,可在线阅读,更多相关《[信息与通信]RCPESDH案例培训10.ppt(71页珍藏版)》请在三一办公上搜索。

1、RCPESDH故障处理方法及案例,课程目标,学习完此课程,您应能:掌握SDH简单故障定位及处理掌握时隙复用方式、开销字节、接口指标对设备对接的影响及处理方法了解设备接地的重要性及接地规范了解误码的处理方法,故障定位前的准备,掌握专业技能熟悉SDH原理知识了解传输系统告警信号流及告警产生机理熟悉传输设备和网管的基本操作熟悉常用仪表的基本操作,熟悉工程组网信息网络拓扑业务配置设备运行状态工程文档做好故障现场数据的采集与保存,故障定位基本原则,故障定位的关键是什么?,将故障准确定位到单站,故障定位基本原则,先高速部分,后低速部分,先定位外部,后定位传输,先定位单站,后定位单板,先分析高级别告警,后分

2、析低级别告警,故障分析方法,环回法,替换法,配置数据分析法,更改数据配置法,告警、性能分析法,仪表测试法,经验处理法,故障处理方法(告警、性能分析法),通过设备告警指示灯获取告警信息,一、通过机柜顶部的告警指示灯查看告警二、通过单板告警指示灯查看告警,设备指示灯仅反映设备当前的运行状态,对于设备曾经出过故障,无法表示设备指示灯状态只能反映设备告警级别,而不能准确告知具体告警,缺点,适用于设备维护人员配合处理故障时使用,故障处理方法(告警、性能分析法),通过网管获取告警和性能信息,适用于网管维护人员处理故障使用,全面性,不仅仅是一个站、一块板的故障信息,而且是全网设备的故障信息,详实性,能够获取

3、设备当前存在哪些告警、告警发生时间,以及设备的历史告警;能够获取设备性能事件的具体数值,故障处理方法(告警、性能分析法),应用举例,A,B,C,D,R_LOSTU_AIS,MS_RDIHP_RDILP_RDI,无,无,分析:因网元B有R_LOS,从而网元A相应光路有MS_RDI、HP_RDI;因网元B有TU_AIS,并且TU_AIS业务是与网元A业务,从而网元A 相应通道有LP_RDI;网元B的R_LOS告警会导致TU_AIS;结论:所有告警均由网元B的R_LOS引起,说明A到B传输方向光路故障。,故障处理方法(环回法),线路,线路,内环回,外环回,SDH网元设备,支路,支路,软件环回/硬件环

4、回 内环回/外环回 线路环回/支路环回 端口环回/VC4环回,线路环回可能导致该线路其他在用业务中断,部分单板不支持软件的VC4环回,请查阅相应的使用手册,4.初步定位单板问题,“环回法”的步骤:,1.环回业务通道采样,2.画业务路径图,3.逐段环回,定位故障站点,故障处理方法(环回法),故障处理方法(环回法),一、环回业务通道采样:,1、从多个有故障的站点中选择一个站点;2、从所选择站点的多个故障业务通道中选择其中的一个业务通道。由于自环第一个VC4通道,可能会影响ECC通信,因此尽量不要选择第一个VC4通道内的业务。,故障处理方法(环回法),画出所采样业务一个方向的路径图。在路径图中表示出

5、:该业务的源和宿,该业务所经过的站点,该业务所占用的VC4通道和时隙。,二、画业务路径图:,例如:,故障处理方法(环回法),依据中断业务的路径图,在3号站第1块支路板的第1个2M通道外接一个2M误码仪,监测业务好坏。,三、逐段环回,定位故障站点,四、根据环回现象初步定位故障单板,故障处理方法(替换法),适用场合,排除传输外部设备的问题 故障定位到单站后,怀疑单站内单板或附件有 问题,替换法就是使用一个工作正常的物件去替换一个被怀疑工作不正常的物件,可替换物件包括线缆、光纤、法兰盘、电源、单板、设备等。,故障处理方法(替换法),应用举例,业务配置:E1板总共63个2M配置双向业务到群路做单站调试

6、,使用设备为3500E。故障描述:2-E1板第1个2M上报T_ALOS告警,其他2M通道正常。通过网管对该2M做内环回,T_ALOS消失。DDF架 环回故障依然存在。,故障处理方法(配置数据分析法),适用场合,故障定位到单站后,用以进一步定位故障 特定告警,如:HP_TIM、HP_SLM等,HP_TIM:J1字节设置 HP_SLM:C2字节设置 TU_AIS/AU_AIS:SDH业务配置 TPS倒换下业务中断:检查TPS保护设置 MSP环倒换下业务中断:MSP节点参数设置 SNCP环倒换下业务中断:通道保护属性设置,故障处理方法(配置数据分析法),A,B,C,应用举例,VC4,(开销穿通),(

7、开销终结),(开销终结),HP_SLM,分析:1、HP_SLM告警与C2字节相关,为实收C2与应收C2不匹配;2、网元B开销穿通,对C2字节做穿通处理;处理步骤:1、检查网元C接受方向的应收/实收C2字节;2、检查网元A发送方向的应发C2字节;,故障处理方法(更改配置法),适用场合,有空余时隙、通道或槽位 一个VC4中部分时隙业务中断情况,更改时钟配置:时钟告警、指针调整更改板位配置:怀疑单板或是母板槽位故障更改时隙配置:将故障定位到单站 判定线路或支路故障更改单板参数配置:以太网故障、对接故障,故障处理方法(更改配置法),故障描述:1、网元C收网元A方向所有2M业务中断;2、其他网元业务正常

8、;可能原因:C站16E1故障A站3-16E1故障,应用举例,A,B,C,D,2-16E13-16E14-16E1,16E1,1VC4:116,16E1,2VC4:116,16E1,2VC4:4156,TU_AIS,LP_RDI,w,w,w,w,e,e,如何将故障 定位到单站?,故障处理方法(仪表测试法),适用场合,排除传输设备外部问题 设备对接问题 设备性能指标问题,光功率计:R_LOS、R_LOF万用表:接地或是电压问题SDH分析仪:误码等问题,故障处理方法(仪表测试法),故障描述:B站收R_LOS可能原因:A到B方向光纤故障A站光板发送故障B站光板接收故障,应用举例,A,B,R_LOS,w

9、,w,测试A发送光功率,异常,A站光板发送故障,测试B接收光功率,正常,正常,异常,B站光板接收故障,A发B光纤故障,故障处理方法(经验法),适用场合,仅做为应急处理时使用,临时恢复业务,复位单板单站重启重新下发配置将业务倒到备用通道,该方法不能彻底查清故障原因,除非不得已,建议使用其他方法,故障处理方法,本节我们主要学习了:故障处理基本思路故障处理各种方法及其比较,小结,业务中断类故障,外部原因供电电源故障接地故障环境异常光纤、电缆故障人为原因误操作设置了光路或支路通道的环回误操作更改、删除配置数据,设置业务未装载设备本身故障单板失效或性能不好,可能原因,业务中断类故障,定位方法,告警分析法

10、 更改配置法 逐段环回法 替换法,定位步骤,检查各站登录是否正常 检查有无设备告警,如BD_STATUS、NO_BD_SOFT等 检查保护倒换是否正常 分析故障,通过环回或是更改配置定位到单站 将故障进一步定位并解决,TU_AIS,LP_RDI,网络配置网元1为中心节点,为网关网元其他各点之间没有业务,故障描述网元1和网元4 E1业务中断 节点 4:TU_AIS 节点 1:LP_RDI其他各站业务正常,无其他告警,t2:1,t2:1,2:1,2:1,2:1,案例1:无保护链,业务中断类故障,1,2,3,4,w,w,w,w,E,E,TU_AIS,LP_RDI,t2:1,t2:1,2:1,2:1,

11、2:1,告警查询,网元4有TU_AIS,网元4不能收网元1业务,网元1、2、3间业务正常,检查1到4的业务配置,告警分析步骤,可否做环回操作?,正确,业务中断类故障,1,2,3,4,w,w,w,w,E,E,误码仪,t2:1,t2:1,2:1,2:1,2:1,对网元2东向2VC4做内环回,正常,故障点在网元1、2,故障点在网元3、4,在网元3东向对2VC4做内环回,正常,故障点在网元3,故障点在网元3或网元4,用尾纤在网元3东向做内环回,正常,故障在网元3东向光板,故障在网元4,业务中断类故障,1,2,3,4,w,w,w,w,E,E,TU_AIS,LP_RDI,t2:1,t2:1,2:1,2:1

12、,2:1,故障定位到单站,可能LU/TU/XC 故障,业务正常,TU故障,更换TU,XCS主备倒换,TPS 倒换,业务正常,XCS故障,更换XCS,LU故障,更换LU,若无TPS或XCS主备怎么办?,业务中断类故障,业务中断类故障,w,SNCP Ring,e,e,e,e,w,w,w,3,2,4,1,案例2:SNCP 环,网络配置网元1为中心节点,各点有和网元1的业务 其他各点间无业务往来,故障描述 网元1和网元4间2M业务中断 网元 1,4:TU_AIS 其他各站业务正常,TU_AIS,TU_AIS,告警/性能分析,断开网元1和4光纤,转化为链处理,w,SNCP Ring,e,e,e,e,w,

13、w,w,3,2,4,1,同上一案例,处理方法,检查配置数据是否正确,TU_AIS,TU_AIS,业务中断类故障,先强制倒换以尽快恢复业务,w,MSP RingSTM-4,e,e,e,e,e,w,w,w,w,3,2,4,5,1,案例3:MSP 环,网络配置网元1为中心节点,各站均有到网元1的业务其他各站之间没有业务业务均按最短路径配置,故障描述 网元2与网元3之间光纤断 R_LOS网元1与网元3之间E1业务中断 网元1,3:TU_AIS其他业务正常,TU_AIS,TU_AIS,R_LOS,R_LOS,业务中断类故障,w,MSP RingSTM-4,e,e,e,e,e,w,w,w,w,3,2,4,

14、5,1,R_LOS,R_LOS,APS_INDI TU_AIS,APS_INDI,S,S,P,P,P,查询告警,检查倒换状态,正常,APS协议是否启动?,是,否,画倒换后的信号流,更换故障单板,重新下发MSP参数配置,倒换状态正常?,否,是,重启APS协议,倒换状态正常,否,是,逐段环回定位故障到XCS/LU,是,否,启动协议,TU_AIS,业务中断类故障,业务中断类故障,w,MSP RingSTM-4,e,e,e,e,e,w,w,w,w,3,2,4,5,1,R_LOS,R_LOS,APS_INDI TU_AIS,TU_AIS,APS_INDI,S,S,P,P,P,倒换前路由,倒换后路由,对于

15、比较长的链,建议采用二分法进行环回,设备对接,开销字节回顾对接案例,开销字节不一致对设备对接的影响,J1字节大多厂家设备SDH接口板在发现接收到的J1开销和其应收值不一致时缺省不会下插AIS,但是可以设置;C2字节传输设备检测到C2字节失配会产生HP-SLM告警,并下插AIS,造成业务中断;D1-D12字节传输设备一般使用D1-D3字节传递OAM信息;,接口指标对设备对接的影响,在设备的对接中,影响对接的原因还有关于接口的各种指标等,对于SDH接口指标,ITU-T都有相关的规定,如果对接的一方设备某一指标的值不在正常的范围内,或者对接的两端设备指标不匹配,如收光功率的问题,都会引起对接的不成功

16、。SDH接口指标:光口:平均发送光功率、激光器工作波长、接收机灵敏度、接收机过载光功率、输入口允许频偏、输出抖动、输入抖动容限等。电口:输入口允许频偏、输入口允许衰减、输入抖动容限、输出抖动、映射抖动、结合抖动。,接口指标对设备对接的影响,PDH接口指标:基站时钟GSM基站时钟对抖动的要求是ITU-T建议的标准,而对频稳度的要求非常高,要求输入时钟的频稳度高于0.05ppm。若输入时钟的频稳度低于0.05ppm,基站时钟宁可自由振荡,通过滑码来保证其时钟的质量;而ITU-T对SDH设备要求的最大频偏指标为-4.6+4.6ppm。,接地的基本知识,机房应采用联合接地的方式。规范建议,设备接地电阻

17、值在综合通信大楼不宜大于1,在普通通信局(站)应小于5(高土壤电阻率地区可放宽到10)传输设备电口信号同轴电缆屏蔽层应接PGND。DDF架应接PGND,子框应与PGND连接,同轴头应与 PGND连接 YD/T-779-1999 数字配线架,设备对接,开销字节回顾对接案例,对接案例1,组网情况某局采用OPCOM系列传输产品组网,其中需要开通多个155M业务,用于给IP路由器组网使用。用户路由器使用C公司产品,使用POS(PACKET OVER SDH)卡与155M光口对接。故障现象 使用之前,使用HP37718测试155M的传输通道24小时误码,误码数为0;但是局方反映路由器不能ping通对方,

18、链路无法建立。传输对接点155M光板上报HPSLM、HPTIM告警。,对接案例1,故障分析及排除:由于单独测试传输没有问题,而通过路由器ping不通,可以断定为两者对接的问题。使用仪表查看实际接收到C公司路由器送来的C2字节,发现C2字节为cf,查看SDH协议中没有cf含义的定义。SDH传输设备无法解释cf结构,不仅无法对该业务进行正确处理,而且还可能下插全1;另一方面,Optix 传输设备的C2默认是02(TUG结构),路由器由于没有设置也无法识别,最终导致业务不通。,对接案例1,处理方法:修改C2为01后,路由器工作正常,ping一万个包,丢包率为0。问题解决。将C2修改为01,即:Equ

19、ipped Not Specified(业务装载,但不进行具体指定),在这种情况下,我们的光板、路由器POS卡都忽略C2字节信息。,故障现象OPCOM设备通过STM-1板与朗讯的DCS设备进行STM-1对接,通过更改J1字节后,对接155M成功;在该STM-1中作一条2M业务电路,业务不通,挂表测试有AIS告警;OPCOM设备2M通道有LPRDI告警;朗讯集中网管无告警。,对接案例2,处理过程双方设备均无J1字节失配告警,表明STM-1对接成功;检查网元侧业务创建情况、373结构顺序,均无误;在朗讯设备端挂表,在我司设备的线路上(STM-1与VC4)环给对方设备,误码仪正常;但从支路端口无论用

20、软件还是硬件环给对端,误码仪都显示AIS;在我司设备落地端挂表,在朗讯设备的线路上环给我司设备,误码仪正常;从朗讯支路端口用软件方式环回,误码仪正常;但解开软件环回,使用硬件方式环回,误码仪显示AIS;发现L公司的LCT终端(非集中式网管,只能对单个设备管理)上相应的低阶通道有告警LPPTI告警,含义是低阶通道的追踪字节失配;尝试更改J2字节,使其匹配后,问题解决。,对接案例2,原因分析由于对端设备低阶通道收到不一致的追踪字节后,下插全“1”,我司设备低阶通道上报LPRDI是相应的对告;无论在我司还是朗讯设备的线路上环回时,未对低阶开销进行处理,所以挂表测试通过;在我司设备支路进行硬件和软件环

21、回,已经对低阶开销进行了处理,朗讯侧设备可以检测到低阶开销的不匹配,下插全“1”,导致挂表不通;咨询得知,在朗讯DCS设备支路进行软件环回时,实际是在交叉板上完成的,并没有处理低阶开销,所以挂表通过;一旦解开软件环回,采用硬件环回,则需要进行低阶的开销处理,这样朗讯侧设备可以检测到低阶开销的不匹配,下插全“1”,导致挂表不通;通过修改我司J2字节,和对方的字节匹配后,问题解决。建议了解对接双方设备的特性。对接2M时注意J2字节.,对接案例2,对接案例3,故障现象:OptiX 2500+设备组成一个链形网络,分别位于新楼和旧楼。在新楼通过DDF架仅和华为的一台GSM交换机相连,但在旧大楼,却是通

22、过DDF架和多个设备相连,且其中部分设备不在同一楼层,共包括48路2M业务。开通40路以下业务,观察业务正常。开通40路以上,部分通道出现误码,且少量通道误码频繁,在GSM交换机观察到不正常通道报“链路不正常,误码率过高”告警。但随机去掉几路,又表现正常。在63路2M业务中,选择几个通道,在新楼DDF架环回,在旧楼DDF架上挂2M误码仪,也出现误码。,对接案例3,对接案例3,故障分析及排除:通过环回测试把问题定位在旧楼站点,定位在PQ1板通过DDF架和多个交换机设备连接的这段路径上。在旧楼DDF架上,测试各通道之间75欧姆同轴电缆的“屏蔽皮”之间的阻抗,发现48路中有20路相差在50欧姆以上,

23、个别通道达到K欧姆数量级。测试任何一路75欧姆同轴电缆“屏蔽皮”,发现都不和DDF架外壳相连。测量不同路的“芯”和“屏蔽皮”之间的波形,发现串扰严重,几乎每次测量结果中都能观察到串扰现象,且串扰幅度在200mV500mV之间。,对接案例3,2M码型为HDB3码,幅度在-2.37V+2.37V时,抗干扰能力为18dB,约24mV。发现所有交换机的保护地共一个地排。而OptiX传输设备是后来增加的一个地排。测量这两个地排之间的阻抗,在90欧姆左右,电位差约60mV。这表明这两个地排之间已经完全不成为等电位。,对接案例3,整改措施:对机房目前存在的两个地排使用标准接地线连接,测试DDF架与其它设备机

24、壳之间的阻抗由原来的50多欧姆下降到1欧姆左右。对OptiX传输设备,除保护地分别接地排外,在相临的机柜之间使用标准接地线把相临机柜的机壳短路,以最大程度地实现各设备机壳等电位,获得最大的保护地面积,增加噪声干扰泻放路径。测量OptiX 传输设备和其它设备机壳之间的阻抗由原来的45欧姆下降到5欧姆左右。,误码专题类,误码相关概念误码问题的处理,误码的相关概念,什么是误码指经光接收机的接收与判决再生之后,码流中的某些比特发生了差错。平均误码率BER传统上常用平均误码率BER来衡量系统的误码性能。BER:在 某一规定的观测时间内(如24小时)发生差错的比特数和传输比特总数之比。(G.821)但平均

25、误码率是一个长期效应,它只给出一个平均累积结果。而实际上误码的出现往往呈突发性质,且具有极大的随机性,因此除了平均误码率之外还应该有一些短期度量误码的参数,即误码秒与严重误码秒。,误码的相关概念,注意:G.826规定的高比特率通道误码性能参数,以“块”为基础。,EB(误码块)SDH通道开销中的BIP-X属于单个监视块,其中X块中的每个比特与监视的信息比特构成监视码组,只要X个分离的奇偶校验组中的任意一个不符合校验要求就认为整个块是误码块EB。误块秒 ES当某1秒钟时间内出现1个或1个以上的 误码块时,就叫做一个误块秒。(G.826)误块秒比 ESR在规定测量间隔内出现的ES与总的可用时间之比。

26、(G.826)严重误块秒 SES某1秒内包含有不少于30%的误码块或者至少出现1个严重扰动期(SDP事件)。(G.826)误块率大于10E-3的秒。(G.821),误码的相关概念,连续严重误块秒 CSES表示连续的X个SES,X介于29之间。(G.826)严重误块秒比 SESR在规定测量时间内出现的SES数与总的可用时间之比。(G.826)背景块误码 BBE是指扣除不可用时间和SES期间所有的误码块以后所剩下的误码块。(G.826),误码的相关概念,背景块差错比 BBERBBE数与扣除不可用时间和SES期间所有块数后的总块数之比。BBER=背景误码块/(无误码块+背景误码块)(G.826)严重

27、扰动期 SDP事件对于中断业务(OOS:out-of-service)测量,在最少等效于4个连续块的时间内,如果所有连续块的BER10-2或出现信号丢失,则认为出现1个SDP事件。(G.826),与误码相关的性能告警事件,为什么再生段的性能事件和误码告警没有回告事件?,误码专题类,误码相关概念误码问题的处理,误码问题产生的实际原因,对于线路上的B1、B2、B3、V5误码产生的可能原因如下:接收信号衰减偏大光纤头不清洁光纤连接器松动或未插好光衰减器的衰减值过大或过小对端站发送部分故障本站接收部分故障,如果是B2、B3、V5误码首先考虑是否是由更高级别的误码引起的。,误码问题的处理,误码问题的分析

28、处理思路:,由于高阶误码会导致低阶误码,因此我们在处理误码问题时,应按照先高阶、后低阶的顺序来进行处理。若本端上报BBE性能事件,则表示本端接收侧检测到了误码,远端发和本端收之间的通道存在问题。若本端上报FEBBE性能事件,则表示远端接收侧检测到了误码,本端发和远端收之间的通道存在问题。,光传输设备误码的处理,误码问题的分析处理方法,告警性能分析法,逐段环回法,替换法,经验法,光传输设备误码的处理,分析处理步骤,首先排除外部的故障因素,接着观察线路板误码情况,若某站所有线路板都有误码,则可能是该站时钟板问题,更换时钟板,若只是某块线路板报误码,则可能是本站线路板问题,也可能是对端站或光纤的问题

29、,若只有支路误码(低端设备),则可能是本站交叉板或支路板,或上游站交叉板有问题,光传输设备误码的处理,故障定位手段检查设备/机房温度(风扇)、(时钟跟踪设置情况)分析告警/性能事件发生的时间、频度、误块数量。分析告警和性能事件的时间和数量的相关性。(最好能给出受误码影响的业务通道路径图)光板对调纤芯对调检查尾纤/中继电缆、ODF(法兰盘)、DDF环回法、经验处理法,误码类故障,是否所有站都有B1、B2误码,检查环境温度,是,否,时钟/交叉问题,是否仅本站有B1、B2误码,是,光功率问题,检查本站或上游站光纤、光板,否,是否有高阶B3误码,是,本站或上游站线路/交叉/时钟故障,否,是否有V5误码

30、,是,本站或上游站支路/交叉/时钟故障,否,仪表测试有误码、性能上报无误码,是,DDF/电缆接地问题,定位步骤,误码类故障,网络配置网元1为中心节点,其他点均与网元1有业务 其他各点之间没有业务,故障描述网元3东向有大量RSBBE、MSBBE、HPBBE网元4西向有MSFEBBE、HPFEBBE、LPFEBBE网元1有LPBBE,?,案例1:无保护链,1,2,3,4,w,w,w,w,E,E,LPBBE,LPFEBBE,RSBBEMSBBEHPBBE,MSFEBBEHPFEBBE,排除外部故障(电磁干扰、温度),性能事件分析,LPBBE 为1收4误码,RSBBE/MSBBE/HPBBE 为从4到

31、3光路误码,高阶误码导致低阶误码,继续,故障在3与4之间,告警性能分析,误码类故障,1,2,3,4,w,w,w,w,E,E,LPBBE,LPFEBBE,RSBBEMSBBEHPBBE,MSFEBBEHPFEBBE,解决问题,继续,检查3、4风扇和温度,正常,是,否,正常,是,否,替换光纤、接头、法兰盘、单板,用仪表测试光功率(通过性能查询),告警性能分析,替换法,误码类故障,1,2,3,4,w,w,w,w,E,E,LPBBE,LPFEBBE,RSBBEMSBBEHPBBE,MSFEBBEHPFEBBE,在网元1接误码仪,在网元3东向做光/电口内环回,环回、替换法,正常,网元4西向光板/XCS,不正常,网元3东向光板/XCS,网元4交叉主备倒换,网元3交叉主备倒换,正常,不正常,XCS故障,光板故障,正常,不正常,XCS故障,光板故障,误码类故障,谢谢,THANKS,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号