OptiX-SDH故障分析及处理方法专题课件.ppt

上传人:小飞机 文档编号:1286816 上传时间:2022-11-04 格式:PPT 页数:62 大小:1.64MB
返回 下载 相关 举报
OptiX-SDH故障分析及处理方法专题课件.ppt_第1页
第1页 / 共62页
OptiX-SDH故障分析及处理方法专题课件.ppt_第2页
第2页 / 共62页
OptiX-SDH故障分析及处理方法专题课件.ppt_第3页
第3页 / 共62页
OptiX-SDH故障分析及处理方法专题课件.ppt_第4页
第4页 / 共62页
OptiX-SDH故障分析及处理方法专题课件.ppt_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《OptiX-SDH故障分析及处理方法专题课件.ppt》由会员分享,可在线阅读,更多相关《OptiX-SDH故障分析及处理方法专题课件.ppt(62页珍藏版)》请在三一办公上搜索。

1、OptiX SDH故障分析与处理方法专题,熊世荣 31138,OptiX SDH故障分析与处理方法专题熊世荣 31138,Page 2,前言,基于OptiX SDH故障维护,开发此课程。 本课程旨在通过介绍一些故障定位的方法帮助故障维护人员分析定位故障,通过一些典型的故障来阐述常用故障定位方法的应用。,Page 2前言基于OptiX SDH故障维护,开发此课程。,Page 3,课程目标,学习完此课程,您应能:掌握故障定位基本思路及方法掌握SDH 告警分析(常见导致业务中断告警的原因和解决方法)了解典型故障的分析处理,Page 3课程目标学习完此课程,您应能:,Page 4,内容介绍,故障处理思

2、路与方法常见告警分析典型故障分析,Page 4内容介绍故障处理思路与方法,Page 5,故障定位前的准备,掌握专业技能熟悉SDH原理知识了解传输系统告警信号流及告警产生机理熟悉传输设备和网管的基本操作熟悉常用仪表的基本操作,熟悉工程组网信息网络拓扑业务配置设备运行状态工程文档做好故障现场数据的采集与保存,Page 5故障定位前的准备掌握专业技能熟悉工程组网信息,Page 6,故障定位基本原则,故障定位的关键是什么?,将故障准确定位到单站,Page 6故障定位基本原则故障定位的关键是什么?将故障准确,Page 7,故障定位基本原则,先高速部分,后低速部分,先定位外部,后定位传输,先定位单站,后定

3、位单板,先分析高级别告警,后分析低级别告警,Page 7故障定位基本原则先高速部分,后低速部分先定位外部,Page 8,故障分析方法,环回法,替换法,配置数据分析法,更改数据配置法,告警、性能分析法,仪表测试法,经验处理法,Page 8故障分析方法环回法替换法配置数据分析法更改数据配,Page 9,故障处理方法(告警、性能分析法),通过设备告警指示灯获取告警信息,一、通过机柜顶部的告警指示灯查看告警二、通过单板告警指示灯查看告警,设备指示灯仅反映设备当前的运行状态,对于设备曾经出过故障,无法表示设备指示灯状态只能反映设备告警级别,而不能准确告知具体告警,缺点,适用于设备维护人员配合处理故障时使

4、用,Page 9故障处理方法(告警、性能分析法) 通过设备告警指,Page 10,故障处理方法(告警、性能分析法),通过网管获取告警和性能信息,适用于网管维护人员处理故障使用,全面性,不仅仅是一个站、一块板的故障信息,而且是全网设备的故障信息,详实性,能够获取设备当前存在哪些告警、告警发生时间,以及设备的历史告警;能够获取设备性能事件的具体数值,Page 10故障处理方法(告警、性能分析法)通过网管获取告,Page 11,故障处理方法(告警、性能分析法),应用举例,A,B,C,D,R_LOSTU_AIS,MS_RDIHP_RDILP_RDI,无,无,分析: 因网元B有R_LOS,从而网元A相应

5、光路有MS_RDI、HP_RDI; 因网元B有TU_AIS,并且TU_AIS业务是与网元A业务,从而网元A 相应通道有LP_RDI; 网元B的R_LOS告警会导致TU_AIS;结论:所有告警均由网元B的R_LOS引起,说明A到B传输方向光路故障。,Page 11故障处理方法(告警、性能分析法)应用举例ABC,Page 12,故障处理方法(环回法),线路,线路,内环回,外环回,SDH网元设备,支路,支路,软件环回/硬件环回 内环回/外环回 线路环回/支路环回 端口环回/VC4环回,线路环回可能导致该线路其他在用业务中断,部分单板不支持软件的VC4环回,请查阅相应的使用手册,Page 12故障处理

6、方法(环回法)线路线路内环回外环回SD,Page 13,4.初步定位单板问题,“环回法”的步骤:,1.环回业务通道采样,2.画业务路径图,3.逐段环回,定位故障站点,故障处理方法(环回法),Page 13 4.初步定位单板问题“环回法”的步骤:1.,Page 14,故障处理方法(环回法),一、环回业务通道采样:,1、从多个有故障的站点中选择一个站点;2、从所选择站点的多个故障业务通道中选择其中的一个业务通道。由于自环第一个VC4通道,可能会影响ECC通信,因此尽量不要选择第一个VC4通道内的业务。,举例,Page 14故障处理方法(环回法)一、环回业务通道采样:1,Page 15,故障处理方法

7、(环回法),画出所采样业务一个方向的路径图。在路径图中表示出:该业务的源和宿,该业务所经过的站点,该业务所占用的VC4通道和时隙。,二、画业务路径图:,例如:,Page 15故障处理方法(环回法)画出所采样业务一个方向的,Page 16,故障处理方法(环回法),依据中断业务的路径图,在3号站第1块支路板的第1个2M通道外接一个2M误码仪,监测业务好坏。,三、逐段环回,定位故障站点,四、根据环回现象初步定位故障单板,Page 16故障处理方法(环回法)依据中断业务的路径图,在,Page 17,故障处理方法(替换法),适用场合,排除传输外部设备的问题 故障定位到单站后,怀疑单站内单板或附件有 问题

8、,替换法就是使用一个工作正常的物件去替换一个被怀疑工作不正常的物件,可替换物件包括线缆、光纤、法兰盘、电源、单板、设备等。,Page 17故障处理方法(替换法)适用场合 排除传输,Page 18,故障处理方法(替换法),应用举例,业务配置:2-PQ1板63个2M配置双向业务到5-S16做单站调试,使用设备为2500+。故障描述:2-PQ1板第40个2M上报T_ALOS告警,其他2M通道正常。通过网管对第40个2M做内环回,T_ALOS消失。DDF架 环回故障依然存在。,Page 18故障处理方法(替换法)应用举例业务配置:2-P,Page 19,故障处理方法(配置数据分析法),适用场合,故障定

9、位到单站后,用以进一步定位故障 特定告警,如:HP_TIM、HP_SLM等,HP_TIM:J1字节设置 HP_SLM:C2字节设置 TU_AIS/AU_AIS:SDH业务配置 TPS倒换下业务中断:检查TPS保护设置 MSP环倒换下业务中断:MSP节点参数设置 SNCP环倒换下业务中断:通道保护属性设置,Page 19故障处理方法(配置数据分析法)适用场合 故障定,Page 20,故障处理方法(配置数据分析法),A,B,C,应用举例,VC4,(开销穿通),(开销终结),(开销终结),HP_SLM,分析:1、HP_SLM告警与C2字节相关,为实收C2与应收C2不匹配;2、网元B开销穿通,对C2字

10、节做穿通处理;处理步骤:1、检查网元C接受方向的应收/实收C2字节;2、检查网元A发送方向的应发C2字节;,Page 20故障处理方法(配置数据分析法)ABC应用举例V,Page 21,故障处理方法(更改配置法),适用场合,有空余时隙、通道或槽位 一个VC4中部分时隙业务中断情况,更改时钟配置:时钟告警、指针调整更改板位配置:怀疑单板或是母板槽位故障更改时隙配置:将故障定位到单站 判定线路或支路故障更改单板参数配置:以太网故障、对接故障,Page 21故障处理方法(更改配置法)适用场合 有空余时,Page 22,故障处理方法(更改配置法),故障描述:1、网元C收网元A方向所有2M业务中断;2、

11、其他网元业务正常;可能原因:C站PQ1故障A站3-PQ1故障,应用举例,A,B,C,D,2-PQ1:30E13-PQ1:40E13-PQ1:20E1,30E1,1VC4:130,40E1,2VC4:140,20E1,2VC4:4160,TU_AIS,LP_RDI,w,w,w,w,e,e,如何将故障 定位到单站?,Page 22故障处理方法(更改配置法)故障描述:应用举例A,Page 23,故障处理方法(更改配置法),配置一条从网元A到网元B的E1业务,使用第二个VC4,应用举例,A,B,C,D,2-PQ1:30E13-PQ1:40E13-PQ1:20E1,30E1,1:VC4,40E1,2:V

12、C4,20E1,2:VC4,TU_AIS,LP_RDI,w,w,w,w,e,e,网元B有TU_AIS,无任何告警,网元APQ1板故障,网元CPQ1板故障,Page 23故障处理方法(更改配置法)配置一条从网元A到网,Page 24,故障处理方法(仪表测试法),适用场合,排除传输设备外部问题 设备对接问题 设备性能指标问题,光功率计:R_LOS、R_LOF万用表:接地或是电压问题SDH分析仪:误码等问题,Page 24故障处理方法(仪表测试法)适用场合 排除传输,Page 25,故障处理方法(仪表测试法),故障描述:B站收R_LOS可能原因:A到B方向光纤故障A站光板发送故障B站光板接收故障,应

13、用举例,A,B,R_LOS,w,w,测试A发送光功率,异常,A站光板发送故障,测试B接收光功率,正常,正常,异常,B站光板接收故障,A发B光纤故障,Page 25故障处理方法(仪表测试法)故障描述:应用举例A,Page 26,故障处理方法(经验法),适用场合,仅做为应急处理时使用,临时恢复业务,复位单板单站重启重新下发配置将业务倒到备用通道,该方法不能彻底查清故障原因,除非不得已,建议使用其他方法,Page 26故障处理方法(经验法)适用场合 仅做为应急,Page 27,故障处理方法,Page 27故障处理方法方法适用范围特点告警、性能分析法通,Page 28,本节我们主要学习了:故障处理基本

14、思路故障处理各种方法及其比较,小结,Page 28本节我们主要学习了:小结,Page 29,内容介绍,故障处理思路与方法常见告警分析典型故障分析,Page 29内容介绍故障处理思路与方法,Page 30,设备常见告警分析,SDH接口板常见告警,SL64、S16、SL4、SLQ4、SD4、SL1、SQ1、SQE 等单板,1,.,R,-,L,O,S,告,警,:,接,收,侧,数,据,信,号,丢,失,,,是,最,常,见,的,告,警,。,一,般,是,光,纤,断,或,光路衰耗过大。,2,.,R,-,L,O,F,告,警,:,在,接,收,端,检,测,到,定帧,字,节,A,1,f,6,H,、,A,2,2,8,H

15、,,,说,明,接,收,侧,帧同,步,丢,失,。,一,般,由,光板,故,障,或,光,路,故,障引,起。,Page 30设备常见告警分析 SDH接口板常见告警SL64,Page 31,设备常见告警分析,SDH接口板常见告警,Page 31设备常见告警分析SDH接口板常见告警3.B2-,Page 32,设备常见告警分析,SDH接口板常见告警,5,.,M,S,-,A,I,S,告,警,:,检,测,接,收,到,的,复,用,段,开,销,字,节,K,2,(,b,i,t,6,、,7,、,8,),=,1,1,1,时,,,上,报,此,告,警,。,告,警,含,义,是,整,个,S,T,M,-,N,帧,内,除,S,T,M

16、,-,N,R,S,O,H,外,全,部,为,“,1,”,。,一,般,由,R,-,L,O,S,告,警,引起或上游站传递过来。,6.MS-RDI告警:,检,测,接,收,到,的,复,用,段,开,销,字,节,K,2,(,b,i,t,6,、,7,、,8,),=,1,1,0,。,一,般,由,下,游,站,回,告,上,来,,,表,示,下,游,站,接,收,到,的,本,站,信,号,有,故,障,,,说,明,本,站,至,对,端,线,路板之间有问题。,Page 32设备常见告警分析SDH接口板常见告警5. MS,Page 33,设备常见告警分析,SDH接口板常见告警,Page 33设备常见告警分析7.AU-AIS 告警:

17、某个A,Page 34,设备常见告警分析,9.AU-LOP告警:,检测到AU指针H1、H2字,节非法。常见的是业务时隙,冲突。,10.HP-TIM告警:,高,阶,通,道,追,踪,识,别,符,失,配,告,警,,,一,般,由,两,端,光,板,的,追,踪,识,别,符,不,一,致,引,起,。,该,告,警,不,一,定,影,响业务。,SDH接口板常见告警,Page 34设备常见告警分析9.AU-LOP告警:检测到A,Page 35,设备常见告警分析,PDH接口板常见告警PQ1、PD1、PL3等单板1.TU-AIS告警:VC-12和TU-12指针全部为“1”。一般由线路板、交叉板或支路板故障引起,或者业务故

18、障。2.LP-RDI告警:检测接收到的低阶通道开销字节V5(bit8)=1.一般是TU-AIS告警的对告。,Page 35设备常见告警分析 PDH接口板常见告警,Page 36,设备常见告警分析,PDH接口板常见告警3.TU-LOP 告警: 检测到TU指针V1、V2字节非法。一般在下时隙配置或新增时隙配置时发生时隙冲突。4.T-ALOS 告警: 2M模拟信号丢失,一般是未上交换业务或DDF架2M线接触不良,是最常见的告警。5.PS告警: 保护倒换告警。若支路板设置为保护方式,也会出现此告警,一般发生在通道环上(5.0平台一般无此告警)。,Page 36设备常见告警分析 PDH接口板常见告警,P

19、age 37,设备常见告警分析,交叉板常见告警:1、PS告警: 复用段保护倒换告警,或TPS发生保护倒换。2、Hard-Bad:硬件坏告警,需要及时进行更换。3、Temp-Over:工作温度越限告警,影响交叉板正常工作,需及时排除该告警,如清扫防尘网等4、MS-SW:交叉板主备倒换告警(只有2500+设备支持)。5、W_OFFLINE拉手条离位告警(只有10G设备支持)。,Page 37设备常见告警分析交叉板常见告警:,Page 38,设备常见告警分析,时钟板常见告警:1、LTI告警: 如果配置了内部源以外的源,但所有的时钟源都不满足被选条件,时钟工作在保持或自由振荡模式,上报LTI告警。 如

20、果是外部命令(强制或人工倒换)倒换到内部源,不上报该告警。2、SYNC_C_LOS告警: 同步源级别丢失,在非SSM模式下,若配置的时钟源丢失,产生此告警。 3、EXT_SYNC_LOS: 外同步时钟源丢失告警如果优先级表中配置了外部源,当外部源失效后,产生外部源丢失告警。4、SYN_BAD: 同步源劣化。可能是跟踪的时钟源劣化严重或者交叉时钟板本身故障所致。,Page 38设备常见告警分析时钟板常见告警:,Page 39,设备常见告警分析,主控板常见告警:1、WRG_BDTYPE告警: 配置错误告警。实际插的单板与该板位定义的类型不一致。如公务板位定义为OHP类型 ,实际所插板为OHP2板。

21、2、FAN_FAIL告警:风扇失效或风扇电源未开。需要及时处理。3、MAIL_ERR:邮箱故障 。需进一步分析是与那块单板的邮箱通信出现故障,以便及时排除故障。4、NESTATE_INSTALL:网元处于安装态,需要重下配置解决。,Page 39设备常见告警分析主控板常见告警:,Page 40,设备常见告警分析,复用段相关告警:1、APS_INDI:保护倒换指示,说明网络上发生了复用段保护。2、APS_FAIL:保护倒换失败指示,需查询复用段参数、协议状态等信息来进一步定位倒换失败的原因。3、APS_PARA_ERR:ECC复用段校验时,如果节点参数不正确会上报复用段节点参数校验失败。4、AP

22、S_TYPE_ERR:复用段协议类型不匹配,需要统一全网复用段协议类型。,Page 40设备常见告警分析复用段相关告警:,Page 41,本节我们主要学习了:常见告警的分析(产生原因以及相应的解决方法),小结,Page 41本节我们主要学习了:小结,Page 42,内容介绍,故障处理思路与方法常见告警分析典型故障分析,Page 42内容介绍故障处理思路与方法,Page 43,业务中断类故障,外部原因供电电源故障接地故障环境异常光纤、电缆故障人为原因误操作设置了光路或支路通道的环回误操作更改、删除配置数据,设置业务未装载设备本身故障单板失效或性能不好,可能原因,Page 43业务中断类故障外部原

23、因可能原因,Page 44,业务中断类故障,定位方法,告警分析法 更改配置法 逐段环回法 替换法,定位步骤,检查各站登录是否正常 检查有无设备告警,如BD_STATUS、NO_BD_SOFT等 检查保护倒换是否正常 分析故障,通过环回或是更改配置定位到单站 将故障进一步定位并解决,Page 44业务中断类故障定位方法 告警分析法定位步骤,Page 45,TU_AIS,LP_RDI,网络配置网元1为中心节点,为网关网元其他各点之间没有业务,故障描述网元1和网元4 E1业务中断 节点 4:TU_AIS 节点 1: LP_RDI其他各站业务正常,无其他告警,t2:1,t2:1,2:1,2:1,2:1

24、,案例1:无保护链,业务中断类故障,Page 451234wwwwEETU_AISLP_RDI网,Page 46,1,2,3,4,w,w,w,w,E,E,TU_AIS,LP_RDI,t2:1,t2:1,2:1,2:1,2:1,告警查询,网元4有TU_AIS,网元4不能收网元1业务,网元1、2、3间业务正常,检查1到4的业务配置,告警分析步骤,可否做环回操作?,正确,业务中断类故障,Page 461234wwwwEETU_AISLP_RDIt,Page 47,1,2,3,4,w,w,w,w,E,E,误码仪,t2:1,t2:1,2:1,2:1,2:1,对网元2东向2VC4做内环回,正常,故障点在网

25、元1、2,否,是,故障点在网元3、4,在网元3东向对2VC4做内环回,正常,故障点在网元3,否,是,故障点在网元3或网元4,用尾纤在网元3东向做内环回,正常,故障在网元3东向光板,否,是,故障在网元4,业务中断类故障,Page 471234wwwwEE误码仪t2:1t2:12:,Page 48,1,2,3,4,w,w,w,w,E,E,TU_AIS,LP_RDI,t2:1,t2:1,2:1,2:1,2:1,故障定位到单站,可能LU/TU/XC 故障,业务正常,TU故障,更换TU,是,否,XCS主备倒换,TPS 倒换,业务正常,XCS故障,更换XCS,是,否,LU故障,更换LU,若无TPS或XCS

26、主备怎么办?,业务中断类故障,Page 481234wwwwEETU_AISLP_RDIt,Page 49,业务中断类故障,w,SNCP Ring,e,e,e,e,w,w,w,3,2,4,1,案例2:SNCP 环,网络配置网元1为中心节点,各点有和网元1的业务 其他各点间无业务往来,故障描述 网元1和网元4间2M业务中断 网元 1, 4: TU_AIS 其他各站业务正常,TU_AIS,TU_AIS,Page 49业务中断类故障wSNCP Ringeeeeww,Page 50,告警/性能分析,断开网元1和4光纤,转化为链处理,w,SNCP Ring,e,e,e,e,w,w,w,3,2,4,1,同

27、上一案例,处理方法,检查配置数据是否正确,TU_AIS,TU_AIS,业务中断类故障,先强制倒换以尽快恢复业务,Page 50告警/性能分析断开网元1和4光纤,转化为链处理,Page 51,w,MSP RingSTM-4,e,e,e,e,e,w,w,w,w,3,2,4,5,1,案例3:MSP 环,网络配置网元1为中心节点,各站均有到网元1的业务其他各站之间没有业务业务均按最短路径配置,故障描述 网元2与网元3之间光纤断 R_LOS网元1与网元3之间E1业务中断 网元1, 3: TU_AIS其他业务正常,TU_AIS,TU_AIS,R_LOS,R_LOS,业务中断类故障,Page 51wMSP

28、Ringeeeeewwww32451,Page 52,w,MSP RingSTM-4,e,e,e,e,e,w,w,w,w,3,2,4,5,1,R_LOS,R_LOS,APS_INDI TU_AIS,APS_INDI,S,S,P,P,P,查询告警,检查倒换状态,正常,APS协议是否启动?,是,否,画倒换后的信号流,更换故障单板,重新下发MSP参数配置,倒换状态正常?,否,是,重启APS协议,倒换状态正常,否,是,逐段环回定位故障到XCS/LU,是,否,启动协议,TU_AIS,业务中断类故障,Page 52wMSP Ringeeeeewwww32451,Page 53,业务中断类故障,w,MSP

29、RingSTM-4,e,e,e,e,e,w,w,w,w,3,2,4,5,1,R_LOS,R_LOS,APS_INDI TU_AIS,TU_AIS,APS_INDI,S,S,P,P,P,倒换前路由,倒换后路由,对于比较长的链,建议采用二分法进行环回,Page 53业务中断类故障wMSP Ringeeeeeww,Page 54,误码类故障,可能原因,外部原因光功率问题接地故障环境温度电缆故障设备外部干扰(瞬时大误码)人为原因时钟配置错误设备本身故障单板失效或性能不好(交叉、时钟、线路、支路),Page 54误码类故障可能原因外部原因,Page 55,误码类故障,是否所有站都有B1、B2误码,检查环

30、境温度,是,否,时钟/交叉问题,是否仅本站有B1、B2误码,是,光功率问题,检查本站或上游站光纤、光板,否,是否有高阶B3误码,是,本站或上游站线路/交叉/时钟故障,否,是否有V5误码,是,本站或上游站支路/交叉/时钟故障,否,仪表测试有误码、性能上报无误码,是,DDF/电缆接地问题,定位步骤,Page 55误码类故障是否所有站都有B1、B2误码检查环境,Page 56,误码类故障,网络配置网元1为中心节点,其他点均与网元1有业务 其他各点之间没有业务,故障描述网元3东向有大量RSBBE、MSBBE、HPBBE网元4西向有MSFEBBE、HPFEBBE、LPFEBBE网元1有LPBBE,?,案

31、例1:无保护链,Page 56误码类故障1234wwwwEELPBBELPF,Page 57,1,2,3,4,w,w,w,w,E,E,LPBBE,LPFEBBE,RSBBEMSBBEHPBBE,MSFEBBEHPFEBBE,排除外部故障(电磁干扰、温度),性能事件分析,LPBBE 为1收4误码,RSBBE/MSBBE/HPBBE 为从4到3光路误码,高阶误码导致低阶误码,继续,故障在3与4之间,告警性能分析,误码类故障,Page 571234wwwwEELPBBELPFEBBER,Page 58,1,2,3,4,w,w,w,w,E,E,LPBBE,LPFEBBE,RSBBEMSBBEHPBBE

32、,MSFEBBEHPFEBBE,解决问题,继续,检查3、4风扇和温度,正常,是,否,正常,是,否,替换光纤、接头、法兰盘、单板,用仪表测试光功率(通过性能查询),告警性能分析,替换法,误码类故障,Page 581234wwwwEELPBBELPFEBBER,Page 59,1,2,3,4,w,w,w,w,E,E,LPBBE,LPFEBBE,RSBBEMSBBEHPBBE,MSFEBBEHPFEBBE,在网元1接误码仪,在网元3东向做光/电口内环回,环回、替换法,正常,网元4西向光板/XCS,不正常,网元3东向光板/XCS,网元4交叉主备倒换,网元3交叉主备倒换,正常,不正常,XCS故障,光板故障,正常,不正常,XCS故障,光板故障,误码类故障,Page 591234wwwwEELPBBELPFEBBER,Page 60,本节我们主要学习了:业务中断类故障产生原因以及相关故障分析误码类故障产生原因以及相关故障分析,小结,Page 60本节我们主要学习了:小结,Page 61,本课程我们主要学习了:故障定位基本思路和方法常见告警原因分析典型故障的分析处理,总结,Page 61本课程我们主要学习了:总结,OptiX-SDH故障分析及处理方法专题课件,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号