PTN常见故障处理(I)幻灯片.ppt

上传人:小飞机 文档编号:5445709 上传时间:2023-07-07 格式:PPT 页数:67 大小:1.23MB
返回 下载 相关 举报
PTN常见故障处理(I)幻灯片.ppt_第1页
第1页 / 共67页
PTN常见故障处理(I)幻灯片.ppt_第2页
第2页 / 共67页
PTN常见故障处理(I)幻灯片.ppt_第3页
第3页 / 共67页
PTN常见故障处理(I)幻灯片.ppt_第4页
第4页 / 共67页
PTN常见故障处理(I)幻灯片.ppt_第5页
第5页 / 共67页
点击查看更多>>
资源描述

《PTN常见故障处理(I)幻灯片.ppt》由会员分享,可在线阅读,更多相关《PTN常见故障处理(I)幻灯片.ppt(67页珍藏版)》请在三一办公上搜索。

1、2023/7/7,PTN常见故障处理,Page 2,目录,Tunnel/PW故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 3,常见故障定位流程,业务Tunnel链路,Page 4,故障定位信息收集,(1)该业务是创建后一直没有通,还是历史上通,突然间不通。(2)该业务端到端的完整路径,包括源节点、目的节点、transt节点。(3)完整的业务定位信息,包括业务ID,业务属性。(4)业务的源宿端口信息。(5)业务所在的Tunnel和PW信息。(6)业务涉及的保护信息。

2、(7)当前告警信息。(8)各种相关性能计数(如业务涉及的端口性能计数,业务本身的性能计数等)。,Page 5,目录,Tunnel/PW故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 6,CES业务故障定位流程,Page 7,CES业务常见故障现象,Page 8,CES业务常见故障现象(续),Page 9,CES业务故障常见原因,原因1:单板硬件故障、温度过高或板间通信故障,无法正常工作。原因2:处理板、接口板的接口接入的信号丢失或恶化。原因3:承载CES 业务的Tu

3、nnel 或PW 中断。原因4:网元的同步时钟源级别丢失,或同步时钟源丢失。原因5:承载CES 业务的PW 在单位时间内丢包数、错包数或抖动缓冲超过阈值。,Page 10,CES业务常见故障处理方法,原因1:单板硬件故障、温度过高或板间通信故障,无法正常工作。1.查询系统当前告警,是否有HARD_BAD、TEMP_OVER、COMMUN_FAIL 或BUS_ERR 告警,并确定上报告警的单板。2.参考告警和性能事件参考手册,处理HARD_BAD、TEMP_OVER、COMMUN_FAIL 或BUS_ERR 告警,排除故障。原因2:处理板、接口板的接口接入的信号丢失或恶化。1.查询系统是否有T_

4、ALOS、UP_E1_AIS 或DOWN_E1_AIS 告警,处理T_ALOS、UP_E1_AIS 或DOWN_E1_AIS 告警。2.查询系统是否有R_LOS 告警,处理R_LOS 告警。3.查询系统是否有LASER_MOD_ERR、LSR_WILL_DIE、IN_PWR_ABN、TEM_HA 或LSR_BCM_ALM 告警,处理LASER_MOD_ERR、LSR_WILL_DIE、IN_PWR_ABN、TEM_HA 或LSR_BCM_ALM 告警。,Page 11,CES业务常见故障处理方法(续),原因3:承载CES 业务的Tunnel 或PW 中断。1.查询系统是否存在MPLS_TUNN

5、EL_LOCV 告警。若存在,处理MPLS_TUNNEL_LOCV 告警。2.查询系统是否存在PW_DOWN 告警。若存在,处理PW_DOWN 告警。原因4:网元的同步时钟源级别丢失,或同步时钟源丢失。1.查询系统是否有SYNC_C_LOS 或LTI 告警,处理SYNC_C_LOS 或LTI 告警。原因5:承载CES 业务的PW 在单位时间内丢包数、错包数或抖动缓冲超过阈值。1.查询系统是否有CES_LOSPKT_EXC、CES_MISORDERPKT_EXC 或CES_STRAYPKT_EXC 告警,处理CES_LOSPKT_EXC、CES_MISORDERPKT_EXC 或CES_STRA

6、YPKT_EXC 告警。2.查询系统是否有CES_JTRUDR_EXC 或CES_JTROVR_EXC 告警,处理CES_JTRUDR_EXC 或CES_JTROVR_EXC 告警。,Page 12,ETH业务故障定位流程,Page 13,ETH业务故障常见现象,Page 14,ETH业务故障常见原因,原因1:单板硬件故障、温度过高或板间通信故障,无法正常工作。原因2:接收信号丢失。原因3:以太网网口连接错误,端口协商失败。原因4:端口配置了环回。原因5:接口流量限值配置过低,源宿两端接口配置不一致。,Page 15,ETH业务常见故障处理方法,原因1:单板硬件故障、温度过高或板间通信故障,无

7、法正常工作。1.查询系统当前告警,是否有HARD_BAD、TEMP_OVER、COMMUN_FAIL 或BUS_ERR 告警,并确定上报告警的单板。2.参考告警和性能事件参考手册,处理HARD_BAD、TEMP_OVER、COMMUN_FAIL 或BUS_ERR 告警。原因2:接收信号丢失。1.查询系统是否有ETH_LOS 或ETH_AUTO_LINK_DOWN 告警,处理ETH_LOS 或ETH_AUTO_LINK_DOWN 告警。2.查询系统是否有R_LOS 告警,处理R_LOS 告警。3.查询系统是否有LASER_SHUT 或LSR_WILL_DIE 告警,处理LASER_SHUT或LS

8、R_WILL_DIE 告警。4.查询系统是否有MAC_FCS_EXC 告警,处理MAC_FCS_EXC 告警。,Page 16,ETH业务常见故障处理方法(续),原因3:以太网网口连接错误,端口协商失败。1.查询系统是否有ETH_LINK_DOWN 告警,处理ETH_LINK_DOWN 告警。原因4:端口配置了环回。1.查询系统是否有LOOP_ALM 告警,处理LOOP_ALM 告警。2.查询系统是否有ETH_EFM_LOOPBACK 告警,处理ETH_EFM_LOOPBACK告警。原因5:接口流量限值配置过低,源宿两端接口配置不一致。1.查询系统是否有FLOW_OVER 告警,处理FLOW_

9、OVER 告警。2.查询系统是否有ETH_CFM_UNEXPERI 告警,处理ETH_CFM_UNEXPERI 告警。,Page 17,目录,Tunnel/PW故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 18,Tunnel故障定位流程,Page 19,Tunnel故障常见现象和原因,常见现象 MPLS Tunnel 创建失败,业务不通。MPLS Tunnel 故障,业务中断。保护倒换失败,业务中断或出现丢包、误码。,常见原因 原因1:路由失败。原因2:交叉创建失

10、败。原因3:Tunnel 所在的物理链路故障。原因4:保护倒换失败。,Page 20,Tunnel常见故障处理方法,原因1:路由失败。1.对照网络规划,检查Tunnel 两端端口参数配置是否正确,例如端口IP。修正不正确的端口参数后,再次创建Tunnel。2.检查Tunnel 首末节点所在的网元间是否存在完整可达的链路。若不存在,修复链路中残缺或故障的部分。3.可选:确认动态Tunnel 配置的“Route Constraint”条件和“Color”(亲和属性)是否正确。修正不正确的参数信息,具体操作请参见使用路径方式创建动态MPLS Tunnel 和FRR 保护。4.可选:如果Tunnel

11、配置了带宽,检查链路带宽是否满足Tunnel 的要求。原因2:交叉创建失败。1.检查网络中是否存在不同的网元使用相同的网段。如果存在,需要修改端口IP地址。2.检查Tunnel 是否配置了不兼容的保护特性。详细内容请参见版本说明书。3.查看Tunnel 所经过的网元或单板,确认已创建Tunnel 个数是否已经达到了最大值。如果是,需要重新规划或删除冗余的Tunnel。,Page 21,Tunnel常见故障处理方法(续),原因3:Tunnel 所在的物理链路故障。1.查询系统中是否存在HARD_BAD、R_LOS、ETH_LOS、PPP_LCP_FAIL 或MP_DOWN 等告警,指示Tunne

12、l 使用的物理链路故障。2.若存在,优先处理HARD_BAD、R_LOS、ETH_LOS、PPP_LCP_FAIL 或MP_DOWN 告警。3.查看并处理系统中存在的下列告警:MPLS_TUNNEL_BDI、MPLS_TUNNEL_Excess、MPLS_TUNNEL_FDI、MPLS_TUNNEL_LOCV、MPLS_TUNNEL_MISMATCH、MPLS_TUNNEL_MISMERGE、MPLS_TUNNEL_SD、MPLS_TUNNEL_SF、MPLS_TUNNEL_UNKNOWN4.检查对端设备是否存在单板故障或网元复位等异常状况。排除对端设备的异常情况。原因4:保护倒换失败。1.M

13、PLS APS 保护倒换失败,参考保护故障处理。,Page 22,PW故障常见现象和原因,常见现象 PW 创建失败,业务不通。PW 故障,业务中断或出现丢包、误码。,常见原因 原因1:LDP 会话创建失败,PW 创建不成功(动态)。原因2:物理链路故障,LDP 会话失效。原因3:PW 交叉建立失败。原因4:PW 所在的Tunnel 故障。,Page 23,PW常见故障处理方法,原因1:LDP 会话创建失败,PW 创建不成功(动态)。1.检查PW 两端网元是否配置了LDP 对等体。若未配置,需要重新配置LDP 对等体。2.检查PW 两端参数是否配置正确。例如:“Control Word Use

14、Policy”,是否一端配置为“Must Use”,另一端配置为“Nonuse”。对Ethernet 业务,两端的“MTU”是否配置一致。对CES 业务,两端的“RTP Head”、“Packet Loading Time”等参数是否配置一致。原因2:物理链路故障,LDP 会话失效。1.检查PW 首末节点间物理链路是否正常,系统中是否存在HARD_BAD、LASER_MOD_ERR、R_LOS 或ETH_LOS 等告警。2.若存在,优先处理HARD_BAD、LASER_MOD_ERR、R_LOS 或ETH_LOS告警。3.查询并处理系统中存在的PW_DOWN、PW_DROPPKT_EXC 或P

15、W_EXC_TRAFFIC 告警。4.检查对端设备是否存在单板故障或网元复位等异常状况。排除对端设备的异常情况。,Page 24,PW常见故障处理方法(续),原因3:PW 交叉建立失败。1.查看PW 所经过的网元或单板,确认已创建PW 个数是否已经达到了最大值。如果是,需要重新规划或删除冗余的PW。原因4:PW 所在的Tunnel 故障。1.Tunnel 故障,参考Tunnel故障处理。,Page 25,目录,Tunnel故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Pag

16、e 26,链路故障定位流程,Page 27,BTS 1,CES,CES,BTS 2,PTN,PTN,ETH链路告警排查,ETH,BTS 3,PTN,MPLS,PTN,PTN,MPLS,PTN,BSC,CoreNetwrok,PTN,BSC,10G/GE,GE/FE,STM-1,STM-1,10G/GE,ETH_LOS光信号丢失,故障原因:(1)光纤断;(2)光模块坏;(3)光衰减过大;,ETH_LINK_DOWN网口连接故障,故障原因:两端工作模式不一致,造成协商失败;电缆、光纤连接或者对端设备故障。,MAC_FCS_EXC误码越限,故障原因:MAC层检测到误码越限;线路信号劣化;光纤性能劣化

17、;光口不洁净,Page 28,BTS 1,CES,CES,BTS 2,PTN,PTN,SDH链路告警排查,ETH,BTS 3,PTN,MPLS,PTN,PTN,MPLS,PTN,BSC,CoreNetwrok,PTN,BSC,GE,GE/FE,STM-1,STM-1,GE/10GE,R_LOS光信号丢失,故障原因:(1)断纤;(2)线路衰耗过大;(3)对端站发送部分故障,线路发送失效;,R_LOC时钟丢失,故障原因:(1)接收到的信号失效;(2)时钟提取模块故障;,R_LOF帧丢失,故障原因:(1)接收信号衰减过大;(2)对端站发送信号无帧结构;(3)本板接收方向故障,Page 29,BTS

18、1,CES,CES,BTS 2,PTN,PTN,E1链路告警排查,ETH,BTS 3,PTN,MPLS,PTN,PTN,MPLS,PTN,BSC,CoreNetwrok,PTN,BSC,GE/10GE,GE/FE,STM-1,STM-1,GE/10GE,T_ALOS信号丢失,故障原因:(1)E1/T1业务未接入;(2)DDF架侧E1/T1接口输出端口脱落或松动;(3)本站E1/T1接口输入端口脱落或松动;(4)单板故障;(5)电缆故障,ALM_E1RAI远端告警指示,故障原因:对端有告警;,Page 30,MLPPP故障定位流程,Page 31,MLPPP故障常见现象,Page 32,MLPP

19、P故障常见原因,原因1:MP 组失效。原因2:MP 组成员端口接收信号丢失。原因3:高阶通道或低阶通道失效。原因4:MP 组成员两端协议协商失败。原因5:MP 组成员延时超过阈值。原因6:业务通道误码超限。,Page 33,MLPPP常见故障处理方法,原因1:MP 组失效。1.查询是否存在MP_DOWN 告警,参考告警和性能事件参考手册,清除MP_DOWN 告警。原因2:MP 组成员端口接收信号丢失。1.检查MP 组各成员是否存在R_LOS、MS_AIS 或T_ALOS 告警,清除R_LOS、MS_AIS 或T_ALOS 告警。原因3:高阶通道或低阶通道失效。1.检查MP 组各成员是否存在HP

20、_SLM 或HP_UNEQ 告警。若存在,清除HP_SLM 或HP_UNEQ 告警。2.检查MP 组各成员是否存在TU_AIS_VC12 或TU_LOP_VC12 告警。若存在,清除TU_AIS_VC12 或TU_LOP_VC12 告警。,Page 34,MLPPP常见故障处理方法(续),原因4:MP 组成员两端协议协商失败。1.检查MP 组各成员是否存在PPP_LCP_FAIL 或PPP_NCP_FAIL 告警。若存在,修改MP 组成员两端配置,清除PPP_LCP_FAIL 或PPP_NCP_FAIL告警。原因5:MP 组成员延时超过阈值。1.检查MP 组是否存在MP_DELAY 告警,清除

21、MP_DELAY 告警。原因6:业务通道误码超限。1.检查MP 组各成员是否存在B1_EXC、B2_EXC、B3_EXC 或BIP_EXC 等告警,清除B1_EXC、B2_EXC、B3_EXC 或BIP_EXC 告警。,Page 35,目录,Tunnel故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 36,APS故障定位流程,Page 37,APS故障常见现象,Page 38,APS故障常见原因,原因1:APS 保护组两端配置不一致。原因2:APS 保护组两端协议状

22、态未激活。原因3:光纤或电缆连接错误。原因4:保护通道所在单板存在硬件类告警,无法发送APS 帧。原因5:系统存在时钟类告警。原因6:工作Tunnel 或保护Tunnel 故障。,Page 39,APS常见故障处理方法,原因1:APS 保护组两端配置不一致。1.查询是否存在ETH_APS_PATH_MISMATCH 或ETH_APS_TYPE_MISMATCH 告警,参考告警和性能事件参考手册,清除告警。原因2:APS 保护组两端协议状态未激活。1.检查APS 保护组是否存在ETH_APS_LOST 或ETH_APS_SWITCH_FAIL 告警,清除告警。原因3:光纤或电缆连接错误。1.检查

23、光纤或电缆连接是否正确,若不正确,重新连接光纤或电缆。,Page 40,APS常见故障处理方法(续),原因4:保护通道所在单板存在硬件类告警,无法发送APS 帧。1.检查APS 保护通道所在单板是否存在HARD_BAD、COMMUN_FAIL 或BUS_ERR 等硬件类告警,若存在,清除告警后,查看APS 保护组是否能够正常倒换。原因5:系统存在时钟类告警。1.检查系统是否存在TR_LOC、SYNC_C_LOS 或LTI 等时钟类告警,若存在,清除告警后,查看APS 保护组是否能够正常倒换。原因6:保护Tunnel 故障。1.检查工作Tunnel 或保护Tunnel 是否存在Tunnel 级别

24、的告警,若存在,则该Tunnel 已失去保护能力,优先清除该Tunnel 存在的告警后,查看APS保护组是否能够正常倒换。,Page 41,LMSP故障定位流程,Page 42,LMSP故障常见现象,Page 43,LMSP故障常见原因,原因1:保护通道单板故障或单板离线,无法正常工作。原因2:保护通道接收侧信号丢失或不可用。原因3:线性复用段单双端模式不匹配。原因4:K1、K2 字节失配或K2 字节失配。原因5:保护通道接收信号中复用段B2 信号劣化或误码过量。,Page 44,LMSP常见故障处理方法,原因1:保护通道单板故障或单板离线,无法正常工作。1.查询系统当前告警,是否有HARD_

25、BAD 或BD_STATUS 告警,并确定上报告警的单板,参考告警和性能事件参考手册,处理HARD_BAD 或BD_STATUS 告警。原因2:保护通道接收侧信号丢失或不可用。1.查询系统是否有R_LOS 或R_LOF 告警,处理R_LOS 或R_LOF 告警。2.查询系统是否有MS_AIS 告警,处理MS_AIS 告警。原因3:线性复用段单双端模式不匹配。1.查询系统是否有LPS_UNI_BI_M 告警,处理LPS_UNI_BI_M 告警。原因4:K1、K2 字节失配或K2 字节失配。1.查询系统是否有K1_K2_M 或K2_M 告警,处理K1_K2_M 或K2_M 告警。原因5:保护通道接

26、收信号中复用段B2 信号劣化或误码过量。1.查询系统是否有B2_SD 或B2_EXC 告警,处理B2_SD 或B2_EXC 告警。,Page 45,LAG故障定位流程,Page 46,LAG故障常见现象,Page 47,LAG故障常见原因,原因1:聚合组两端网元配置错误。原因2:聚合组成员端口工作模式设置为半双工。原因3:聚合组成员端口配置了环回。原因4:聚合组成员端口连接故障或丢失。,Page 48,LAG常见故障处理方法,原因1:聚合组两端网元配置错误。1.查询当前告警,是否存在LAG_DOWN 或LAG_MEMBER_DOWN 告警。2.检查聚合组两端网元配置是否不一致,若不一致,修改两

27、端网元配置一致后,查看告警是否清除。原因2:聚合组成员端口工作模式设置为半双工。1.检查聚合组各成员端口的工作模式是否设置为半双工,若存在,修改端口工作模式为全双工。原因3:聚合组成员端口配置了环回。1.检查聚合组各成员端口是否存在LOOP_ALM 告警。若存在,重新设置端口的环回状态,清除LOOP_ALM 告警。2.检查聚合组各成员端口是否存在ETH_EFM_LOOPBACK 告警。若存在,禁止远端环回,清除ETH_EFM_LOOPBACK 告警。原因4:聚合组成员端口连接故障或丢失。1.检查聚合组各成员端口是否存在ETH_LOS 或ETH_LINK_DOWN 告警,若存在,参考告警和性能事

28、件参考手册,清除告警。,Page 49,TPS故障定位流程,Page 50,TPS故障常见现象和原因,原因1:工作板故障,触发TPS 保护倒换。原因2:工作板硬复位,触发TPS 保护倒换。原因3:人工下发强制倒换命令。原因4:保护板不在位或故障。原因5:同一TPS 保护组内其它工作板已发生TPS 保护倒换,无空余的保护板。,Page 51,TPS常见故障处理方法,原因1:工作板故障,触发TPS 保护倒换。1.查询当前告警,检查工作板是否存在HARD_BAD 等硬件类告警,若存在,更换上报告警的单板。经过“等待恢复时间”后,业务将自动倒换回工作板。原因2:工作板硬复位,触发TPS 保护倒换。1.

29、在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若是,则该单板处于硬复位状态。2.等待3 至5 分钟,当单板的工作状态转成绿色时,单板完成硬复位。3.再经过“等待恢复时间”后,业务将自动倒换回工作板,TPS 恢复原保护状态。原因3:人工下发强制倒换命令。1.清除倒换,恢复原TPS 保护状态。,Page 52,TPS常见故障处理方法(续),原因4:保护板不在位或故障。1.查询当前告警,检查保护板是否存在BD_STATUS 告警或HARD_BAD 等硬件类告警,若存在,参考告警和性能事件参考手册处理保护板的告警,或更换保护板。原因5:同一TPS 保护组内其它工作板已发生TPS 保护倒换

30、,无空余的保护板。1.查询本网元是否存在TPS_ALM 告警,若存在,说明已有其它工作板触发了TPS 保护倒换,无空余的保护板。2.排除已触发TPS 保护倒换的工作板的故障,使保护板恢复保护状态后,确认是否可正常进行TPS 保护倒换,查看告警是否消除。,Page 53,目录,Tunnel故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 54,时钟故障常见现象和原因,原因1:优先级表中业务板上的同步时钟源级别丢失。原因2:同步时钟源丢失,网元的时钟处于不正常状态。原因3

31、:在SSM 模式下时钟源发生倒换,网元跟踪的时钟源也发生了倒换。原因4:同步时钟源的信号劣化。原因5:外部时钟源丢失。原因6:时钟进入非跟踪工作模式。原因7:外部时间源丢失。,Page 55,时钟常见故障处理方法,原因1:优先级表中业务板上的同步时钟源级别丢失。1.查询系统是否有SYNC_C_LOS 告警,参考告警和性能事件参考手册,处理SYNC_C_LOS 告警。原因2:同步时钟源丢失,网元的时钟处于不正常状态。1.查询系统是否有LTI 告警,处理LTI 告警。原因3:在SSM 模式下时钟源发生倒换,网元跟踪的时钟源也发生了倒换。1.查询系统是否有S1_SYN_CHANGE 告警,处理S1_

32、SYN_CHANGE 告警。原因4:同步时钟源的信号劣化。1.查询系统是否有SYN_BAD 告警,处理SYN_BAD 告警。原因5:外部时钟源丢失。1.查询系统是否有EXT_SYNC_LOS 告警,处理EXT_SYNC_LOS 告警。原因6:时钟进入非跟踪工作模式。1.查询系统是否有CLK_NO_TRACE_MODE 告警,处理CLK_NO_TRACE_MODE 告警。原因7:外部时间源丢失。1.查询系统是否有EXT_TIME_LOC 告警,处理EXT_TIME_LOC 告警。,Page 56,目录,Tunnel故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定

33、位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 57,带内DCN故障定位流程,Page 58,带内DCN故障常见现象和原因,常见原因原因1:全网内的网元ID、网元IP 或者子网掩码存在冲突。原因2:故障网元的带内DCN 端口未使能,或对接端口参数配置不一致。原因3:故障网元与网管之间的物理连接中断。原因4:接收信号丢失或接收光功率过低,无法提取DCN 报文。原因5:单板故障。原因6:DCN 穿越的第三方网络不健康,引入DCN 风暴或DCN 中断。原因7:带内DCN 通道带宽配置过低。原因8:故障网元主控板正在复位或发生了主备倒换,带内DCN 报文

34、得不到响应。,常见现象网管与网元通信中断,网管上网元图标变灰色,网元脱管。网管操作命令没有响应。若响应中断时间持续超过2 分钟,网管与网元通信中断。网管查询信息部分丢失。,Page 59,带内DCN常见故障处理方法,原因1:全网内的网元ID、网元IP 或者子网掩码存在冲突。1.此原因一般由全网中新添加的网元引入。对照网元规划表,检查新网元的网元ID、网元IP、子网掩码的配置是否正确。若配置错误,或与现有网元存在冲突,请正确配置新网元的参数。原因2:故障网元的带内DCN 端口未使能,或对接端口参数配置不一致。1.检查是否存在光纤或电缆连接到默认使能DCN 的端口。如果没有,换用默认使能DCN 的

35、端口。2.检查链路两端的端口是否已使能DNC。如果没有,使能端口的带内DCN。3.检查两端端口的参数配置是否一致,例如以太网端口的工作模式。如果不一致,修改参数配置使两端一致。原因3:故障网元与网管之间的物理连接中断。1.检查故障网元的网线或光纤是否从端口中脱落。如果是,重新插上网线或光纤。原因4:接收信号丢失或接收光功率过低,无法提取DCN 报文。1.检查网元的历史告警中是否存在R_LOS、ETH_LOS 或IN_PWR_ABN 等告警,清除相关告警。,Page 60,带内DCN常见故障处理方法(续),原因5:单板故障。1.查询单板的历史告警中是否存在HARD_BAD 或TEMP_OVER

36、告警,若存在,更换上报告警的单板。原因6:DCN 穿越的第三方网络不健康,引入DCN 风暴或DCN 中断。1.若带内DCN 通信穿越了第三方网络,需要检查第三方网络中是否存在端口环回、物理通道中断等故障。如果存在,需要立即排除第三方网络中的故障。原因7:带内DCN 通道带宽配置过低。1.当端口配置的业务数量超过某一数目时,可能造成部分查询信息丢失,此时需要适当增大带内DCN 通道的带宽配置。原因8:故障网元主控板正在复位或发生了主备倒换,带内DCN 报文得不到响应。1.观察主控板的PROG 指示灯是否处于绿灯闪烁状态,若是,则主控板正处于复位状态。等PROG 指示灯常亮绿色时,主控板完成复位,

37、DCN 将自动恢复连接。2.若DCN 未恢复响应,检查其它单板是否发生保护倒换,造成带内DCN 报文处于重路由状态。3.若存在单板发生保护倒换,等待DCN 完成重路由后,将自动恢复响应。,Page 61,目录,Tunnel故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 62,网元ID 重复导致无法远程登录网元,现象:新建的PTN 网络中,NE01、NE02 和NE03 三个PTN 网元构成链形拓扑。可以从NE02远程登录到NE03,但从NE01 却无法远程登录NE0

38、3。分析:可能原因1:网元NE03 存在硬件故障导致DCN 不通。可能原因2:网络配置错误。处理步骤:1、查询NE03 的相邻网元路由,发现NE03 的直连路由显示为NE01 和NE02 的网元ID。2、复位NE03 后,故障依旧。3、现场调查NE03,发现EFG2 单板的一个光口连接NE02,另一个原本应该是空余的光口,其L/A2 指示灯却在闪烁,证明该光口有数据正在传输。经询问,是客户自行将NE04 网元连接到NE03 上。4、来到NE04 站点,登录NE04 后,发现NE04 的网元ID 与NE01 的网元ID 相同。5、更改NE04 的网元ID 为该网络中未曾使用的ID 号码。再从NE

39、01 远程登录NE03,登录成功。问题解决。,Page 63,光纤错连导致动态MPLS Tunnel 创建失败,现象:在现网上集成业务时,发现有这样两个网元,彼此之间的DCN 通讯正常,但在二者之间的动态Tunnel 却全部创建失败。PING 对端端口的IP 地址,返回“操作超时”。分析:原因1:物理链路故障。原因2:端口IP 地址配置错误。原因3:ARP 协议工作不正常。处理步骤:1、查询系统当前告警,未发现ETH_LOS、ETH_LINK_DOWN 或HARD_BAD 告警,且DCN 通讯正常,可以排除链路、端口或单板等硬件出现了故障。2、查询两个网元端口的IP 地址,均配置正确,而且在同

40、一个网段内。3、查询ARP 表项,发现无法学习到对端端口的“ARP 表项IP”。4、因为两端的DCN 通讯是正常的,从DCN 的连通性着手分析。只有在学习到对方端口的MAC 地址之后,才能开始正常的DCN 通讯。查询后发现宿网元的端口的MAC 地址与网元规划表不一致。5、现场确认,是设备安装时连错了光纤,导致ARP 等协议不能正常工作,动态Tunnel 创建失败。6、按照网元规划表重新连接光纤后,问题解决。,Page 64,激光器状态异常导致LAG 组业务中断,现象:反馈一条LAG(链路聚合组)上的以太网业务突然中断。该LAG 组包括一个主端口,三个从端口。从网管上看,四个端口同时上报LASE

41、R_SHUT告警并且激光器确实无光输出,但该四个端口均已使能。分析:LAG 组检测到单板状态为异常,自动关闭了所有端口的激光器,但无法改变端口的“使能”状态,从而导致激光器状态异常,业务中断。处理步骤:1、检查当前告警,发现有LASER_SHUT 告警,但是检查上报告警的端口的状态为“使能”。2、查询历史告警,发现单板曾经上报HARD_BAD 告警,说明该单板出现过故障,LAG 组自动关闭了所有端口的激光器。但是当HARD_BAD 告警消失时,单板的状态并未随之恢复为正常,导致LASER_SHUT告警一直存在。3、硬复位该单板,单板状态恢复正常,LASER_SHUT 告警消失,业务恢复正常。4、为消除隐患,更换此块单板。,Page 65,目录,Tunnel故障定位,3,常见故障定位流程,1,链路故障定位,4,保护故障定位,5,时钟故障定位,6,业务故障定位,2,带内DCN故障定位,7,故障定位典型案例,8,参考文档,9,Page 66,参考文档,1、OptiX PTN 3900 PTN系列分组传送平台 故障处理http:/PTN 3900 PTN系列分组传送平台 告警和性能事件参考 http:/PTN 维护专题 故障处理手册5、PTN错误码全集以上资料请在support网站下载最新版本使用,对资料有任何问题和建议,请反馈给朝克/00140036,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备2025010119号-1

经营许可证:宁B2-20210002

宁公网安备 64010402000987号