《FTTH故障处理华为.ppt》由会员分享,可在线阅读,更多相关《FTTH故障处理华为.ppt(15页珍藏版)》请在三一办公上搜索。
1、宽带业务故障处理,WEIHU,Page1,宽带业务故障处理流程,初步定位故障位置,检查ONU,检查OLT,开始,结束,检查线路状况,检查上层设备,Page2,常见故障,Page3,宽带典型故障,Page4,PPPoE故障处理步骤,检查 端口是否激活检查ONT 是否正常检查上行口是否在线检查Service-port 是否正常检查线路配置检查业务流的MAC 地址学习数检查获取用户MAC检查PITP 配置检查PPPOE 单MAC 配置检查安全特性配置检查是否存在环网或者MAC 地址漂移检查PITP 没有开启,PPPoE 为multi-mac,防MAC 欺骗没有开启,Page5,案例 ONU下用户宽带
2、语音业务闪断,故障现象ONU设备下两个FE口分别接宽带与语音业务,不同的时间段会出现宽带与语音业务闪断的现象,闪断时间一般为几十秒。故障分析由于故障发生时间很短,此类问题很难定位,需要对组网及业务流程了解透彻。经确认组网如图所示,宽带与语音业务的网关都终结在BAS上,BAS为单MAC设备。对于闪断类问题是不好定位故障的,一般需要捕捉故障时的报文来定位故障出在哪里。操作步骤1、通过以上分析,建议通过故障时抓包的手段来定位。在LSW的下行口作镜像抓包,故障时抓包发现,拨号用户的PADI报文可以正常送到LSW上,但是PADR报文不能送到LSW上去。接下来据此分析原因,比较PADI和PADR的区别,P
3、ADI是广播报文,PADR是单播报文,广播报文可以正常转发,但是单播报文被丢弃,这种情况怀疑应该是由于下层网络发生了MAC地址漂移。网关的MAC地址在下层设备发生了漂移,此时广播报文可以正常转发,但是目的MAC是网关的单播报文会被全部丢弃。,Page6,案例 ONU下用户宽带语音业务闪断,2、那么产生MAC漂移一般为用户端环路或者是攻击导致,如何确认是否就是这个原因引起的呢,因为故障发生时间很短,如果故障发生时再处理,肯定来不及。决制定抓包方案,在ONU上把接DSLAM的FE口镜像到另一FE口,之后在PC上设置通过源MAC(BAS的MAC)来抓包。3、搭建抓包环境后抓到了故障时的数据包,为某一
4、端口发送源MAC为BAS的MAC的ARP攻击报文,造成业务中断。总结1、组网不规范。网络层次多出一层,建议采用集成语音业务的MDU设备来替换此种组网;2、在DSLAM设备上开启MAC过滤及环路检测功能。,Page7,案例 MA5620网管与语音业务时通时断,组网:BAS-OLTMA5620故障现象:OLT下挂的MA5620设备不能PING通BAS,可以PING通OLT设备,网管和语音业务是通时断。原因分析:1、用户攻击。2、ARP表项混乱。3、IP与MAC地址冲突。4、其他。处理过程1、在某一台MA5620设备上PINGBAS,同时在OLT上做ACL统计查看ICMP报文已从OLT上行口发送出去
5、,但是BAS设备没有响应,初步分析有两种可能,一是OLT发送出去的ICMP或者ARP报文异常,另一种是BAS上处理存在问题。2、为了证实上述分析制定详细抓包方案,具体方案见附件。通过分析抓包报文,MA5620发出去的PING报文VLAN、MAC是正确的,报文正确的到达了OLT,同时OLT也发送到了BAS,但是BAS却没有响应。分析问题出在BAS侧。,Page8,案例 MA5620网管与语音业务时通时断,3、在BAS上通过管理IP()查看在线信息为无,同时根据MAC查看语音的IP在线。%Nouserdisplayaccess-usermac-address0018-8288-a81fUserac
6、cessindex:48State:UsedUsername:MA5200F-2-FZFQ-vlan-25-0033adminUseraccessporttype:GegabitethernetUseraccessport:25UseraccessVLAN:33UserMAC:0018-8288-a81fUserIPaddress:Useraccesstype:VLAN-normalUserauthenticationtype:Bindauthentication,Page9,案例 MA5620网管与语音业务时通时断,4、在BAS上通过端口来查看用户在线信息,发现一个规律,一台MA5620设备
7、的管理IP与语音IP不能同时在线,由于MA5620设备的多个三层接口只有一个MAC,怀疑BAS不支持多用户使用同一MAC认证.MA5200F-2-FZFQ-aaadisplayaccess-userportgigabit ethernet25-用户ID用户名IP地址MA-900018-8288-a83527991010031212fzcnc 001a-6422-fab1414MA5200F-2-FZFQ-vlan-25-0031admin0018-8288-a81f4800018-8288-a8594840018-8288-a819542001a-a934-664a7010018-8288-a
8、847719MA5200F-2-FZFQ-vlan-25-0033admin0018-8288-a84d7660018-8288-a82f-,Page10,案例 MA5620网管与语音业务时通时断,5、为了证实上述推断,做如下测试,在BAS上跟据MAC来强制用户下线,同时在MA5620设备上PING管理IP的网关地址,发现PING一段时间后网管正常。证实BAS设备一个MAC地址只允许接入一个用户MA5200F-2-FZFQ-aaacutaccess-usermac-address0018-8288-a81f注意:总共1用户被切断JiaXinYinZuo_3#03-05_MA5620(confi
9、g)#ping-c100PING10.128.15.1:56databytes,pressCTRL_CtobreakRequesttimeoutRequesttimeoutReplyfrom10.128.15.1:bytes=56Sequence=31ttl=255time=7ms总结1)MA5200G缺省情况下,一个MAC地址只允许接入一个用户,3356版本支持多个用户用同一个mac上线。命令如下命令设置,N为对应的会话数,即允许同一个MAC地址接入的最大用户数目。pppoe-servermax-sessionsremote-macN2)MA5200F设备一个MAC地址只允许接入一个用户,不
10、能设置。可以将语音IP的网关与管理IP配置在不同的设备上。,Page11,案例MA5680T下的用户打开网页有时很慢,有时很正常,语音业务及网管正常,组网描述:MA56205680T5200G原因分析:1、查看MDU流量模板索引配置没有问题;2、PING网站域名时通时不通,具体表现为:当能PING通的时候,如果一直长PING则不会丢包,如果此时中断PING包,然后再PING就很有可能PING不通了,但过一会又能PING通,也没有明显规律;3、查看OLT配置,发现MAC地址老化时间为10S,怀疑MAC地址老化过快导致,修改为300S后问题依旧;4、从PCPINGMA5200G上的网关地址一直正常
11、,初步判断是MA5200G及以上设备问题;5、后又发现MA5680T是双上行,但1端口没有配置数据,只是ONLINE,后确认对接的MA5200G上做了链路聚合,MA5680T上没有相应的配置,拔掉1端口的光纤后问题解决。,Page12,案例MA5680T下的用户打开网页有时很慢,有时很正常,语音业务及网管正常,处理过程:在OLT上配置链路聚合后彻底解决问题。为什么PINGMA5200G上的网关地址一直正常,而PING网站域名时通时不通?这与MA5200G上的负荷分担机制有关,由于PINGMA5200G上的网关地址时,源MAC与目地MAC都是固定的,所以只会出现通或不通的情况,刚好这里是通的情况
12、。而PING网站域名时,由于网站可以有多台服务器,所以目的MAC不是固定的,所以回来的ICMP报文就有可能从1端口的链路回来,就出现概率性不通的情况。,Page14,附录PPPoE交互错误提示,1、“错误678”。原因是链路不通导致,即终端PC机到BAS的链路不通,一般可能是数据未配置或错误、端口环路或是其他原因,导致PC数据不能送到BAS,或BAS收到报文不作响应。2、“错误676”。由于PADI报文是广播报文,该报文能够到达BAS,PADR报文是单播报文,该报文不能到达BAS。出现该问题原因一般是由于设备上行端口mac地址漂移导致,或是其他原因导致PADR报文不能到达BAS。3、“错误619”。该问题一般是由于用户认证异常,原因可能是Radius用户的绑定信息更改了。解决此问题,一般是将用户信息初始化。4、“错误691”。用户名密码错,一般也是将用户信息初始化,或是重新设置口令等。5、”错误718“。原因为BAS把CODE=1报文送给RADIUS,但RADIUS没有回应。,