华为——宽带业务故障处理.ppt

上传人:laozhun 文档编号:2295255 上传时间:2023-02-10 格式:PPT 页数:29 大小:667KB
返回 下载 相关 举报
华为——宽带业务故障处理.ppt_第1页
第1页 / 共29页
华为——宽带业务故障处理.ppt_第2页
第2页 / 共29页
华为——宽带业务故障处理.ppt_第3页
第3页 / 共29页
华为——宽带业务故障处理.ppt_第4页
第4页 / 共29页
华为——宽带业务故障处理.ppt_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《华为——宽带业务故障处理.ppt》由会员分享,可在线阅读,更多相关《华为——宽带业务故障处理.ppt(29页珍藏版)》请在三一办公上搜索。

1、宽带业务故障处理,Page1,培训目标,学完本课程后,您应该能:描述宽带业务的组网列出宽带业务的常见故障定位宽带业务故障完成宽带业务的故障处理,Page2,目 录,宽带业务故障处理流程常见宽带业务故障,Page3,目 录,宽带业务故障处理流程常见宽带业务故障,Page4,宽带业务故障处理流程,初步定位故障位置,检查ONU,检查OLT,开始,结束,检查线路状况,检查上层设备,Page5,检查ONU,指示灯,PowerPON LINK PON Register,VLAN,VLAN ID上行口业务虚端口,模板,DBA模板线路模板 流量表业务模板、SNMP模板,Page6,检查OLT,PON端口状态上

2、行口端口状态流量表(Traffic table)线路模板(ont-line profile)A类ONU业务模板(ont-srprofile)B/C类ONUSNMPL模板(SNMP-profile)VLAN业务端口(Service-port),Page7,问 题,如何检查ONU上用户端口VLAN配置?如果ONU模板绑定错误,该怎么处理?,Page8,目 录,宽带业务故障处理流程常见宽带业务故障,Page9,常见故障,Page10,宽带典型故障,Page11,PPPoE故障处理步骤,检查 端口是否激活检查ONT 是否正常检查上行口是否在线检查Service-port 是否正常检查线路配置检查业务流

3、的MAC 地址学习数检查获取用户MAC检查PITP 配置检查PPPOE 单MAC 配置检查安全特性配置检查是否存在环网或者MAC 地址漂移检查PITP 没有开启,PPPoE 为multi-mac,防MAC 欺骗没有开启,Page12,案例 ONU下用户宽带语音业务闪断,故障现象ONU设备下两个FE口分别接宽带与语音业务,不同的时间段会出现宽带与语音业务闪断的现象,闪断时间一般为几十秒。故障分析由于故障发生时间很短,此类问题很难定位,需要对组网及业务流程了解透彻。经确认组网如图所示,宽带与语音业务的网关都终结在BAS上,BAS为单MAC设备。对于闪断类问题是不好定位故障的,一般需要捕捉故障时的报

4、文来定位故障出在哪里。操作步骤1、通过以上分析,建议通过故障时抓包的手段来定位。在LSW的下行口作镜像抓包,故障时抓包发现,拨号用户的PADI报文可以正常送到LSW上,但是PADR报文不能送到LSW上去。接下来据此分析原因,比较PADI和PADR的区别,PADI是广播报文,PADR是单播报文,广播报文可以正常转发,但是单播报文被丢弃,这种情况怀疑应该是由于下层网络发生了MAC地址漂移。网关的MAC地址在下层设备发生了漂移,此时广播报文可以正常转发,但是目的MAC是网关的单播报文会被全部丢弃。,Page13,案例 ONU下用户宽带语音业务闪断,2、那么产生MAC漂移一般为用户端环路或者是攻击导致

5、,如何确认是否就是这个原因引起的呢,因为故障发生时间很短,如果故障发生时再处理,肯定来不及。决制定抓包方案,在ONU上把接DSLAM的FE口镜像到另一FE口,之后在PC上设置通过源MAC(BAS的MAC)来抓包。3、搭建抓包环境后抓到了故障时的数据包,为某一端口发送源MAC为BAS的MAC的ARP攻击报文,造成业务中断。总结1、组网不规范。网络层次多出一层,建议采用集成语音业务的MDU设备来替换此种组网;2、在DSLAM设备上开启MAC过滤及环路检测功能。,Page14,案例 MA5620网管与语音业务时通时断,组网:BAS-OLTMA5620故障现象:OLT下挂的MA5620设备不能PING

6、通BAS,可以PING通OLT设备,网管和语音业务是通时断。原因分析:1、用户攻击。2、ARP表项混乱。3、IP与MAC地址冲突。4、其他。处理过程1、在某一台MA5620设备上PINGBAS,同时在OLT上做ACL统计查看ICMP报文已从OLT上行口发送出去,但是BAS设备没有响应,初步分析有两种可能,一是OLT发送出去的ICMP或者ARP报文异常,另一种是BAS上处理存在问题。2、为了证实上述分析制定详细抓包方案,具体方案见附件。通过分析抓包报文,MA5620发出去的PING报文VLAN、MAC是正确的,报文正确的到达了OLT,同时OLT也发送到了BAS,但是BAS却没有响应。分析问题出在

7、BAS侧。,Page15,案例 MA5620网管与语音业务时通时断,3、在BAS上通过管理IP(10.128.15.73)查看在线信息为无,同时根据MAC查看语音的IP在线。displayaccess-userip-address10.128.15.73%Nouserdisplayaccess-usermac-address0018-8288-a81fUseraccessindex:48State:UsedUsername:MA5200F-2-FZFQ-vlan-25-0033adminUseraccessporttype:GegabitethernetUseraccessport:25Use

8、raccessVLAN:33UserMAC:0018-8288-a81fUserIPaddress:10.224.98.33Useraccesstype:VLAN-normalUserauthenticationtype:Bindauthentication,Page16,案例 MA5620网管与语音业务时通时断,4、在BAS上通过端口来查看用户在线信息,发现一个规律,一台MA5620设备的管理IP与语音IP不能同时在线,由于MA5620设备的多个三层接口只有一个MAC,怀疑BAS不支持多用户使用同一MAC认证.MA5200F-2-FZFQ-aaadisplayaccess-userportg

9、igabit ethernet25-用户ID用户名IP地址MA-90MA5200F-2-FZFQ-vlan-25-0033admin 10.224.98.340018-8288-a83527991010031212fzcnc58.22.26.172 001a-6422-fab1414MA5200F-2-FZFQ-vlan-25-0031admin10.224.98.330018-8288-a81f480MA5200F-2-FZFQ-vlan-25-0031admin 10.128.15.710018-8288-a859484MA5200F-2-FZFQ-vlan-25-0031admin 10

10、.128.15.750018-8288-a819542MA5200F-2-FZFQ-vlan-25-0033admin 10.224.98.22001a-a934-664a701MA5200F-2-FZFQ-vlan-25-0031admin 10.128.15.770018-8288-a847719MA5200F-2-FZFQ-vlan-25-0033admin10.224.98.360018-8288-a84d766MA5200F-2-FZFQ-vlan-25-0031admin 10.128.15.780018-8288-a82f-,Page17,案例 MA5620网管与语音业务时通时断

11、,5、为了证实上述推断,做如下测试,在BAS上跟据MAC来强制用户下线,同时在MA5620设备上PING管理IP的网关地址,发现PING一段时间后网管正常。证实BAS设备一个MAC地址只允许接入一个用户MA5200F-2-FZFQ-aaacutaccess-usermac-address0018-8288-a81f注意:总共1用户被切断JiaXinYinZuo_3#03-05_MA5620(config)#ping-c10010.128.15.1PING10.128.15.1:56databytes,pressCTRL_CtobreakRequesttimeoutRequesttimeoutR

12、eplyfrom10.128.15.1:bytes=56Sequence=31ttl=255time=7ms总结1)MA5200G缺省情况下,一个MAC地址只允许接入一个用户,3356版本支持多个用户用同一个mac上线。命令如下命令设置,N为对应的会话数,即允许同一个MAC地址接入的最大用户数目。pppoe-servermax-sessionsremote-macN2)MA5200F设备一个MAC地址只允许接入一个用户,不能设置。可以将语音IP的网关与管理IP配置在不同的设备上。,Page18,案例MA5680T下的用户打开网页有时很慢,有时很正常,语音业务及网管正常,组网描述:MA56205

13、680T5200G原因分析:1、查看MDU流量模板索引配置没有问题;2、PING网站域名时通时不通,具体表现为:当能PING通的时候,如果一直长PING则不会丢包,如果此时中断PING包,然后再PING就很有可能PING不通了,但过一会又能PING通,也没有明显规律;3、查看OLT配置,发现MAC地址老化时间为10S,怀疑MAC地址老化过快导致,修改为300S后问题依旧;4、从PCPINGMA5200G上的网关地址一直正常,初步判断是MA5200G及以上设备问题;5、后又发现MA5680T是双上行,但1端口没有配置数据,只是ONLINE,后确认对接的MA5200G上做了链路聚合,MA5680T

14、上没有相应的配置,拔掉1端口的光纤后问题解决。,Page19,案例MA5680T下的用户打开网页有时很慢,有时很正常,语音业务及网管正常,处理过程:在OLT上配置链路聚合后彻底解决问题。为什么PINGMA5200G上的网关地址一直正常,而PING网站域名时通时不通?这与MA5200G上的负荷分担机制有关,由于PINGMA5200G上的网关地址时,源MAC与目地MAC都是固定的,所以只会出现通或不通的情况,刚好这里是通的情况。而PING网站域名时,由于网站可以有多台服务器,所以目的MAC不是固定的,所以回来的ICMP报文就有可能从1端口的链路回来,就出现概率性不通的情况。,Page20,案例视频

15、监控停顿,故障现象:某火车北站视频监控网络业务出现异常,故障为:PC监控终端和电视墙监控终端均出现流画面停顿现象,停顿时间约1S左右,出现概率较频繁。,Page21,案例视频监控停顿(续),故障处理步骤:将PC直接接在S8505下点播,采用软件解码,业务正常。将PC直接接在5680下点播,采用软件解码,业务正常。将PC直接接在S3928下点播,采用软件解码,图像出现停顿现象,至此判断问题出在两台S3928及其下连设备上。1.、怀疑S8505至S3928以及S3928至下连各采集点链路故障引起:在S8505上分别pingS3928、PC终端以及电视墙硬件解码器,ping 1500、3000、50

16、00、8000bytes的大包均不丢包,至此排除是由于链路故障原因引起。2、怀疑为S3928在大流量、突发流量较多时转发性能不足引起:查看S3928-1上行接5680端口,发现端口流量多达200余M,流量变化频繁,突发流量较多。查看底层硬件转发后,确认为由于突发流量较多、转发性能不足引起,并建议对交换机进行替换,采用转发性能更优的S3500系列交换机做替代。,Page22,案例视频监控停顿(续),机房对S3928进行替换,将两台S3928下挂的视频采集和视频点播终端改下挂至一台S3552上,经20日全天观察未再出现画面停顿现象,至此问题完全解决。总结本次故障为典型网络前期规划考虑欠妥、设备配置

17、不当所致。在前期工程中只考虑了下挂少量的点播终端,业务运行正常,后来隨着业务的需要增加了电视墙等点播终端,使得业务流量急剧增加,由于视频流的特点为突发流量较多,因此扩容后的流量大大超出了原设计的S3928的转发性能,出现画面停顿现象,采用更高端、转发性能更好的S3500系列交换机后问题解决。建议:建议根据该网络业务发展的需要,全面考虑各接入设备的性能,对瓶颈设备进行替换。,Page23,问 题,GPON故障常见问题有哪些,怎么处理?,Page24,总 结,宽带业务故障处理流程常见宽带业务故障分类,Page25,缩略语,BRAS:Broadband Remote Access ServerSNM

18、P:Simple Network Management Protocol,Page27,附录PPPoE交互错误提示,1、“错误678”。原因是链路不通导致,即终端PC机到BAS的链路不通,一般可能是数据未配置或错误、端口环路或是其他原因,导致PC数据不能送到BAS,或BAS收到报文不作响应。2、“错误676”。由于PADI报文是广播报文,该报文能够到达BAS,PADR报文是单播报文,该报文不能到达BAS。出现该问题原因一般是由于设备上行端口mac地址漂移导致,或是其他原因导致PADR报文不能到达BAS。3、“错误619”。该问题一般是由于用户认证异常,原因可能是Radius用户的绑定信息更改了。解决此问题,一般是将用户信息初始化。4、“错误691”。用户名密码错,一般也是将用户信息初始化,或是重新设置口令等。5、”错误718“。原因为BAS把CODE=1报文送给RADIUS,但RADIUS没有回应。,Page28,谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号