10EPON设备故障处理交流.ppt

上传人:仙人指路1688 文档编号:2432402 上传时间:2023-02-19 格式:PPT 页数:52 大小:2.38MB
返回 下载 相关 举报
10EPON设备故障处理交流.ppt_第1页
第1页 / 共52页
10EPON设备故障处理交流.ppt_第2页
第2页 / 共52页
10EPON设备故障处理交流.ppt_第3页
第3页 / 共52页
10EPON设备故障处理交流.ppt_第4页
第4页 / 共52页
10EPON设备故障处理交流.ppt_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《10EPON设备故障处理交流.ppt》由会员分享,可在线阅读,更多相关《10EPON设备故障处理交流.ppt(52页珍藏版)》请在三一办公上搜索。

1、EPON设备常见故障处理,V1.1,PO_SM01_C1_P1,2,本章学习目标,通过本章的学习,你可以获得以下收获:了解 EPON 设备故障处理方法,3,故障处理注意事项,处理过程中如遇到难以定位解决的问题,可尽快联系厂家进行处理。在紧急故障处理时,要及时、准确记录必要的信息和处理步骤,以供后续分析故障原因所用;需要收集的信息包括:1版本信息,包括系统软件的版本,ONU版本,相关单板版本。2提供现场设备的组网图。3描述设备基本配置情况,包括ONU数目,单板类型和数量,QINQ配置。4详细描述故障现象。5提供相关的告警。6.提供故障影响范围,4,EPON系统故障定位,根据用户申告和网管告警判断

2、故障的范围有多大,是单个ONU的问题,还是所有ONU业务中断,是一个PON口下的ONU,还是所有PON口的ONU。然后依此判断可能的故障点。OLT侧故障上联网络出现故障ODN网故障单个ONU故障、具备某种相同属性ONU发生故障,5,常见故障处理,6,ONU无法注册处理流程ONU是否在所查看的PON下?可以通过网管查看整个OLT的未注册ONU,其会标识未注册的ONU是从哪个PON口上报的。测量ONU侧接收光功率是否大于-24db。如果小于-24db,那么应逐级检查光路跳接点是否正常。查看ONU对应的PON口灯是否亮或闪烁光路距离是否超过20KM:系统缺省仅支持20KM,超过20KM的ONU即使接

3、收光功率正常,也无法注册。ONU光模块或硬件故障,更换ONU试试,常见故障处理,7,上网业务故障处理流程:首先查看ONU是否能正常在线?检查ONU业务vlan设置是否正确。通过show mac查看ONU子接口能否学习到电脑或路由器mac。如果学习不到,应确认ONU是否能稳定在线?是否有频繁掉线告警?通过show mac vlan pvlanid查看是否能从上联口pvlan学习到网关mac。如果无法学习到网关mac,可能是上联设备Pvlan没有透传。检查上联设备VLAN配置和bas上数据配置。,常见故障处理,8,IPTV业务故障处理流程如果同一个ONU其他业务正常,那么首先确认是单播业务(点播、

4、回看)不通还是组播业务(频道直播,也有可能采用单播方式,取决于IPTV平台设置)如果是单播、组播均不正常,那么首先vlan数据配置是否正常;再次检查ONU上联带宽分配,缺省ONU带宽为2000kbps,对于视频业务可能带宽不足;检查mac表学习正常(ONU学习机顶盒mac、OLT或ONU上联口学习网关mac。如果是只组播业务不通,详见下面的组播业务故障处理流程,常见故障处理,9,VOIP业务故障处理流程查看IAD注册状态,是否正常注册成功;如果IAD注册状态不正常,逐段ping iad所在网关IP、SS IP,检查整个网络通路是否正常。如果能ping通,还是注册不上,核对双方配置的对接参数是否

5、正确,特别是域名;终端可以注册成功,但是用户无法正常呼叫,首先需要查的就是USER TID和RTP TID在终端和软交换上是否配置一致;如果是业务时通时断,首先ping包测试网络是否丢包,然后检查双方RTP TID设置是否一致?抓包和信令跟踪分析故障原因。,常见故障处理,10,IPTV组播业务故障处理流程查看上联端口是否可以从组播vlan学习到mac检查OLT上是否将该ONU添加到组播接收端口?Show igmp mvlan 29检查ONU子接口是否正确透传组播vlan 29?Show run interface epon-onu_0/x/x:x对于通过远程下发配置的,检查是否已经对组播报文剥

6、离tag使能?Show onu run con epon-onu_0/x/x:xmulticast vlan tag-strip port eth_0/2 enable查看OLT上组播表是否已经建立。show igmp dynamic-member对于MDU,还需要登录ONU,进一步检查ONU上的组播配置,常见故障处理,11,故障现象某局反映F822下挂用户观看IPTV时点播业务正常,组播业务很卡。故障处理检查ONU带宽没有问题;组播很卡说明不是没有组播信号,而是组播带宽受到限制。于是检查ONU上的组播设置,发现F822上联口系统缺省的组播报文限速为100ppsF822-1(config)#s

7、how interface gei_0/3/1Interface:3/1MulticastRateLimit:100pps修改上联口的组播限速F822-1(config-if)#eth-switch multicast 2048修改后测试业务正常。,典型故障案例,组播业务故障处理一例,12,故障现象某局新开ONU注册不上,在ONU侧测量光功率为-21db,在允许范围,但OLT上一直无法发现该ONU。故障处理了解组网情况:该PON口为一个新开的PON口,只挂这个ONU;将ONU拿到OLT近端的一个光交节点测试,发现可以注册,判断可能原先光路距离过长了,向现场了解光路情况,得知该ONU到OLT光路

8、超过20KM,估计有25KM左右,为了避免光衰过大,特意使用了一个1:4分光器。故障原因已经清楚:PON系统目前支持的最远注册距离是20KM,超过20KM后,即使光衰在ONU的接收范围内,依然是无法注册的。OLT上可以临时调整最长距离,但一般不建议这样操作C220(config)#interface epon-olt_0/1/4C220(config-if)#maxrtt?Default value is 13524(TQ).C220(config-if)#maxrtt 16905/25KM:25*13524/20=16905该设置最大距离建议不超过30KM,同PON下不同ONU之间光路距离差

9、距不要超过10KM,典型故障案例,光路距离太长导致ONU注册不上故障,13,故障现象某局modem用户从原先PSTN网络中换到F820下,modem拨号不成功。故障处理现场使用的modem支持V92协议,出现问题时通过修改增益、tdm与ip编码的一致性等都没有解决该问题。通过芯片产家的分析,建议将modem降速。相比V90协议增加了3个功能,一个是提高上行速率到48k;一个是拨号过程中可以支持语言通话;再一个就是快速连接。快速连接就是将第一次拨号成功的一些协商配置项保存为文件,以后再拨号时可以默认调用这些配置项而省略协商过程。对于线路没发生变化的modem可以提高协商速度,但对于六安这种从PS

10、TN切换到F820的modem,如果还用之前的配置项,则会影响modem拨号的成功率。现场将modem使用的协议从V92改成V90,也就是去掉新增的3个功能后,拨号能够成功。这个问题主要是由于设备使用环境发生变化后,相关的配置未做相应的修改,通过修改modem的相关参数就可以解决,典型故障案例,modem拨号不成功问题分析,14,故障现象某局F820同华为SS对接,用户提机通话约2分钟左右就断话。故障处理从信令上通话过程中会占用F820上的物理终结点和rtp终结点,默认的配置中rtp终结点会每隔一段时间给SS发审计消息,以确认该rtp终结点的占用是否正常,但华为的SS并不支持这样的检测机制,会

11、给F820回错,因此将该rtp释放,从而影响话路。对于与华为SS通过H248协议对接的地方,都需要将rtp的心跳检测功能关闭。修改命令如下:ZXAN(config-voip)#mgc h248tid link-kept-flag 00表示关闭心跳检测;1表示打开心跳检测。,典型故障案例,F820语音通话2分钟左右断话问题,15,故障现象某局一个C220下挂的所有9806H用户均无法获取到IP地址 故障处理该OLT下用户业务原先都是好的,经了解,昨晚上层IPTV承载网设备做了割接,割接后其他设备(包括该C220下挂的其他ONU设备)用户IPTV均正常,只有9806H的用户反映无法获取到IP地址。

12、故障定位应该是和9806H的配置有关系,登录9806H查看,发现上联口设置了禁止广播转发9806H-1(cfg-if-ge-5/1)#show interface 5/1 Interface:5/1FloodForWard:disableBroadCastRateLimit:disable,典型故障案例,9806H下挂用户获取不到IP地址故障,16,故障处理(续)该设置后,如果DHCP server响应报文是以广播方式下发的,将导致机顶盒无法收到响应报文。之前业务正常是因为其DCHP报文都是采用单播方式下发的,而昨晚上层设备刚好做过割接,可能方式产生改变,于是修改配置。9806H-1(cfg-

13、if-ge-5/1)#rate-limit broadcast 2048/单位pps测试机顶盒能正常获取到IP了。证实了上述推断。,典型故障案例,9806H下挂用户获取不到IP地址故障(续),17,典型故障案例,9806H无法配置语音IP,故障现象配置ip subnet voip时提示冲突conflict。故障处理经检查,发现分配的语音IP地址为10段的,而9806H缺省的带外ip host是10.62.5.101/255.0.0.0,因此所有10网段都会产生冲突,将带外掩码改成24位后即可。数据规划需要保证带内、带外、语音IP不在同一个网段,避免产生冲突。,18,典型故障案例,9806H个别

14、用户数据无法删除,故障现象使用9806(ag)#del-slctermid begin slot 3 num 48 命令删除用户时提示“DB:Error delete”。故障处理如果窄带端口处于被占用状态(Seize/LineBusy),该端口的TID数据是不能被删掉的,会提示DB:Error delete,此时应先get-slcstatu 查看一下相应端口是否被占用(也可能外线接触不好)。在这种情况下,可以拔掉外线/或者复位用户板后迅速删除。/如果外线或话机没挂好,过一会儿仍然会导致端口状态占用。因此动作要快,建议写好删除脚本。,19,典型故障案例,IAD用户拨打1000号无法挂断,故障现象

15、某局IAD出现10000号无法挂断的问题,试了其他固话号码都可以正常挂断包括114,95588等,手机也可以正常挂断。但是拨打10000号后始终挂不断,到20多秒时估计电话超时而挂断。故障处理跟踪信令发现挂机时ONU正确上报了al/on挂机消息,但是SS没有下发指令释放资源与电路;最后查出,SS设置了,只有被叫挂机才结束通话。SS侧修改数据后正常,20,典型故障案例,POS机刷卡不成功问题,故障现象用户的农行金穗支付通POS机拨号后,屏幕显示先是“连接中心。”再是“接收数据。”,接着过一会儿就断线,无法正常连接操作。正常时应该是在“接收数据。”后显示操作界面能实现转帐等功能 故障处理该IAD用

16、户拨打电话业务正常。在软交换平台上给此POS机所拨的接入号码配置“业务控制媒体”数据,使得在软交换上能够优先处理保证稳定建链。但此数据配置后POS机故障现象依旧。进一步抓包分析,发现从软交换到C220的两次丢包率为2.1%和3.4%。确认是C220上层IP承载网的RTP丢包率过大。MODEM和传真业务的丢包率要求一般不能超过0.5%;POS业务一般不能超过1%解决方案解决网络丢包问题配置冗余:mod-rtppar parid 1 g711redundancy 13/1-3可以试着修改,但配置冗余只能解决一般较轻丢包,严重丢包还需解决网络问题。,21,典型故障案例,IAD用户电话时好时坏,故障现

17、象某9806H下挂用户使用一段时间后就出现电话不能用,当被叫能振铃,提机就听忙音。故障处理经过信令跟踪,发现是MG与MGC的RTP termid不一致导致无法拨通。MG发的:Record 12时间=11:45:32=!/1:2944 P=688181764C=21A=A2,A=RTP/000056MLv=0c=IN IP4 10.251.130.2t=0 0m=audio 10110 RTP/AVP 8a=ptime:20,22,典型故障案例,IAD用户电话时好时坏(续),故障处理(续)SS发的:Record 15时间=11:45:32=MEGACO/1 61.157.213.2:2944 T

18、=695915016C=21MF=A2MOMO=SR,RV=OFF,RG=OFF,tdmc/ec=ON,E=688249347ctyp/dtone,al/*,SG,MF=RTP/56MOMO=SR,RV=OFF,RG=OFF,Rv=0c=IN IP4 61.157.213.2m=audio 26048 RTP/AVP 8a=ptime:20,23,典型故障案例,IAD用户电话时好时坏(续),故障处理(续)所以MG回error:Record 16时间=11:45:32=!/1:2944 P=695915016C=21MF=A2,MF=$ER=410Incorrect identifier 将MG

19、与MGC的RTP termid修改成一致,故障解决。小结:本例是由于双方RTP设置不一致导致(AG侧设置为RTP/00056,SS侧设置为RTP/56)。实际上如果双方的RTP资源数量不相符也会出现单通现象。,24,典型故障案例,9806H用户电话无法使用,故障现象9806H下所有用户电话摘机忙音,有时有拨号音,但拨号后中断出现忙音 故障处理查看H.248状态,发现有时是ok,一两分钟后break,不断重复此过程。查看ips、slc的termid与ss一致并且状态都正常,ping软交换不丢包。更换语音ip、语音板、主控板进行测试,仍然没有解决故障。由于9806H采用域名进行注册,怀疑可能是域名

20、冲突。联系SS核对数据,发现该节点配置的域名错误,同另外一个节点产生冲突,修改后正常。有一例类似故障SS上抓信令发现9806H不断在上报重新注册消息,但在9806H上抓信令却没有看到该消息,经确认另有一台设备设置了同样的窄带IP但未带业务,不断上报注册请求消息。h.248协议不断瞬断,主要是由语音ip或者域名冲突造成,当发生冲突时,ss回应的消息,会在两个冲突的mg之间不停转换,因此造成h.248协议时断时续。因此数据规划一定要严格,更换语音域名、IP一定要求核对清楚,避免冲突。,25,端口A,端口B,管理员,A和B通信,端口镜像把端口B收到的流量也发给端口C,端口C,端口镜像,端口镜像使得管

21、理员在不影响交换机正常通信的情况下,能够对网络流量进行监控和调试。,维护技巧-抓包,26,配置范例,ZXAN(config)#monitor session 1 创建一个镜像(只能创建一个)ZXAN(config)#interface inner-port_0/3/1进入内联口或上联口模式ZXAN(config-if)#monitor session 1 source direction both设置源端口以及数据流方向ZXAN(config)#interface gei_0/4/1进入上联口模式ZXAN(config-if)#monitor session 1 destination设置目的

22、端口ZXAN(config-if)#show monitor session 1显示镜像配置 Session 1-Source Ports:Port:inner-port_0/3/1 Monitor Direction:both Destination Port:Port:gei_0/4/1,维护技巧-抓包,27,Wireshark的功能简介,撷取网络封包 分析网络封包分解网络封包,Wireshark(前称Ethereal)是一个网络封包分析软件,维护技巧-抓包,28,撷取网络报文,维护技巧-抓包,29,分包撷取,30,数据分析,网络丢包网络抖动单向媒体流广播包媒体流还原,31,数据过滤,me

23、gaco.termid=USER00600800031|megaco.termid=RTP00200300060,32,根据用户端口号过滤,udp.port=6120|udp.port=6121,33,根据ip地址过滤,34,35,网络丢包,针对网络丢包可以在两端配置冗余来规避,36,Seq从23412跳变到23414,37,网络抖动,我们这里所说的网络抖动在WireShark中可以通过Delta的值来衡量,Delta是相邻两个媒体包之间的间隔值。因为网关发送媒体包时的打包间隔是固定的,在没有网络抖动的情况下,接收侧网关收到的媒体流的Delta也应该是一个定值。当有网络抖动时,Delta的值会

24、随着网络抖动而变化。,Graph,38,笔记本电脑抓tag报文配置,笔记本电脑网卡驱动默认会在接收数据包的时候过滤vlan tag,使得用wireshark抓到的数据包中不含vlan tag,此时需要通过修改注册表让驱动保留vlan tag。Intel PRO/1000或PRO/100网卡,对于此类网卡需要将注册表:HKEY_LOCAL_MACHINESYSTEMControlSet001ControlClass4D36E972-E325-11CE-BFC1-08002BE1031800 xx,如果该目录下有多个子项,需要找到Intel(R)PRO/100 S网卡对应的子项(其中DriverD

25、esc是设备类型):,其他维护技巧,39,笔记本电脑抓tag报文配置,对于Broadcom千兆网卡,需要在注册表里增加一项PreserveVlanInfoInRxPacket=1,类型为string。位置与TxCoalescingTicks相同,后者可以在HKEY_LOCAL_MACHINESYSTEMCurrentControlSet下搜索到。,其他维护技巧,40,批量工具使用,批量工具能够脱离网管独立运行,通过TELNET连接实现对我司PON节点(包括OLT和ONU)实现批量版本下载和命令执行功能,方便对PON节点进行批量维护,特别是没有安装中兴网管的点。批量工具实际上是一个TELNET客

26、户端和FTP服务器端(当然也可以启动第三方FTP服务器端软件,这样会提示FTP端口已经被占用,继续执行即可),可以顺序批量telnet到若干个PON节点顺序发布命令。以下以F820为例,说明批量工具的使用,其他维护技巧,41,批量工具使用-认识工具,批量工具是一个免安装的绿色软件,解压缩后有以下文件:其中主要是bachtool.ini这个文件,可以修改其中的配置,以达到对不同设备的操作和设置,其他维护技巧,42,批量工具使用-配置文件,Bachtool.ini打开后,其中主要是前面一部分的配置 UpdateBootCmd_WaitSeconds=30/升级线卡BOOT等待时间,单位为秒;Upd

27、ateVersionCmd_WaitSeconds=180/升级线卡版本等待时间,单位为秒;FtpPort=21/ftp端口号;FtpTimerOut=29/ftp超时时长,单位为秒;FtpWriteLog=1/ftp日志生成控制,0位不生成,1为生成;TelnetPort=23/telnet端口号;TelnetTimerOut=30/telnet超时时长,单位为秒;TelnetConnectCount=5/telnet最大连接数,单位为个;TelnetDefaultUserName=zte“/telnet节点用户名默认配置;TelnetDefaultPassword=zte“/telnet节

28、点密码默认配置;CommPortName=COM1,其他维护技巧,43,批量工具使用-节点管理,节点管理界面:新增-新增节点,修改-修改节点信息,删除-删除掉勾选的节点,批量增加,可以批量添加一批节点,保存-将本页面的节点信息保存成一个txt文件。,其他维护技巧,44,批量工具使用-节点生成,制作节点列表:从网管导出网元列表,保存成表格格式,选中其中我们需要的IP这列,拷贝出来。,其他维护技巧,45,批量工具使用-节点生成,新建一个txt文本文件,将复制的IP列表粘贴进去,保存,其他维护技巧,46,批量工具使用-节点导入,导入节点:点击批量增加打开保存的网元列表文件,其他维护技巧,47,批量工

29、具使用-命令管理,在“命令管理”界面,可以逐条增加要对网元所做的操作,也可以批量增加一批的命令,其他维护技巧,48,批量工具使用-命令生成,制作命令脚本,打开一个txt文件,每条命令换行即可。也可以直接使用设备的startrun.dat文件拷贝出需要执行的部分命令。保存成一个txt文件。,其他维护技巧,49,批量工具使用-命令导入,命令批量导入,其他维护技巧,50,批量工具使用-命令执行,执行命令,在命令执行界面,点击开始,工具就将按照设置的网元列表,逐个telnet到设备执行命令,状态显示执行的结果。,其他维护技巧,51,批量工具使用-记录文件,执行的过程和log保存在工具目录下20100513-135937bachtool.log执行的过程log(包括了telnet进程)20100513-135937bachtool_cmd.log命令执行log(记录所执行的命令、结果),其他维护技巧,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号