《optixosn产品误码性能与维护专题.ppt》由会员分享,可在线阅读,更多相关《optixosn产品误码性能与维护专题.ppt(64页珍藏版)》请在三一办公上搜索。
1、2023/7/7,董恩花/57645,OptiX OSN 产品误码性能与维护专题,Page 2,前言,基于OSN设备的误码性能特性,开发此课程。本课程旨在提高工程师的OSN设备维护水平。,Page 3,学习指南,本课程主要针对误码性能与维护专题中的内容进行组织。学习本课程之前,建议先学习SDH基本原理;本课程的重点、难点。重点:误码性能事件的处理难点:误码问题的处理,Page 4,课程目标,学习完此课程,您应能:了解误码性能事件的相关概念掌握SDH误码检测原理掌握SDH误码性能的处理方法,Page 5,内容介绍,误码性能事件误码检测机理误码问题的处理,Page 6,内容介绍,误码性能事件误码的
2、相关概念与误码相关的性能和告警事件,Page 7,误码的相关概念,什么是误码指经光接收机的接收与判决再生之后,码流中的某些比特发生了差错。平均误码率BER传统上常用平均误码率BER来衡量系统的误码性能。BER:在 某一规定的观测时间内(如24小时)发生差错的比特数和传输比特总数之比。(G.821)但平均误码率是一个长期效应,它只给出一个平均累积结果。而实际上误码的出现往往呈突发性质,且具有极大的随机性,因此除了平均误码率之外还应该有一些短期度量误码的参数,即误码秒与严重误码秒。,Page 8,误码的相关概念,注意:G.826规定的高比特率通道误码性能参数,以“块”为基础。,EB(误码块)SDH
3、通道开销中的BIP-X属于单个监视块,其中X块中的每个比特与监视的信息比特构成监视码组,只要X个分离的奇偶校验组中的任意一个不符合校验要求就认为整个块是误码块EB。误块秒 ES当某1秒钟时间内出现1个或1个以上的 误码块时,就叫做一个误块秒。(G.826)误块秒比 ESR在规定测量间隔内出现的ES与总的可用时间之比。(G.826)严重误块秒 SES某1秒内包含有不少于30%的误码块或者至少出现1个严重扰动期(SDP事件)。(G.826)误块率大于10E-3的秒。(G.821),Page 9,误码的相关概念,连续严重误块秒 CSES表示连续的X个SES,X介于29之间。(G.826)严重误块秒比
4、 SESR在规定测量时间内出现的SES数与总的可用时间之比。(G.826)背景块误码 BBE是指扣除不可用时间和SES期间所有的误码块以后所剩下的误码块。(G.826),Page 10,误码的相关概念,背景块差错比 BBERBBE数与扣除不可用时间和SES期间所有块数后的总块数之比。BBER=背景误码块/(无误码块+背景误码块)(G.826)严重扰动期 SDP事件对于中断业务(OOS:out-of-service)测量,在最少等效于4个连续块的时间内,如果所有连续块的BER10-2或出现信号丢失,则认为出现1个SDP事件。(G.826),Page 11,与误码相关的性能告警事件,为什么再生段的
5、性能事件和误码告警没有回告事件?,Page 12,与误码相关的性能,OptiX 设备和iManager网管对于误码的性能监视事件包括:,BBE:背景块误码,SES:严重误块秒,UAT:不可用时间,CSES:连续严重误块秒,FEBBE:远端背景块误码,FEES:远端误块秒,Page 13,问题,问题1:有哪些误码存在回告信息,分别用哪些开销字节完成,那 些误码不存在回告信息?问题2:SES和UAT的关系是什么?,Page 14,小结,本节我们主要讲解了:误码性能的相关概念与误码相关的性能和告警事件,Page 15,内容介绍,误码性能事件误码检测机理误码问题的处理,Page 16,内容介绍,误码检
6、测原理B1、B2、B3、V5的误码检测原理SDH误码检测的特点误码性能的检测上报点 网管的误码性能管理误码性能监视在维护中的应用,Page 17,误码检测原理,如果检测到误码,SDH可以将此信息插入相反的信道中,回送给远端网元;也可以插入向下游传送的信号中,送至通道终端;还可以作为性能管理的事件送给网管系统 SDH系统帧结构中,开销字节B1、B2、B3、V5分别用于监视再生段、复用段、高阶通道和低阶通道的误码块。误码监视采用比特间插奇偶校验方式(BIP)的偶校验SDH系统对误码的检测,是以“块”为单位的。,Page 18,误码检测原理B1字节,再生段误码监测B1字节 B1用于再生段层误码监测,
7、对整个STM-N帧信号进行传输误码检测的,B1字节最多可从一个STM-N帧检测出传输中所发生的8个误码块 对再生段信号流进行监控 方式为BIP8偶校验 BIP8偶校验工作机理:以8bit为单位(一个字节为单位)校验相应bit列(bit块)使相应列1的个数为偶,Page 19,再生段开销RSOHB1,B1字节工作机理发端对上一个已扰码帧(1#STM-N)进行BIP8偶校验,所得值放于本帧(2#STM-N)的B1字节处收端对所收当前未解扰帧(1#STM-N)进行BIP8偶校验,所得值B1与所收下一帧解扰后(2#STM-N)的B1字节相异或异或的值为零则表示传输无误码块,有多少个1则表示出现多少个误
8、码块若收端检测到B1误码块,在收端RS-BBE性能事件中反映出来,A1 00110011,A2 11001100,A3 10101010,A4 00001111,B 01011010,BIP-8,例:某信号一帧有4个字节,对其进行BIP8偶校验如图:,Page 20,误码检测原理B1字节,Page 21,误码检测原理B2字节,复用段误码监测B2字节对复用段信号流进行监控方式为BIP24偶校验BIP24偶校验工作机理:以24bit为单位(3个字节为单位,STM-1帧有3个B2字节)校验相应bit列(bit块)使相应列1的个数为偶,Page 22,复用段开销 MSOHB2,B2字节工作机理发端对上
9、一个未扰码帧除去RSOH外的所有字节进行BIP24偶校验,所得值放于本帧的3个B2字节处收端对所收当前已解扰帧且除去RSOH外的所有字节进行BIP24偶校验,所得值B2与所收下一帧解扰后的B2字节相异或异或的值为零则表示传输可能无误码块;异或的值不为零,则1的数目表示出现多少个误码块若收端检测到B2误码块,在收端MS-BBE性能事件中反映出来,11001100,11001100,11001100,01011101,01011101,01011101,11110000,11110000,11110000,BIP24,01100001,01100001,01100001,例:某信号一帧有9个字节,
10、对其进行BIP24偶校验如图:,Page 23,误码检测原理M1字节,复用段远端误块指示字节M1对告信息,由信宿回传到信源。告知发端:收端当前收到的B2检测的误块数;并在发端上报MS-FEBBE性能事件。同时在发端有MS-REI(复用段远端误块指示)告警事件上报。,Page 24,误码检测原理B3字节,高阶通道误码监测字节:B3监测高阶VC的误码性能监测方式BIP-8偶校验机理类似于B1、B2收端监测到相应VC4通道B3误块,在相应通道的性能事件HPBBE中反映出来,同时通过通道状态字节-G1(b1b4)回传由B3检测的误码块数。发端上报性能事件 HPFEBBE及告警HP-REI。,Page
11、25,误码检测原理V5字节,低阶通道误码监测字节:V5(b1、b2)复帧中的第一个字节,TU-PTR所指示的字节VC-12误码监测、VC-12通道状态对告、信号标记b1b2:BIP2误码监测LPBBEb3:收端接收误码情况对告指示LP_REI,Page 26,内容介绍,误码检测原理B1、B2、B3、V5的误码检测原理SDH误码检测的特点误码性能的检测上报点 网管的误码性能管理误码性能监视在维护中的应用,Page 27,SDH误码检测的特点,SDH系统的误码检测有如下特点:通过奇偶校验的方式来判断块中是否发生误码。SDH只能提供误码检出功能,但不能进行纠错。对于比较少的、离散分布的误码,具有比较
12、高的检测率,检测准确度高。对于大量误码或在一个块中出线多个误码的情况,不能正确检测。,Page 28,内容介绍,误码检测原理B1、B2、B3、V5的误码检测原理SDH误码检测的特点误码性能的检测上报点 网管的误码性能管理误码性能监视在维护中的应用,Page 29,误码性能的检测上报点,一般情况下,开销字节的检测和上报是在接收端进行的。掌握此规律,可以分析出误码产生的源头。对于STM-N线路板:如图A所示,检测的是线路侧方向(外输入信号)的误码性能,包括RS、MS、HP等性能事件。对于PDH接口板:如图B所示,检测的是交叉板方向进来的低阶业务的误码性能。,图 A,图 B,Page 30,误码性能
13、的检测上报点,说明:涉及到的几个名词,本端、远端、下游(网元)说明如下。业务配置如图所示对于该方向的VC4业务,如果NE-B网元西向检测到HPBBE误码,则“本端”就是指NE-B网元西向单板;“远端”就是指NE-A网元内与之对应的光板;“下游”方向就是指NE-C方向。,误码,Page 31,内容介绍,误码检测原理B1、B2、B3、V5的误码检测原理SDH误码检测的特点误码性能的检测上报点 网管的误码性能管理误码性能监视在维护中的应用,Page 32,网管误码性能管理,网管误码性能管理,设置网元性能监视的时间和事件选择模式设置和清除性能监视事件查看、维护网元和网管库中的性能数据设置性能门限,建议
14、:建议性能事件设定为不自动上报:频繁的15m和24h性能事件自动上报,会导致上报给网管的数据量非常巨大,容易导致ECC堵塞并增加网管的负荷。,Page 33,设置网元性能监视的时间和事件选择模式,打开“网元管理器”-选择“网元性能监视时间”出现如下界面:,选中网元,然后设置15分钟或24小时监视为打开。,Page 34,设置和清除性能监视事件,复位单板性能寄存器:清空所选性能寄存器。性能监视状态:支持设置和查询,Page 35,查看、维护网元和网管库中的性能数据,当前性能性能:可查询当前的性能事件历史性能:可查询历史性能事件UAT事件:UAT事件的查询性能越限:性能越限事件的查询,Page 3
15、6,设置性能门限,性能门限:设置性能事件上报的门限值。,Page 37,网管误码性能管理,网元的性能事件记录,Page 38,网管误码性能管理,双门限处理,ES,计数超过上门,限报,“性能越限”,ES,计数连续,15,分钟低于下,门限报,“性能越限”结束,ES,计数超过下门,限,不报结束,Page 39,误码性能监视在维护中的应用,从图中可以看出,如果只是低阶通道有误码,则高阶通道、复用段和再生段将检测不到该误码;如果再生段有误码,则将导致复用段、高阶通道、低阶通道出现误码。,误码检测关系及检测位置,Page 40,内容介绍,误码检测原理B1、B2、B3、V5的误码检测原理SDH误码检测的特点
16、误码性能的检测上报点 网管的误码性能管理误码性能监视在维护中的应用,Page 41,误码性能监视在维护中的应用,误码性能的穿通与终结 不同段(再生段、复用段)或通道(高阶通道、低阶通道)误码性能的穿通和终结情况不一样,在进行故障分析时需要注意。B1误码的穿通与终结 包括TM、ADM、REG,再生段B1误码只能是终结模式。B2误码的穿通与终结ADM、TM:复用段误码是终结模式。REG:不处理复用段开销,只透传,不检测。B3误码的穿通与终结 对于低阶业务,B3终结;对于VC4业务,B3穿通。低阶通道误码始终是穿通 对于低阶通道的V5误码,根据业务流向自动穿通。,Page 42,误码性能监视在维护中
17、的应用,关于误码的维护建议例行查询误码性能例行查询光板接收光功率关注机房环境和温度正确更换线路板关注网络同步情况和时钟质量,Page 43,问题,问题1:如何通过网管对误码进行监测?问题2:有高阶误码会有低阶误码吗?有低阶误码会不会有高阶误码?,Page 44,小结,本节我们主要讲解了:B1、B2、B3、V5的误码检测原理SDH误码检测的特点误码性能的检测上报点 网管的误码性能管理误码性能监视在维护中的应用,Page 45,内容介绍,误码性能事件误码检测机理误码问题的处理,Page 46,内容介绍,误码问题的处理误码问题产生的实际原因常见误码问题的处理方法案例分析,Page 47,误码问题产生
18、的实际原因,对于线路上的B1、B2、B3、V5误码产生的可能原因如下:接收信号衰减偏大光纤头不清洁光纤连接器松动或未插好光衰减器的衰减值过大或过小对端站发送部分故障本站接收部分故障,如果是B2、B3、V5误码首先考虑是否是由更高级别的误码引起的。,Page 48,内容介绍,误码问题的处理误码问题产生的实际原因常见误码问题的处理方法案例分析,Page 49,误码问题的处理,误码问题的分析处理思路:,由于高阶误码会导致低阶误码,因此我们在处理误码问题时,应按照先高阶、后低阶的顺序来进行处理。若本端上报BBE性能事件,则表示本端接收侧检测到了误码,远端发和本端收之间的通道存在问题。若本端上报FEBB
19、E性能事件,则表示远端接收侧检测到了误码,本端发和远端收之间的通道存在问题。,Page 50,光传输设备误码的处理,误码问题的分析处理方法,告警性能分析法,逐段环回法,替换法,经验法,Page 51,光传输设备误码的处理,分析处理步骤,首先排除外部的故障因素,接着观察线路板误码情况,若某站所有线路板都有误码,则可能是该站时钟板问题,更换时钟板,若只是某块线路板报误码,则可能是本站线路板问题,也可能是对端站或光纤的问题,若只有支路误码(低端设备),则可能是本站交叉板或支路板,或上游站交叉板有问题,Page 52,光传输设备误码的处理,故障定位手段检查设备/机房温度(风扇)、(时钟跟踪设置情况)分
20、析告警/性能事件发生的时间、频度、误块数量。分析告警和性能事件的时间和数量的相关性。(最好能给出受误码影响的业务通道路径图)光板对调纤芯对调检查尾纤/中继电缆、ODF(法兰盘)、DDF环回法、经验处理法,Page 53,内容介绍,误码问题的处理误码问题产生的实际原因常见误码问题的处理方法案例分析,Page 54,案例分析1,现象描述:测试OSN3500设备SSN2SL64光口输出抖动超标处理 使用ANT-20E测试OSN3500设备时,测试SSN2SL64的STM-64光口抖动值,测试时间为60S,发现B1、B2抖动值超标,而且测试时仪表出现误码指示,多次测试均超标,测试其它SSN2SL64光
21、口同样现象。告警信息:B1,B2原因分析:1、外部原因(尾纤,电源,接地等)。2、设备性能原因。3、仪表原因或设置问题。,Page 55,案例分析1,处理过程:1、重新按说明书设置仪表,重新测试,现象依旧。2、换新尾纤、调光功率值为设备收光理想值,仪表收光理想值,重新测试,现象依旧。3、换MP1590表测试,指标通过。4、测试结束后发现,原来ANT-20E所带接地线接触不良,未有效接地。建议与总结:1、使用仪表测试时一定要保证接地线有效接地,因机房中不可避免出现电磁干扰。2、测试过程中如果出现误码,排除尾纤电源问题后检查接地线。,Page 56,案例分析2,现象描述:某局点OSN3500扩展子
22、架在一次主备倒换后发现:当9,60号交叉板同为主板时,有52/53/54板位支路板有LPBBE、LPES、LPUAS、LPFEES等误码性能事情上报,并上报了BIP_SD告警,当9,59同为主板时,这些支路板上报的误码性能事件自动结束;当10,59为主板时,有52号板上报过LPFEES;10,60同为主板时没有误码告警上报。告警信息:BIP_SD告警,LPBBE、LPES、LPUAS、LPFEES等误码性能。,DB1 交 叉 板 9DB2,DB1 交 叉 板 10DB2,DB1 交 叉 板 59DB2,DB1 交 叉 板 60DB2,主子架,扩展子架,Page 57,案例分析2,原因分析:据此
23、现象,(9,59)或(10,60)同为主板时,没有误码产生,而(9,60)或(10,59)同为主板时,则扩展子架上的支路板有误码告警上报,这说明XCS与XCE板都是好的,各种不同的组合之处在于经过的连接电缆不同,初步判定为连接扩展子架与主子架的电缆有问题。处理过程:更换9号交叉板到60号交叉板的电缆和10号交叉板到59号交叉板的电缆后,误码消失,再做倒换测试依然没有误码,问题解决。建议与总结:对于扩展子架的误码问题,可以采用替换主子架交叉板到扩展子架交叉板的电缆的方法来定位和解决。,Page 58,案例分析3,现象描述:OptiX OSN 9500 ECC通讯误码不能触发ECC路由倒换光口有B
24、2误码,报B2_SD等告警,原因为接收光功率过低导致误码。由于B2误码的原因,复用段已经倒换。但ECC通讯时断时续,无法进行软件加载。告警信息:B2_SD原因分析由于B2误码同时引起D字节误码,会导致ECC丢包,但ECC并没有中断,不会选择其他的路由。由于ECC丢包,会使通信效率降低。涉及版本所有主机软件版本。处理过程:紧急恢复:将光纤调整正常或者关闭该光口的ECC。彻底解决方案:暂无。,Page 59,问题,问题1:误码是由哪些原因产生的?问题2:误码问题的处理思路是什么?问题3:如果本站有RSBBE和MSBBE,下游站点为硬件REG,那么REG站点上报告警吗?发送站点上报什么告警?问题4:
25、5.0主机中哪些告警会引发SES,并可能进入UAT?,Page 60,小结,本节我们主要讲解了:误码问题产生的实际原因误码问题的处理案例分析,Page 61,总结,本课程我们主要讲解了:误码的相关概念误码的检测机理误码问题的处理,Page 62,缩略语,OSN:Optix Switching Node 光交换节点SDH:Synchronous Digital Hierarchy 同步数字体系BER:Bit Error Ratio 比特错误率EB:Error Block 误码块ES:Errored Second 误码秒SES:Serious Errored Seconds 严重错误秒SDP:Se
26、rious Disturbance Period 严重扰动期CSES:Continuous Serious Errored Seconds l连续严重错误秒SESR:Serious Errored Seconds Ratio 严重误码妙比,Page 63,缩略语,BBE:Background Block Error 背景误码块BBER:Background Block Error Ratio 背景误码块差错比OOS:Out of Service 中断业务FEES:Far-end Error Second 远端误码秒FEBBE:Far-end Background Block Error 远端背景误码 UAT:Unavailable Time 不可用时间RS:Regeneration Section 再生段MS:Multi Section 复用段HP:Higher Order Path 高阶通道LP:Lower Order Path 低阶通道,