PON网络告警压缩.doc

上传人:文库蛋蛋多 文档编号:4138061 上传时间:2023-04-07 格式:DOC 页数:8 大小:550KB
返回 下载 相关 举报
PON网络告警压缩.doc_第1页
第1页 / 共8页
PON网络告警压缩.doc_第2页
第2页 / 共8页
PON网络告警压缩.doc_第3页
第3页 / 共8页
PON网络告警压缩.doc_第4页
第4页 / 共8页
PON网络告警压缩.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《PON网络告警压缩.doc》由会员分享,可在线阅读,更多相关《PON网络告警压缩.doc(8页珍藏版)》请在三一办公上搜索。

1、成果上报申请书成果名称PON网络告警压缩关键词索引(35个)PON 告警压缩对企业现有标准规范的符合度:符合PON技术规范的业务配置标准成果来源:省公司自立项目(2012年上报集团的网络最佳实践项目和省内网络研究课题IP化传输网络感知提升研究项目)专利情况:无成果简介:随着全业务的不断发展,PON网络告警数量激增,使得网管运行速度慢,同时海量告警导致无法及时发现和处理重要站点告警;此外海量告警也造成网管服务器内存耗尽、CPU过忙、数据库异常等情况,致使网管系统不能正常、稳定的运行。本课题梳理PON网络告警原因,制定告警抑制策略,同时配合网管告警相关功能,实现告警数量的压缩。这些方案都是在江苏现

2、网实施,告警压缩率达89%。实施了告警缩减方案工作后,事件和通知的数量降低到缩减工作前的11%左右,同时服务器CPU和内存占用率也都降低明显,使不会由于告警量的异常情况导致内存消耗完而导致网管宕机重启,保证了网管服务器的长期稳定运行。省内试运行效果:已经在苏州分公司和镇江分公司试点应用,并推广至全省。实施了告警缩减方案工作后,事件和通知的数量降低到缩减工作前的11%左右,同时服务器CPU和内存占用率也都降低明显,保证了网管服务器的长期稳定运行。同时PON网络告警处理人员数量也下降至60%。文章主体(3000字以上,可附在表格后):一、概况随着全业务的不断发展,PON网络告警数量激增,使得网管运

3、行速度慢,同时海量告警导致无法及时发现和处理重要站点告警;此外海量告警也造成网管服务器内存耗尽、CPU过忙、数据库异常等情况,致使网管系统不能正常、稳定的运行。本课题梳理PON网络告警原因,制定告警抑制策略,同时配合网管告警相关功能,实现告警数量的压缩。这些方案都是在江苏现网实施,告警压缩率达89%。二、成果背景从现网上报的告警信息来分析可以发现,告警主要由告警、TRAP两方面产生,要压缩告警就需要从这两方面着手解决。告警方面,主要采用过滤次要告警,抑制频发告警,屏蔽误报告警等手段进行压缩。根据故障影响严重程度、故障影响范围大小、故障发生可预见性等信息对告警进行区分,过滤其中次要告警,判断次要

4、告警原则如下:1、故障点所处网络位置较低的告警2、故障点因传送质量不良对业务受损较小的告警3、故障点是最终用户正常行为导致的业务中断的告警4、故障点没有业务应用的告警5、故障处于临界范围而频繁上报的告警6、主要故障伴随、扩散产生的告警7、故障对象海量同时短时间内同时故障的告警8、故障点处于主动升级、工程施工、故障保修等维护活动的告警9、因扩容、搬迁等数据变更导致的告警,如删除、更换单板。现网PON设备派单告警列表:频发告警方面:1、对单板频繁复位导致告警频发的情况,要求厂家对设备进行优化,优化单板复位和告警报送原则。2、对于频发告警,要求厂家进行告警抑制,目前是利用网管的雪崩告警功能进行抑制。

5、3、对于重发告警,要求厂家有机制保证不会有故障重复上报。4、对于振荡告警,要求厂家建立双门限、恢复告警延迟发送等多种机制进行抑制。三、处理思路和现场策略对于PON告警压缩的思路如下:1、实施对不关注告警在设备上过滤的方案,在设备上直接抑制不在用的告警的产生。2、对关注的告警中出现数量多的情况,现网排查原因后在网管上通过雪崩告警进行抑制。3、对于可能导致告警频发、重发的故障原因,现网查明原因后尽快处理。现场处理采取的策略1)二八原则分析,TOP n方法锁定解决方向对于告警数量庞大的情况,采用二八原则,关注数量最多的TOP n告警,研究解决方法,并根据情况采取处理措施,比如,工程上消除告警产生根源

6、;若是设备缺陷或故障,则进行改进、解决;无关紧要告警进行网管屏蔽或网元屏蔽等。该策略通常是处理大量告警的首选,可以有效的降低告警总量。2)对告警是否可屏蔽的界定原则进行统一根据以往大量的工程经验,对于不产生用户明显可感知的服务质量问题的告警,用户是不敏感的。这种告警通常是应当屏蔽的。对于用户明确要求或对运维有重要影响的告警,不能屏蔽。3)以用户为中心的屏蔽可以采用试错法处理,即先尽可能地把我们认为不必要的告警屏蔽掉,然后通过用户在实际运维中的反应,逐个放开确实需要的告警。四、实际应用情况(以镇江市的现网应用为例)1、从现场获取告警数据根据进行“重点、典型局点分析”的思路,我们采集了某地市移动的

7、PON网管告警数据库,依据这些来自现场的数据进行分析。2、分析确定需要屏蔽的告警下面是该移动(4月17日-4月19日)网管告警数据统计的情况:4月17告警总数4月17掉线掉电告警总数4月17PON信号丢失告警总数4月17其他告警总数及其他主要告警26129258642623(OLT设备通信链路中断)4月18告警总数4月18掉线掉电告警总数4月18PON信号丢失告警总数4月18其他告警总数及其他主要告警23619234092091(OLT设备通信链路中断)4月19告警总数4月19掉线掉电告警总数4月19PON信号丢失告警总数4月19其他告警总数及其他主要告警24402241712301(上联口链

8、路中断)24402241712301(上联口链路中断)分析了这三天的告警情况:TOP3的告警为ONU掉电、掉线告警、PON口信号丢失告警,以上3类告警占用告警问题的98%,基本没有垃圾告警,可见镇江移动的中兴PON网管告警种类正常。 另在梳理统计中发现,PON网管中存在较多3分钟之内即恢复的告警约占50%.这部分告警可采用“告警延迟规则”进行压缩(即3分钟之内自动恢复的告警不上报网管)。4月24日在网管中添加针对OLT增加告警延时规则:43016,43265,43015 (ONU掉线、ONU掉电、PON信号丢失告警),延迟时间为90秒。下面是(4月29日-5月2日)网管告警数据统计的情况:4月

9、17告警总数4月17掉线掉电告警总数4月17PON信号丢失告警总数4月17其他告警总数及其他主要告警26129258642623(OLT设备通信链路中断)4月18告警总数4月18掉线掉电告警总数4月18PON信号丢失告警总数4月18其他告警总数及其他主要告警23619234092091(OLT设备通信链路中断)4月19告警总数4月19掉线掉电告警总数4月19PON信号丢失告警总数4月19其他告警总数及其他主要告警24402241712301(上联口链路中断)24402241712301(上联口链路中断)分析了这三天的告警情况:TOP3的告警为ONU掉电、掉线告警、PON口信号丢失告警,以上3类

10、告警占用告警问题的98%,基本没有垃圾告警,可见镇江移动的中兴PON网管告警种类正常。 另在梳理统计中发现,PON网管中存在较多3分钟之内即恢复的告警约占50%.这部分告警可采用“告警延迟规则”进行压缩(即3分钟之内自动恢复的告警不上报网管)。4月24日在网管中添加针对OLT增加告警延时规则:43016,43265,43015 (ONU掉线、ONU掉电、PON信号丢失告警),延迟时间为90秒。下面是(4月29日-5月2日)网管告警数据统计的情况:4月30告警总数4月30掉线掉电告警总数4月30PON信号丢失告警总数4月30其他告警总数及其他主要告警9378932355无5月1告警总数5月1掉线

11、掉电告警总数5月1PON信号丢失告警总数5月1其他告警总数及其他主要告警98559793611(板卡状态异常)5月2告警总数5月2掉线掉电告警总数5月2PON信号丢失告警总数5月2其他告警总数及其他主要告警74657390741(与OLT设备通信链路中断)分析了这三天的告警情况:TOP3的告警仍然为ONU掉电、掉线告警、PON口信号丢失告警,但数量有了明显下降。采取如上操作后,镇江移动中兴PON网管告警数量减少约60%左右。 对于PON信号丢失的告警,统计分析发现,该告警为某个PON口下只装有一台或有且只有一台ONU设备在正常使用,当该正常使用的ONU设备发生断电或故障时,此时该PON口就会产

12、生PON信号丢失的告警。针对该告警暂时无有效方法压缩处理。按照统一要求,目前PON网管压缩告警的规则共4条:1.ONU单独添加到网管的地市,请增加告警入库过滤规则:系统类型选择链路告警,告警码选择与设备通信链路断(1)。这样可以解决1个ONU中断,上报两台告警的问题(OLT和网管都会各报一条)。镇江移动网管暂无单独添加ONU单独网元。2.针对OLT增加告警入库过滤规则:将EPON光路告警误码相关的屏蔽:代码43014,43017-43022,这几条告警对于日常监控意义不大错误代码中文含义43014设备OLT端口比特错误率状态43017ONU错误符号间隔事件43018ONU错误帧间隔事件4301

13、9ONU错误帧事件43020ONU错误帧秒总数事件43021ONU上行链接比特错误43022ONU上行链接帧错误3.针对OLT分别增加告警入库过滤规则:将E1相关的业务告警码分别添加。4.针对OLT增加告警延时规则:43016,43265,43015 (ONU掉线、ONU掉电、PON信号丢失告警),90秒之内自动恢复的不上报网管。3、 后续采取措施根据对优化后的告警统计,ONU掉电掉线告警中,F401等FTTH的掉电掉线是因用户断电导致,其占到告警总量的70%。这部分告警屏蔽,可以使用设置服务等级来实现。但需要在网管上打P011补丁。该补丁即将发布,具体操作如下,后续将实施完成。第一步,先打上

14、P011的补丁;第二步,网管有“提取统计网元策略”或者“同步网元数据策略”的策略并对所有OLT网元执行完毕;第三步,数据库,执行下述sql语句后,针对 ZTE-F401、ZTE-F460类型的 ONU都会采用 缺省 服务等级,其他类的“F820/F822”则设置为普通服务等级。update onubasicinfotable set OnuQosProfileId=11020100221 where type in(ZTE-F420,ZTE-F401);update onubasicinfotable set OnuQosProfileId=11020100223 where type in(

15、ZTE-F820,ZTE-F822);第一句是把各种SFU改为“缺省”,第二句是各种mdu改为“普通MDU”,需要在(ZTE-F420,ZTE-F460) 中加上你所需要修改的所有网元类型 注意加上 单引号 引用,且每句后面有英文分号;11020100221 缺省11020100222 重要ONU11020100223 普通MDU11020100224 普通SFU第四步,通过网管客户端随机找一台ONU,打开 ONU监控等级配置 界面,将缺省级别的 ONU掉电 告警级别设置为丢弃,ONU掉线 告警级别按照各地局方相应要求修改。在该界面中先调整各类告警级别,然后单击 修改(修改服务等级模板)全局生

16、效同理,对于第三步 使用到的服务等级模板,按照各地局方相应的告警级别要求进行相应调整,最后单击 修改 即可。第五步,重启网管服务器。验证设置的结果。4、注意点:N31网管对于新开通的各类ONU默认自动适配 缺省 的服务等级,无法自动适配上述第三步设置的相应类别ONU的服务等级。所以如果新开的是F401则可以不管,但是如果是F820等不需要屏蔽 ONU掉电 或者 ONU掉线 的各类ONU,新开通后只能通过网管手工一台台调整其服务等级级别,否则将不再上报此类告警。“成果上报申请书”的填写说明:1、“成果专业类别”指:核心网、无线、传输、IP、网管、业务支撑、管理信息系统、市场研究、数据业务、数据网

17、络、通信电源、空调、其他。2、“成果研究类别”指:超前研究、新产品开发、相关网络解决方案、现有业务优化、其他。3、“所属专业部门”指:完成该成果的单位在省公司或地市分公司所属的专业部门线条。可填写:规划计划线条、网络线条、业务支撑线条、管理信息系统线条、数据线条、市场线条、集团客户线条、其他。4、“省内评审结果”指:优秀、通过。5、“对企业现有标准规范的符合度”指:列举该成果使用并符合的中国移动统一发布的企业标准的名称和编号,详细描述该成果在现有的企业标准基础上所需新增的功能要求(如业务流程的改变、设备新增的功能要求等)。6、成果来源指:如果该成果来源于集团研发项目,请填写研发项目的年度、项目

18、名称和类型(类型包括:集团重大研发项目、集团重点研发项目、省公司自立项目)。7、专利情况指:1)类型:发明、实用新型、外观2)名称:该成果申请专利的名称3)申请号:由知识产权审查机构授予的该成果专利申请号4)状态:申请中、已授权8、“文章主体”:根据不同科技成果分类实施不同的主体要求,具体如下:1)超前研究类成果主体包括: 背景情况 技术特点分析 标准化情况 其他运营商应用情况(可选) 技术发展趋势 引入策略分析2)相关网络解决方案类成果主体包括: 背景情况 技术方案:概述、网络解决方案(如果涉及到网络方面的改造,信令改造,路由改造等,应有详细的描述)、设备及系统改造/建设要求、码号资源需求

19、效果(解决了哪些问题) 本省应用推广情况3)新产品开发类成果主体包括: 业务及功能简介:业务概述、业务主要功能介绍 技术实现方案:包括业务实现组网结构图、相关系统(平台、终端)功能和要求、业务实现流程、码号要求等 业务申请和开通:包括用户范围及业务使用范围、业务申请与注销等 业务商务模式及资费:包括商务模式、业务资费模式、业务收费方式等 市场前景分析4)现有业务优化类成果主体包括: 业务及功能简介:业务概述、业务主要功能介绍 现有业务存在的问题:现有缺陷分析、解决问题的思路 原有业务方案/流程:业务实现组网结构图、相关系统(平台、终端)功能和要求、业务实现流程 优化后的方案/流程:业务实现组网结构图、相关系统(平台、终端)功能和要求、业务实现流程 优化后达到的效果,产生的经济效益 5)其他类成果主体,参考1)4)的成果主体要求,阐述清楚项目背景、实现方案、解决的问题、取得的社会和经济效益等。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号