IT运维监控管理平台建设方案参考.docx

上传人:李司机 文档编号:5534153 上传时间:2023-07-19 格式:DOCX 页数:60 大小:190.98KB
返回 下载 相关 举报
IT运维监控管理平台建设方案参考.docx_第1页
第1页 / 共60页
IT运维监控管理平台建设方案参考.docx_第2页
第2页 / 共60页
IT运维监控管理平台建设方案参考.docx_第3页
第3页 / 共60页
IT运维监控管理平台建设方案参考.docx_第4页
第4页 / 共60页
IT运维监控管理平台建设方案参考.docx_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《IT运维监控管理平台建设方案参考.docx》由会员分享,可在线阅读,更多相关《IT运维监控管理平台建设方案参考.docx(60页珍藏版)》请在三一办公上搜索。

1、IT运维监控管理平台建设方案xxxxx书目第1章概述51.1 建设背景51.2 建设目标51.3 建设思路7第2章系统总体设计82.1 总体架构82.2 设计原则102.3 运维管理体系架构设计11系统总体架构设计11监控采集层11数据处理层12运行呈现层122.4 系统技术路途13采纳JaVa语言开发13采纳J2EE框架14采纳WebSerViCe进行数据互连互通15数据库技术18性能限制18开发、运行环境182.5 应用接口总体设计19系统内部集成接口19与基础运维管理工具的集成接口19与ITSM系统的集成接口20与相关外部系统的统一身份认证与单点登录接口202.6 系统平安设计与部署21

2、输入检验212. 6.2GET恳求和COOkie中的敏感数据22防通过嵌入标记实现的攻击22防口令揣测功能22页面和字段级的权限限制22系统平安架构23第3章系统功能设计243. 1动环监控24配电柜监测24配电开关与电流监控24发电机监控253. 1.4ATS监测253. 1.5STS监测263. 1.6UPS监控子系统273.2 统一门户子系统27信息主管领导内容展示28运维人员内容呈现28一般用户内容呈现293.3 IT运行监控子系统29基础平台功能29网络设备管理32服务器监控管理36存储监控管理38数据库监控管理39中间件监控管理403.3.7web与应用监控管理42虚拟化监控管理4

3、33.3.9IP地址管理管理43信息点管理45告警监控管理与转发处理46综合监控管理48综合报表管理493.4 IT服务管理子系统50功能特点50服务台管理54服务书目管理55服务恳求管理55事务管理56问题管理56变更管理57值班管理58公告管理583.4.10IT运维报告59用户管理59第4章培训方案60第5章系统价值61第6章售后服务61第1章概述1.1 建设背景随着近年来经济的进一步快速发展,企事业机关单位IT运行环境日趋困难,运行监控工作难度加大,尤其是随着信息化建设的不断深化,信息系统越来越多,各类系统越来越困难,系统的关联度也越来越高。数据处理量成倍增长,而随着互联网应用的发展,

4、网上应用系统也越来越多,使IT系统运行环境变得更加困难,造成了机房管理、系统监控、运行维护工作特别困难的局面。虽然信息中心各科室对已经有各的监控管理手段,但缺乏一个集中、统一的监控平台,与时发觉与解决网络、硬件、平安设备、操作系统、数据库、中间件、应用系统、机房空调、UPS等突然出现的问题。因服务对象的不同,运用产品混杂。怎样很好地解决以上问题,把各种类型的监控对象进行统一集中监控,并将其格式统一规范,并对其有效处理、分析,以直观的界面呈现给各科室管理员、领导,成为目前面临最大的挑战。1.2 建设目标加强信息资源的维护平台建设,提高信息资源的运行管理水平,通过运维体系的建设,结合构建集中式的服

5、务热线、运维流程、系统监控和综合展示系统,通过系统联动,与时、精确、全面反映与驾驭信息系统的运行状态,保障各业务系统的正常运行,应达成如下目标:强化主动监控,实现集中管理。以IT资源可用性监控为主线,构建统一集成的IT资源与应用服务监控平台,能够主动、与时地发觉问题,并调度资源解决问题,形成IT运维管理主动服务的新局面。帮助定位故障,快速复原系统运行。建立集中的告警分析与呈现平台,供应敏捷、自动化的事务处理实力。当故障产生时,可以进行故障的快速定位,发觉故障缘由,调度资源快速复原系统服务,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。驾驭运行质量与效率,合理利用资源。建立IT运维平台

6、后,可以实时了解全部IT资源的负载与运用状况,依据须要从整体角度考虑资源的运用,同时可以依据业务高峰期的不同来调剂业务系统对资源的运用。(4)规范运行管理,有序开展维护。参照ITIL规范,对运维管理工作进行优化,对服务管理进行改善,将管理数据电子化,管理过程规范化。依据相关制度进行运行维护管理,对内完善流程,对外提高服务,加强管理,使流程更规范更合理,使技术人员具备更高的工作效率,提高业务技术实力和解决实际问题的实力。共享运维阅历,完善学问库。把运维过程中产生的丰富阅历进行积累和总结,形成有效的学问库,建立学问的共享机制,供应信息共享和沟通的平台,提高运维人员的工作效率。1.3 建设思路IT运

7、维管理理论、方法和标准,结合中心实际和建设须要,遵循立足需求、统一规划、保障重点、分步实施、务求实效的原则,建立一套融合组织、制度、流程、人员、技术的IT运维管理体系,建立组织机构,制定规章制度,规范管理流程,明确职责分工,强化技术支撑,实现对网络与信息系统的综合管理监控和日常技术支持,快速响应和与时解决信息系统运行过程中出现的各种问题和故障,确保所维护网络与信息系统正常、稳定、高效运行。第2章系统总体设计2.1 总体架构依据对IT运维管理体系的建设阅历,以与对用户信息系统现状、需求的分析,我们提出三位一体综合运维管理平台框架图如下:IT运行集中监控故障解决故障佚复IT运维服务流程ml机一故先

8、摩其它I 中*WEB咨询与实施服务IT运维管理平台包括:“IT运行集中监控、IT运维流程服务、统一运维门户”三个部分。底层基础平台主要实现对底层数据的采集、存储、分析等工作,为上层监控与流程系统供应基础数据;IT运行监控主要完成对基础设施故障、性能、配置等方面的全面监控管理,实现主动式的IT管理;IT运维流程服务主要依据IT服务管理的国际标准IS02000,并结合FrIL最佳实践,梳理出了事务管理、问题管理、变更管理等运维流程,实现对日常运维工作的流程化、规划范管理,提升IT服务的质量。统一门户主要实现对监控信息、运维流程信息进行集中展示。平台三个子系统关系如下:以IT运行监控为“基础”这部分

9、的功能主要是对被管对象运行的状态以与其配置资产信息进行统一监控、管理、分析,实现对各种故障和性能异样的与时报警,对系统运行性能进行实时监控,对系统运行的各种状态信息进行汇总、分析以与预料。另外,还包括对IT系统的全部配置资产状况进行统一管理,对配置信息的异动供应检查与告警。IT监控管理除了实现网管的告警、性能、配置几大基本功能以外,还从运维的角度供应丰富的数据综合分析和运维工具,例如综合报表、综合监控、信息点管理等。(2)以IT服务管理为“导向”这部分功能主要依据ITIL架构进行建设,为IT系统的维护服务供应电子化的限制手段。系统通过事务管理、问题管理、变更管理、配置管理等功能,为IT维护人员

10、供应以流程为基础的服务管理方式,规范管理模式,达到快速消退IT系统故障、解决潜在问题,削减不规范的系统变更引发的系统故障率和故障隐患等目的,实现对IT系统的主动式服务,提高服务水平。以统一运维门户为“体现”即是整个系统的对外界面,通过统一的权限管理和统一风格的B/S呈现,为系统的操作运用人员供应统一的系统接口,做到一点接入,通观全局,能够以敏捷的组织数据的呈现方式,定义用户、角色、组织机构,并为每个不同角色供应不同的功能模块,为每个用户安排不同的呈现内容,便利用户进行企业整体的运行维护管理。2.2 设计原则IT运维平台作为信息中心将来运维工作的核心支撑系统,须要系统本身具有高牢靠、易扩展、易维

11、护等特点,并且在系统功能应用上要具备肯定的技术先进性和好用性。所以,本次项目的方案设计遵循以下设计原则:(1) 先进好用平台注意先进性和好用性的统一,以好用为目的,合理选用各类成熟、先进技术。在体系结构、功能算法等诸多方面都采纳先进计算机技术和理论,应用功能体现好用性。(2) 牢靠性在系统结构、设计方案、设备选择、技术服务等方面综合考虑,保证系统能够7*24平安无故障运行,系统有很好的容错功能;对IT资源的监测应保证不影响相关设备和系统的正常良好运行,并实现最好的响应效率与最小的资源占用。(3) 平安性注意平安方面的设计,确保IT运维监控管理平台的稳定、平安运行。系统要保证数据的平安,不会增加

12、现有应用系统的困难性,更不会降低现有应用系统的稳定性。(4)开放性采纳符合国际国内标准的通用协议,为实现与其他系统监控软硬件互联或接入本系统进行监控供应接口,支持各种主流计算机平台、操作系统以与数据库厂商的各类软硬件产品。(5)可扩展、易集成系统需具备很好的扩展性,能适应不断发展的业务需求。随着IT资源种类和数量的扩大,系统也应能适应新的系统的对IT运维管理的需求。系统具备高度集成性,可以和第三方产品进行集成,进行功能扩展。系统供应开发工具和接口,便利其他监控系统集成和统一管理。2.3 运维管理体系架构设计与运维综合监控相关的运维管理体系架构主要包括以下内容:1)资源监控与操作管理体系:面对资

13、源,以统一资源配置库(资产与配置、监控数据库)为基础,建设面对被管理资源的监控管理与操作自动化管理体系。2)数据综合分析体系:面对管理者,以统一资源配置库为基础,对资源监控与操作管理体系数据进行分析挖掘,建设协助运营决策的数据综合分析体系。运维管理体系架构是一个完整的IT系统运维管理架构,是IT综合运维管理的较高目标。2.3.1 系统总体架构设计系统由监控采集层、数据处理层、服务管理层、运行呈现层组成。2.3.2 监控采集层监控采集层主要由网络监控模块(NCC).应用监控模块(BCC)组成,实现对IT基础支撑系统的监控,包括:网络设备、业务服务器、存储设备、数据库系统、中间件系统、平安设备、业

14、务应用系统、网络流量等。同时,从第三方系统(如机房环境监控和视频监控系统等)抽取数据(包括资产配置数据、故障告警数据),实现对IT资源的全面监控。2.3.3 数据处理层数据处理层由统一事务平台(Arbiter)、数据指标抽取模块(Bridge)、监控指标库(RDB).可视化呈现视图(Live)等模块组成。监控指标库(RDB)存放了全部监控对象的当前运行状况、重要告警、重要KPl性能指标等数据,实现性能基线管理,并为监控对象的可视化呈现供应数据支持。CMDB与RDB数据库的记录通过资源唯一标识ID(UUID)实现一一对应,并能够自动维护其相互关联关系。数据指标抽取(Bridge)负责从底层监控工

15、具和第三方系统抽取各类管理数据,如资产配置数据、性能数据、监控对象运行状态数据、故障告警数据等。其中故障告警数据送到统一事务平台进行处理,性能和状态数据进过处理后存放到RDB数据库中,资产配置数据经过数据清洗、调和处理后送到CMDB数据库中。统一事务平台负责对来源不同的告警信息进行过滤、压缩和关联,以与对不同来源的性能数据进行规范、汇聚、分析等,并通过根源问题发觉等功能,实现快速的故障定位,保证业务系统的监控运行。灵动呈现平台是一个特性化监控视图开发工具,可以依据管理需求,对各类资源进行敏捷组合,生成各类资源呈现监控视图。2.3.4 运行呈现层运行呈现层有运维门户(Portal)、用户管理(A

16、CM)、报表开发工具(Report)组成。运维门户(portal):向用户供应基于WEB的统一运维管理访问入口,运用户能够在统一登录、统一认证的状况下,实现对故障告警台、服务台、服务流程管理、监控视图、统计报表的访问。报表开发工具能够依据管理须要抽取监控、操作、资产、流程等各管理层面的数据,并生成各类统计报表,为运行分析和管理提升供应支持。用户管理实现组织架构管理、帐户管理、角色管理、授权管理等功能,实现整个运维平台的统一帐户和授权管理。2.4系统技术路途2.4.1采纳Java语言开发系统采纳JAVA和XML相结合的技术进行网站设计开发,由于Java的平台无关等特性,而在数据表示和传输方面,X

17、ML有着得天独厚的优势。JaVa与XML的组合供应了建立三层应用程序的最佳手段,开发的系统具有跨平台运行的实力,无论在windows环境下还是在其他主流操作系统环境下都能运行。主要特点:平台独立性这是JaVa最吸引人的地方。由于它采纳先编译成中间码(字节码),然后装载与校验,再说明成不同的机器码来执行,即“Java虚拟机”的思想,“屏蔽”了具体的“平台环境”特性要求,使得只要能支持JaVa虚拟机,就可运行各种JaVa程序。面对对象的技术面对对象的技术是近年来软件开发中用得最为普遍的程序设计方法,它通过把客观事物进行分类组合、参数封装、用成员变量来描述对象的性质、状态,而用方法(成员函数)来实现

18、其行为和功能。面对对象技术具有继承性、封装性、多态性等众多特点,JaVa在保留这些优点的基础上,又具有动态联编的特性,更能发挥出面对对象的优势。多线程多线程机制使应用程序能并行执行,Java有一套成熟的同步原语,保证了对共享数据的正确操作。通过运用多线程,程序设计者可以分别用不同的线程完成特定的行为,而不须要采纳全局的事务循环机制,这样就很简洁实现网络上实时的交互行为。动态性Java的设计使它适合于一个不断发展的环境。在类库中可以自由地加入新的方法和实例变量而不会影响用户程序的执行。并且Java通过接口来支持多重继承,使之比严格的类继承具有更敏捷的方式和扩展性。平安性Java有建立在公共密钥技

19、术基础上的确认技术,指示器语义的变更将使应用程序不能再去访问以前的数据结构或是私有数据,大多数病毒也就无法破坏数据。因而用JaVa可以构造出无病毒、平安的系统。2.4.2采纳J2EE框架考虑到系统的跨平台性和将来良好的移植性,并且考虑到系统能够将来很好地与其他业务子系统的集成,本系统采纳J2EE平台,并且依据J2EE的中间件规范进行产品开发,本系统采纳J2EE平台集成的标准中间件,并在数据交换和数据导出上支持XML标准。平台比较目前,可作为开放式数据应用集成的规范和平台的技术主流有两种,一种是微软公司的WindOWSDNA平台,另一种是SUN公司的J2EE平台。虽然这两种集成平台和分布式计算技

20、术都能满足实施开放式的数据应用集成的需求,但是从规范的开放性、支持异构性、可移植性、支持的广泛性、对现有系统数据的继承性和技术优势等方面比较,J2EE比WindowsDNA具有优势。平台优势J2EE是一种利用Java2平台来简化诸多与多级企业解决方案的开发、部署和管理相关的困难问题的体系结构。J2EE技术的基础就是核心Java平台或Java2平台的标准版,J2EE不仅巩固了标准版中的很多优点,例如“编写一次、到处运行”的特性、便利存取数据库的JDBCAPI、CORBA技术以与能够在Internet应用中爱护数据的平安模式等等,同时还供应了对EJB(EnterpriseJavaBeans)Jav

21、aServletsAPI、JSP(JavaServerPages)以与XML技术的全面支持,可以更好地与其他的分布式应用系统集成。因此J2EE是一种更志向的集成平台和规范。2. 4.3采纳WebService进行数据互连互通Web服务是一个或者一组应用程序,向外界供应一个能够通过Web进行调用的APEWeb服务的主要目标是在现有的各种异构平台的基础上构筑一个通用的与平台无关、语言无关的技术层,多种不同平台上的应用依靠这个技术层来实施彼此的连接和集成。1. Web服务模型Web服务体系结构是基于三种角色之间的交互,分别是服务供应者、服务注册中心和服务恳求者。其中:(1)服务供应者:创建Web服务

22、实体,为能实现一组特定任务的软件供应服务接口;(2)服务恳求者:发觉和调用软件服务,恳求者一般会调用服务供应者发布的远程方法,把参数数据发送给供应者并接收相应结果;(3)服务注册表:管理和发布服务。当服务恳求者须要调用服务时,它首先到UDDl注册中心搜寻该服务,得到如何调用该服务的信息,然后依据这些信息去调用服务供应者发布的服务。在WebSerViCe服务体系中,运用WSDL来描述服务,UDDl来发布、查找服务,而SoAP用来执行服务调用。下图显示了这些操作、供应这些操作的组件与它们之间的交互。2. Web服务的相关标准在Web服务协议栈中,涉与了数据、消息、服务和注册库的描述定义,这些要用到

23、具体的标准技术,包括XML、SOAPWSDLUDDl等。其中XML用来描述不同层次的数据,它使得不同平台、不同环境中的数据和消息得以互通;SOAP协议用来交换XML消息;WSDL用来统一描述服务;UDDl供应了统一的框架和编程接口,与WSDL、SOAP相互结合来管理Web服务,供应服务发布和服务发觉实力。(1)扩展标记语言(XML)(2)简洁对象访问协议(SOAP)(3) Web服务描述语言(WSDL)(4)统一描述、发觉和集成协议(UDDl)3. Web服务的协议栈为了实现上述Web服务模型中的发布、查找、绑定等操作,须要定义一系列分层的协议规范。服务发觉:这一层用来发觉Web服务,来满足自

24、己的需求。由UDDl来处理的。服务描述:对Web服务进行自我描述。它运用WSDL来进行服务描述。服务调用:这一层的实质是基于XML的消息传递。当前基于XML消息传递的行业标准是SOAP。SOAP是一种简洁的、轻量级的基于XML的机制,用于应用程序之间进行结构化数据交换。SOAP可以和各种网络协议相结合运用。当然我们可以运用其他的基于XML的消息如XML-RPC等。传输层:用来传送客户端和服务器之间的消息。这一层运用的协议通常是HTTP协议。理论上,我们可以运用任何网络协议,如FTP,SMTP,HOP等,但目前运用最广泛的是HTTP协议2.4.4数据库技术数据库(Database)是依据数据结构

25、来组织、存储和管理数据的仓库,它产生于距今五十年前,随着信息技术和市场的发展,特殊是二十世纪九十年头以后,数据管理不再仅仅是存储和管理数据,而转变成用户所须要的各种数据管理的方式。数据库有很多种类型,从最简洁的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。在选择数据库时,成本因素是主要要考虑的问题。采纳J2EE作为系统的开发平台,在开发上运用ORM(ObjeCt/RelationMapping)技术和JDBC技术,尽力去缩小数据的差异性,实现跨数据库平台。系统数据库初步采纳OraCleHgo2.4.5 性能限制采纳Jmeter做Web系统压力测试,通过

26、优化程序、优化数据库等方法实现系统性能要求。2.4.6 开发、运行环境操作系统支持:Linux、WindowServer2023/2023阅读器支持:IE6、IE7、IE8、Firefox3.5开发平台与语言:J2EE平台、采纳JAVA语言设计工具:ProwerDesigner15.0开发工具:Eclipse3.1、Maven3.0版本限制:SVN1.5项目管理:MicrosoftProject2023缺陷管理工具:Bugzilla3.2Web测试工具:Jmeter2.3、IETester2.1Web服务器支持:Weblogic10.3、Tomcat6.02.5应用接口总体设计IT系统监控管理

27、平台在实现IT运维监控管理等信息的采集、存储、处理、加工、传输、统计分析、应用、系统管理的同时,与相关外部系统有着亲密的联系,包括:基础运维管理工具、机房动力环境监控系统、ITSM系统、短信平台等系统有着紧密的联系。2.5.1 系统内部集成接口(1)接口功能设计本接口实现分级状况下支撑系统之间的告警、性能等数据交互。(2)接口实现设计1)接口服务:利用应用支撑层的数据交换接口服务来实现接口功能。2)接口技术:WebService、SOAP、文件、码流等。2.5.2 与基础运维管理工具的集成接口(1)接口功能设计该接口对基础运维管理工具的网管、安管、主机管理、存储管理、机房动力环境监控等系统之间

28、的事务、性能、告警等关键数据进行抽取、汇聚,以支持对监控数据的预警、统一呈现。(2)接口实现设计1)接口服务:利用应用支撑层的数据交换接口服务来实现接口功能。2)接口技术:WebService、SOAP、文件、码流等。2.5.3与ITSM系统的集成接口本接口实现IT系统监控管理平台与原有ITSM(运维服务管理)系统之间的数据交互,满足监控数据的实时抽取、汇总、预警、统一呈现的需求。(1)接口功能设计1)运维监控数据抽取、汇聚、展示该接口对IT系统监控管理平台的网络监测与管理、业务系统监测的告警、性能等关键数据进行抽取、汇总、预警、统一呈现。2)生成基于故障告警事务信息的故障工单信息ITSM系统

29、依据IT系统监控管理平台所产生的故障告警事务信息自动生成相应的故障工单信息。3)故障工单数据和处理状态同步该接口协助两边系统保持故障工单数据和处理状态的同步。(2)接口实现设计D接口服务:利用应用支撑层的数据交换接口服务来实现接口功能。2)接口技术:WebService、SOAP、文件、码流等。2.5.4与相关外部系统的统一身份认证与单点登录接口本系统将对IT系统监控管理平台与基础运维管理工具、ITSM系统、机房动力环境监控系统等相关外部系统进行门户集成,从而在统一运维管理门户中实现这些系统的统一身份认证和单点登录,形成统一的运维管理运行机制,从而有效集成并利用各类运维管理资源。1)统一身份认

30、证:对IT系统监控管理平台与基础运维管理工具、ITSM系统、机房动力环境监控系统等相关外部系统的用户进行管理集成,纳入到统一运维管理门户访问限制体系中,实现对IT系统监控管理平台用户的统一身份认证。2)单点登录:对IT系统监控管理平台的各模块,以与该系统与基础运维管理工具、ITSM系统、机房动力环境监控系统等相关外部系统在统一运维管理门户中的单点登录限制,运用户登录一次便可访问全部授权应用资源。2.6系统平安设计与部署采纳Web技术实现,在具有便利好用优点的同时,存在一些平安威逼和隐患,在系统平台上构建应用时应充分考虑以下的平安问题。在系统平台设计时充分考虑下列平安问题:脚本语言的平安性问题,

31、特殊是用SQL查询时所书写的语句。访问文件、数据库或其他网络连接时不应当接受未经检验的用户输入。2.6.1 输入检验输入检验包括对来自外部数据源(非置信数据源)的数据进行语法检查,有时还要进行语义检查。依据应用的关键程度和其他因素,对输入检验结果实行的平安过滤处理。2.6.2 GET恳求和Cookie中的敏感数据就像CGl协议所定义的,把恳求数据从客户端传输到服务器端最简洁的方法是GET恳求方法。假如要在客户恳求中传输敏感数据,我们应当运用POST方法,再加上一种合适的加密机制(例如,通过SSL连接)。2.6.3 防通过嵌入标记实现的攻击这种攻击通常包含一个由用户提交的病态脚本,或者包含恶意的

32、HTML(或XML)标记,JSP引擎会把这些内容引入到动态生成的页面。这种攻击可能针对其他用户进行,也可能针对服务器。要防止出现这种问题要靠输入检查和输出过滤。2.6.4 防口令揣测功能当用户试图多次揣测时,系统会不断增加响应的时延,并最终拒绝为用户供应服务。另外,建议对系统口令长度加以限制,并且不能取特殊熟识的单词,进一步提高猜中的难度。2.6.5 页面和字段级的权限限制在建议的系统中,我们将在每一个页面中包含权限检查代码,检查用户是否有权限访问该页面。假如没有权限(如一般用户访问系统管理页面),则转到错误信息页面。假如没有登录,则转到系统登录界面,恳求用户登录。另外,还可以结合平台的平安限

33、制实力,使系统的平安性进一步增加。对于某些困难的页面,需施加字段级的平安限制,使得某些字段只有具有权限的人才能察看或修改,为应用程序供应更加细粒度的平安限制。2.6.6 系统平安架构从平安方针策略、信息平安管理、用户行为平安、数据信息平安、应用系统平安、系统平台平安、网络平台平安、物理环境平安等几个方面予以规划考虑,并与行业关于信息系统平安体系建设的要求亲密结合。以完整的平安体系结构模型为依据,确保整个平安体系的完备性、合理性和适应性,为供应全面的、多方位的和合理的平安服务,切实满足各方面各层次的平安需求,在合理的代价下将各种平安风险降低到可以接受的水平,最终达到保证正常牢靠运行和运用的目的。

34、第3章系统功能设计3.1 动环监控3.1.1. 电柜监测3.1.2. 1.1.1监控对象各楼层市电输入柜、其他配电柜。3.1.3. 2监控实现每一个串口总线回路的配电柜电量采集设备采纳手拉手的接法将监控信号接起来连至区域汇总采集箱,最终接至监控主机。监控主机通过实时不间断的轮询采集将信息传送给监控平台进行显示、报警。3.1.4. 3监控性能实时监测配电柜输出相电压、电流、频率、最大千伏安、输出功率(有功、无功、视在)、谐波率、功率因素等;监测输出电压、电流、频率超限,过载,负载不平衡,沟通电源失效等告警信息,监测到报警时主系统发出报警。3.1.5. 电开关与电流监控3.L2.1监控对象配电柜开

35、关、输出配电柜支路电流。3.1.2.2监控实现将每一个串口总线回路的配电柜开关与电流采集设备采纳手拉手的接法将监控信号接起来连至区域汇总采集箱,最终接至监控主机。监控主机通过实时不间断的轮询采集将信息传送给监控平台进行显示、报警。3.L2.3监控性能通过配电柜厂家供应的协议,实时监测配电开关状态与各路开关的电流值。实时推断开关是否跳闸与各路电源的负载状况,当开关跳闸或者负载越限时,系统诊断为有故障(报警)事务发生,监控主系统发出报警。3.1.3发电机监控3.1.3.1监控对象发电机。3.1.3.2监控实现设备已经带有串行接口。将发电机组分为两组,每组智能接口采纳手拉手的接法将监控信号接起来连至

36、区域汇总采集箱,最终接至监控主机。监控主机通过实时不间断的轮询采集将信息传送给监控平台进行显示、报警。3.1. 3,3监控性能实时显示并保存各发电机通讯协议所供应的能远程监测的运行参数和各部件状态。实时推断发电机的部件是否发生报警,当发电机的某部件发生故障或越限时,监控主系统发出报警。实时监测内容包括:输出相电压、输出相电流、功率、油压、水压等;电池是否充电、电池工作模式、系统报警等。3.1.4ATS监测3.1. 4.1监控对象ATS柜。3.1.4.2监控实现设备已经带有串行接口。按楼层、房间划分区域,将每一个房间内的ATS采纳手拉手的接法将监控信号接起来连至区域汇总采集箱,最终接至监控主机。

37、监控主机通过实时不间断的轮询采集将信息传送给监控平台进行显示、报警。3.1.4.3监控性能实时显示ATS柜两路输入的三相电压、频率、相序、切换开关位置与告警状态等。设定告警条件,当监测超过设定的允许值时,系统诊断为有故障(报警)事务发生,监控主系统发出报警。3.1.5STS监测3.1.5.1监控对象STS柜。3.1.5.2监控实现设备已经带有串行接口。按楼层划分区域,将每个楼层内的STS采纳手拉手的接法将监控信号接起来连至区域汇总采集箱,最终接至监控主机。监控主机通过实时不间断的轮询采集将信息传送给监控平台进行显示、报警。3.L5.3监控性能实时显示STS柜三相电压、频率、功率、电能、负载率、

38、旁路状态、开关状态与告警状态等。设定告警条件,当监测超过设定的允许值时,系统诊断为有故障(报警)事务发生,监控主系统发出报警。1. 1.6UPS监控子系统3. 1.6.1监控对象UPSo4. 1.6.2监控实现设备已经带有串行接口。将每一个串口总线回路的UPS智能接口采纳手拉手的接法将监控信号接起来连至区域汇总采集箱,最终接至监控主机。监控主机通过实时不间断的轮询采集将信息传送给监控平台进行显示、报警。5. 1.6.3监控性能实时监测各UPS通讯协议所供应的能远程监测的运行参数和各部件状态。实时推断UPS的部件是否发生报警,当UPS的某部件发生故障或越限时,监控主系统发出报警通知。实时监测内容

39、包括:输入相电压,输出相电压,旁路相电压,输入相电流,输出相电流,旁路相电流,电池电压,电池电流,输出频率,系统负载,电池充电程度,电池后备时间等,过载,电池工作模式,旁路工作模式,电池电压高/低,系统报警,整流器报警,逆变器报警,系统关机,旁路电压超限等。5.1 统一门户子系统供应一个统一的综合运维平台入口,将使运维人员能够基于统一的整合管理界面,进行运维管理的信息查看和相关操作:1)用户管理:实现用户集中管理、单点登陆功能;可为每个不同角色供应不同的功能模块,用户通过统一登录页面进入系统,访问权限范围内的功能模块。2)门户呈现:供应基于WEB敏捷多样的信息发布形式,将各功能(如监控、流程、

40、学问库)产生的管理信息进行统一的发布。改善运维人员的运用体验,提升日常运维管理效率。3)门户管理:供应动态敏捷的呈现模型编辑工具,用户可依据自身须要随意拖动并保存最终布局。5.1.1 信息主管领导内容展示1)运行维护统计报表,资源监控统计报表。2)重大故障信息、升级来的故障信息的展示。3)重要业务系统的拓扑呈现。4)主管领导的其他展示需求。5.1.2 运维人员内容呈现1)门户针对不同的小组(如:网络、业务、平安等),展示不同的管理内容和操作配置界面,如网络维护人员查看网络的web拓扑;业务系统维护人员查看业务系统的拓扑;平安管理员查看平安系统拓扑;机房管理人员查看机房方位图进行监控。监控图除了

41、能够反映设备的状态外,还实时反映监控到的事务,在拓扑图上监控到的事务依据设备进行归类。2)各组维护人员可以查看自己类别的学问库记录,可以通过事务查看关联到的学问库记录,也可以干脆通过搜寻关键字来查找学问库记录。3)在维护人员的登录界面,醒目的位置供应公告信息。4)维护人员处理事务时,呈现维护界面,维护界面包括维护人、维护时间、维护设备、事务内容、维护过程、维护结果、是否解决、转发给第三人处理等等,对事务处理完毕后能够对事务置状态,表示事务已经处理完毕,在维护人员的事务处理窗口,维护人员可以以灰色显示或不显示。5.1.3 一般用户内容呈现1)提交设备、业务系统的服务恳求,可以跟踪服务恳求的处理进

42、度。2)可以检索学问库,能够自助解决问题,查询学问库可以依据关键字进行查询,显示学问库的编码、主题、故障现象、处理方法、联系人等内容。3)可以查询历史服务恳求记录。4)在一般用户的登录界面,在醒目的位置供应系统公告信息。5.2 IT运行监控子系统IT运行监控系统功能包括故障、性能、配置等基础功能,以与面对网络设备、主机、存储、数据库、中间件、基础应用、IP地址、信息点等监控管理功能。针对以上各个功能模块具体说明如下:5.2.1 基础平台功能故障管理故障管理主要实现对IT资源故障的监视功能,包括对告警信息进行采集、配置、处理、呈现与相关的统计分析等功能。通过故障管理功能,用户可对网络中的告警进行

43、实时的监控,对告警信息进行处理和查询统计等相关操作。系统供应了故障智能诊断功能,通过此功能,用户可以对网络中的故障进行实时的监控,提高故障发觉、故障处理的效率,减小故障对网络造成的影响,更加有效的保障网络平安运行;在故障诊断的基础上,系统供应网络预警的功能,通过对现有网络进行性能分析,依据预先设定的门限值,以预警的形式进行提示,使网络的维护工作由被动转为主动,从而实现网络运行维护的高级管理功能。故障管理应包含以下功能。另外,故障管理支持对UnixIiunxWindows服务器、各种网络设备syslog关键字告警功能,能够自定义日志消息告警的关键字,一旦在日志消息中发觉有自定义的关键字,如Int

44、erfaCeDown.UP等关键字,可通过告警快速通知运维人员进行处理。配置管理IT运行监控系统供应参数化配置功能,如配置历史数据在系统中保存期限等,供应对系统资源的配置管理功能。本系统的配置数据采集支持自动采集、手工采集和数据导入等三种方式。配置数据管理主要包括:配置基本信息:包括配置的内部标识、名称、类型、IP地址、物理地址、厂商等基本信息;配置管理信息:包括配置的管理分类、用途分类、管理部门、管理人、安装位置、购买时间、终止运用时间等;配置属性信息:配置的附加配置属性,不同类型的配置的配置属性有所不同,例如网络设备的固件版本、设备模块组成、端口种类、服务器的操作系统类型、硬件配置、存储设

45、备、软件配置的LiCenCe、服务端口、模块组成等;配置维护信息:包括资产编号、资产的负责人,资产的集成商,以与产品支持厂商、当前质保期、历次故障记录、历次购保记录、历次维护记录,为资产维护供应数据的支持。对于即将过保的设备配置进行告警通知。(3)性能管理IT运行监控系统的性能数据处理与分析功能,供应了用户与时发觉关键点的异样状况,从而有效的保障系统正常运行,并为分析优化工作供应必要的依据。本系统支持多种协议、标准和接口方式采集各种性能数据,如SNMP.Agent.TeInet、JDBC、FTP、CORBA等。性能数据采集处理可以支持以下2种方式:定时模式:采纳循环定时主动式采集,定时时间间隔

46、可配置;系统对性能数据进行数据库保存,保留时间可定制;系统采集到的性能数据可以依据配置定义,以多种方式进行显示。实现对数据的定时采集和呈现。实时模式:由运用者通过界面操作,有针对性地(选择对象、数据内容等)对被管对象的性能数据进行即时的主动采集,获得对象的当前性能数据,采集的数据立刻送回用户界面,由用户界面处理。5.2.2 网络设备管理设备自动发觉系统支持思科、华三、华为、北电、锐捷、迈普等业界主流厂商网络设备的自动发觉和性能采集,系统通过SNMP、ICMP、ARP等协议自动发觉设备基本信息、设备接口配置信息、设备之间物理连接关系等,对于不同厂商不同型号的设备,系统可自动标识不同的图标。对于无

47、法自动识别生产厂家与产品类型的网络,供应手工方式加以定义。对于网络设备供应设备面板视图的管理。系统支持SNMPVI、V2、V3的拓扑自动发觉功能,对于不支持SNMP的设备,供应通过telnet的方式,进行拓扑发觉。对于路由时延、抖动等异样状况的监控和告警,供应路由监测功能,可由监控管理系统自动计算出随意两点间的最短路径。采集指标包括支持网络设备的CPU利用率、内存利用率、网络端口的吞吐量和丢包率、接收和发送的ICMP包率,端口ARP包率、单播包率、出入带宽利用率、出入丢包率、出入错包率、出入速率、广播包率、组播包率等指标。可对不同的网络节点依据影响程度不同设置不同的轮训时间。系统能够对某一网段、IP地址等限定条件进行拓扑发觉,并且可以设定更新周期,自动排列生成网元设备图与网元设备之间的连线。Web网络拓扑管理支持网络节点的二层、三层和基于

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号