运维管理系统方案.doc

上传人:仙人指路1688 文档编号:2388329 上传时间:2023-02-17 格式:DOC 页数:46 大小:2.99MB
返回 下载 相关 举报
运维管理系统方案.doc_第1页
第1页 / 共46页
运维管理系统方案.doc_第2页
第2页 / 共46页
运维管理系统方案.doc_第3页
第3页 / 共46页
运维管理系统方案.doc_第4页
第4页 / 共46页
运维管理系统方案.doc_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《运维管理系统方案.doc》由会员分享,可在线阅读,更多相关《运维管理系统方案.doc(46页珍藏版)》请在三一办公上搜索。

1、运维管理系统方案书【摩卡软件】【2008】年【08】月目录目录21 XXXXX需求分析41.1 环境描述41.2 管理需求41.3 本期管理目标52 方案功能详述72.1 网络拓扑管理72.2 网络性能检测112.2.1 网络设备的管理功能122.2.2 路由器监控指标举例172.2.3 交换机监控指标举例182.3 服务器监测202.3.1 服务器管理功能202.3.2 摩卡代理软件(MRAM)概述272.3.3 非代理软件(Mocha Agentless)概述282.3.4 AIX服务器监控指标举例292.3.5 Window 2003服务器监控指标举例312.4 配置管理332.5 故障

2、管理352.6 告警事件管理362.6.1 邮件362.6.2 短信362.6.3 Mocha Alert362.7 报表管理362.7.1 报表管理372.7.2 报表分析372.7.3 报表和报告订阅382.8 角色管理392.9 网管工具402.10 管理方式403 方案的典型特点和优势433.1 开放的体系架构433.2 分布式体系架构433.3 单一代理,资源占用少433.4 可扩展业务流程管理433.5 安全的管理系统443.6 灵活的权限控制443.7 使用与维护简单453.8 良好的扩展性453.9 模块化结构451 XXXXX需求分析1.1 环境描述XXXXX现有的IT系统,

3、包含CISCO,F5等多种网络设备,AIX、Linux、Windows等各种类型的服务器,以及Oracle、SQLServer数据库,IIS等。目前XXXXX主要面临以下一些问题:l IT应用不断扩大,各种不同的应用和业务系统在网络上运行越来越多,对网络的依赖越来越大,要求对网络管理的内容日趋增多,包括网络管理、性能管理、应用管理、使用管理、安全系统等内容 。l 网络的规模增大,规划、维护、安全、管理等分工更加细致,管理迫切要求对网络的使用和维护建立统一的、规范的、体系化的、层次化的服务管理流程 。l 多设备、多系统的运行信息、告警信息的多样化,要求对这些信息进行集中化的管理,进行智能化的分析

4、、统计,得出有利于网络管理和维护的数据,更有效、更快捷的解决问题 。1.2 管理需求通过对XXXXX环境的充分了解和分析,摩卡软件公司认为,XXXXX运维管理系统应该包括如下的管理需求: 以业务的角度将传统的技术设备的管理整合到基于业务的管理平台上来,不仅能完成对设备监控的需求同时能满足根据业务的组成定位问题根源,定位性能瓶颈,预测业务发展趋势和稳定性。 采用的技术成熟、先进,并具有较强的集成性和可扩充性的管理平台; 解放人力,依靠智能化技术化的管理手段,降低故障发生率,降低维护成本,并同时提高维护效率。 基于统一、集中的管理体系,统一的数据处理和展现,统一的告警平台。统一的数据处理和展现,消

5、除各个监控工具之间各自为政、系统管理员在各个界面间频繁切换的情况,将旧的监控工具的数据和事件统一融入到新的监控平台中来,并通过统一的展现界面进行展现。统一的告警平台,将所有告警纳入监控管理监控平台,并通过短信、邮件和桌面客户端统一告警。 易于使用和维护。管理软件本身的作用就是为了降低运维成本、提高运维效率。这就要求管理软件本身必须是易于使用和维护的。 对主机系统资源的占用比较少的情况下,实现对各种服务器(AIX、Linux、Windows等)监控管理。包括主机硬件、操作系统、文件系统、进程和应用等。主机监控的重点是对操作系统关键指标,如CPU、内存、进程、文件系统等进行全面的监控管理,要求不仅

6、能够在状态改变或性能指标超越门限时生成告警,同时还应该提供实时和历史的性能数据展现,并能够保存历史性能数据,以形成统计分析报表; 各种数据库(Oracle、MS SQL SERVER等)监控管理,包括数据库的重要配置参数以及运行状况的监控。主要关注数据库的关键指标,如SGA使用率、表空间占用情况、锁竞争和使用情况、缓冲区命中率等; 其它应用的监控管理,支持IIS、Tomcat、DNS、weblogic、Tuxedo等 实现对某种业务服务水平的管理。通过业务服务管理,可以某种业务在过去一段时间内的运行状况有一个总体的评价和衡量。 实现IT资源管理和业务系统的关联,可以从业务的视角进行IT管理。当

7、某台主机或者应用发生问题、产生告警时,系统管理员可以在第一时间发现该设备影响了哪个应用的正常运行。 统一的报告和报表,多台设备性能比较,其它格式导出,柱图、XY坐标、饼图、折线图,定期的运维报告等等 系统的自管理,系统的自我管理功能,包括角色管理,权限视图管理,资源管理等。1.3 本期管理目标在保证对现有的网络和系统没有太大影响的情况下,实现如下管理目标:u 建立统一的监控管理平台,消除各自为政的局面,消除管理对象之间的差别,消除数据采集手段的差别,消除管理软件的差别,对各种不同数据来源数据统一处理、统一展现、统一用户登录、统一权限控制。u 建设开放、具有良好扩展性的监控管理平台。监控管理平台

8、应具有很好的开放性,保证跟相关系统的集成。监控管理平台应具有良好的扩展性,不仅可以满足现阶段XXXXX运维系统管理的需要,未来,随着鄞州业务的不断发展,监控功能添加,或管理节点数量增加时,监控管理平台也可以很好满足XXXXX的需求。u 实现针对网络设备的高效管理,包括自动拓扑,设备监控,链路流量监控,网络性能分析。u 实现针对各种小机,PC服务器的高效管理,包括可用性,性能,配置等管理。u 实现监控系统自动产品监控事件,并通过邮件,短信等多种方式第一时间通知IT管理员。2 方案功能详述本技术方案建议书是根据XXXXX运维管理项目需求而撰写,介绍了Mocha BSM运维管理系统的逻辑架构、部署方

9、式和功能特点。并在分析XXXXX运维管理项目需求的基础上,结合XXXXX的运维管理现状及未来管理模式,详细阐述了摩卡公司针对XXXXX服务器管理、网络管理、报表管理、的整个解决方案。2.1 网络拓扑管理 XXXXX要求能自动发现全网网络拓扑,图形化显示物理拓扑,直观清晰地显示全网所有骨干网络设备(主要为Cisco、迈普、神码等)、子网和互联关系Mocha BSM完全满足XXXXX要求:Mocha BSM自动发现全网络的物理拓扑图,并能够自动更新拓扑图。图形化显示物理拓扑,直观清晰地显示全网所有骨干网络设备、子网和互联关系,支持VLAN、 OSPF、MPLS的拓扑。为了支持网络拓扑的发现,Moc

10、ha BSM支持主流的LAN、WAN等网络协议,包括:n IPn MPLSn PPPn HDLCn FrameRelayn ATM等作为一个网络管理系统,管理员希望所见到的管理界面是现实世界对象的真实反映。Mocha BSM内置的网络自动发现引擎,能够快速的发现企业中二层和三层的网络设备,并根据发现设备之间的关系自动生成全局的网络拓扑结构图。Mocha BSM自动发现时使用ICMP、SNMP这两种协议。网络管理人员能够看到整个运营网络系统的网络拓扑结构,包括各个分布地区的子网、各个子网之间的网络连接关系、及其每一子网上的资源。经过网络拓扑结构的生成后,可以在拓扑图上看到整个网络的拓扑结构图,并

11、能直观地看到各个资源的状态变化。当网络中的结构发生变化时,自动发现引擎能够迅速的发现并及时调整网络的拓扑结构图,保证了与实际网络状态的一致。Mocha BSM可以自动发现以下信息:n 第二层和第三层网络设备n 网络协议,包括TCP/IP、Ethernet、Mpls-vpn、FDDI、ATM、帧中继、令牌环等n 设备包含信息(如卡、端口、接口、IP 和MAC)n 设备之间的物理连接和逻辑关系n 设备连接信息(如电缆、中继、网络连接和VLAN)通过对网络节点状态的轮询,Mocha BSM可以实时监控网络中所有资源的状态。拓扑图上所显示的各被管对象的颜色可以直接反映出其内部被监控对象的状态。如绿色表

12、示用户所关心的对象正常运行,黄色表示警告信息,红色表示严重错误。当我们从表面看到这些状态信息后,利用与数据库的关联功能可以进一步进入被管对象内部,详细查看到底是什么因素造成该设备的状态变化。包括链路流量的大小变化,链路使用率的变化,以及包长,错包率,误包率,ARP包率等信息的变化等。图表 2.1 自动发现二层网络拓扑图图表 2.2 自动发现三层网络拓扑图Mocha BSM支持视图管理。当用户网络设备大量增加之后,网络结构异常复杂,用户的网络拓扑就很难在一个荧光屏上展现或者很难找到想查阅的网络拓扑。Mocha BSM为使网络的展现和管理更适用,支持网络视图功能。管理员可以对拓扑图的节点进行区域,

13、组或网段的管理,比如按照不同地区,组或网段将设备划分到不同视图中。同时,对不同视图可分配不同用户的浏览权限。这样可实现资源管理的规范性和高效性,同时也保证了安全性。由于有些网络存在某些比如租用的线路,拓扑生成发现不到这些节点之前的实际链路。系统管理员可以在网络节点之间绘制手工连线,代表节点之间实际存在的链路,并可设置连线的粗细、颜色、虚线线型来显示此种链路的特殊性。管理员也可根据实际情况删除手工连线。这让整个拓扑图更加完整。网络拓扑提供了个性化的设置功能:页面设置,视图管理和权限管理。其中:n 管理员可自定义拓扑节点状态的刷新速率n 定义节点图标的4种显示大小n 为了引起关注,有故障的链路和宕

14、机设备,可以设置闪烁效果。为更清晰,更直观的展现遍布各省市、全国、全球的庞大的广域网,系统默认提供了中国、世界地图背景,管理员也可以根据实际的拓扑显示上传相应的图片来更换背景。这样可以把网络节点摆放到地图上合适的地点,使得网络视图管理更加直观易懂。图表 2.3网络拓扑图的视图管理 Mocha BSM支持对网络设备PING监控,可监控交换机端口;支持拓扑显示网络设备的实际流量,支持网络设备流量告警 网络拓扑左键点击设备,通过小工具的链接,可以直接管理网络设备背板、流量等信息,就和工作人员亲临机房一样如图:链接到背板管理信息; 2.2 网络性能检测Mocha BSM可对网络设备、服务器、PC的端口

15、出入流量、丢包、错包率、链路出入流量及丢包、错包率、Ping延时及丢包率、CPU、内存利用率做出全面的监控和分析。图表 2.4网络设备性能参数设定1图表 2.5网络设备性能参数设定22.2.1 网络设备的管理功能Mocha BSM对网络设备的管理,不仅仅局限在网络设备本身。Mocha BSM网络管理模块除可以实时监控网络设备自身的CPU利用率、网络设备内存利用率、网络设备端口通断等自身的指标外,还可以从更低层次、更细粒度来监控网络设备端口的情况,包括端口的名称、操作管理状态、接口发送接受速率、端口的ICMP包率、端口的通断信息、端口的发送接收包率等等,并产生报表,以各种方式展现。Mocha B

16、SM对网络设备的可用性监控以红、绿、黄、灰 状态灯展示,管理员可以一目了然地看到发生故障的设备及当前接口的性能。图表 2.6网络设备端口的流量图表 2.7网络设备信息Mocha BSM支持网络链路监控。对网络设备的可用性的监控的同时,设备之间的链路可用性的可视化管理更直观的展示了网络设备的运行状态。链路的畅通与否以红、黄、灰、绿四种状态显示,根据这些状态,管理员可直观地看到故障发生的范围所在,大幅度减少查找故障的工作量。图表 2.4网络链路监控同时,Mocha BSM支持对网络设备日志的收集和处理,当网络设备产生日志后,可以发送给Mocha BSM,并经Mocha BSM统一处理后产生告警。通

17、过产品的二次开发,可以实现网络设备真实设备面版图查看,设备面版视图可以拖动、缩放,同时支持多张设备真实面版图同时查看,支持在面版图界面上直接显示设备端口所属Vlan,能够提供网络设备端口下联设备列表。支持网络设备的TOP N排名。设备CPU、内存、端口的速率、流入/流出量、利用率等指标可以进行统计排名,并以TOPN的形式展现。为方便在复杂的网络拓扑中查看某些设备,Mocha BSM提供了灵活的设备搜索功能,用户可以定义多种搜索条件来查找网络设备。搜索的条件包括:设备名称、IP地址和设备类型。并且可以将设定好的查询条件保存起来便于以后的搜索。通过搜索,网络管理人员可直接查看特定的服务器或网络设备

18、的运行状态、性能状况,对网络的资源状况有一个细致的了解。Mocha BSM网络监控模块支持IP地址和MAC地址定位功能,当网络中某一台主机感染病毒,需要断开网络时,Mocha BSM的IP地址定位可以通过主机的IP地址查找到该主机连接的网络设备端口号。由于Mocha BSM系统中已经有IP-MAC地址-网络设备的对照表数据,所以Mocha BSM还支持IP-MAC-设备端口绑定,支持全网IP定位等功能。图表 2.5IP地址、MAC地址定位Mocha BSM网络监控模块支持网络设备的配置变更,当网络设备的配置发生变化,比如CPU、内存、端口数目或者startup Config文件发生变化时,Mo

19、cha BSM会自动发现并告警通知用户。针对网络设备的配置备份,可根据具体的设备二次开发实现。Mocha BSM通过底层关联来展示网络设备的性能和该设备在网络拓扑中的位置。当浏览一台网络设备的性能时,可以通过定位功能迅速查找到这台网络设备在网络拓扑中的位置。反之亦然。网络设备发现和监控需要开放设备的SNMP,Mocha BSM支持标准的SNMP版本包括SNMP V1,SNMP V2c和SNMP V3。Mocha BSM支持网络的根本原因分析,当网络中某一台网络设备发生问题影响其它的网络设备时,Mocha BSM可以找到根本原因。Mocha BSM系统的网络设备性能管理,可以查看网络设备端口流量

20、、利用率等监控指标的历史性能数据。图表 2.6网络性能管理网络的历史数据记录与分析管理:通过Mocha BSM的报告功能,可以订阅关注设备的性能、可用性报告。2.2.2 路由器监控指标举例资源指标类别指标名称(67个)英文名称Router可用性指标网络设备在线可用性Network Device Availability性能指标CPU平均利用率Avg CPU Percent Utilization内存利用率Memory Percent Utilization网络设备内存池占用容量Total Used Memory网络设备内存池可用容量Total Available Memory总接收吞吐量Rec

21、eive Throughput总发送吞吐量Transmit Throughput吞吐量Throughput丢包率Discard Packets Per Second所有接口接收的丢包数Receive Discard Packets Per Second所有接口发送的丢包数Transmit Discard Packets Per Second接收和发送ICMP包率Receive & Transmit ICMP Packets Per Second发送的ICMP包率Transmit ICMP Packets Per Second接收的ICMP包率Receive ICMP Packets Per S

22、econd信息指标网络设备的OIDOS ID连续运行时间Uptime网络设备说明Network Device Info交换机下的IP地址Contained IP网络设备MAC地址MAC Address配置指标Cisco Config状态Cisco Config StatusCPU个数No. CPU内存总容量Total Memory Capacity网络接口个数No. NICIP地址IP Address网络设备名称Network Device NameCPU(子资源)性能指标CPU利用率CPU Percent Utilization信息指标CPU名称CPU NameCPU ID号CPU Freq

23、uency网络接口(子资源)可用性指标管理状态Management Status操作状态Operation Status性能指标ARP包率ARP Packet Per Second接收的ARP包数Receive ARP Packets Per Second发送的ARP包数Transmit ARP Packets Per Second单播包率Unicast Packet Per Second接收单播包数Receive Unicast Packet Per Second发送单播包数Transmit Unicast Packet Per Second发送利用率Transmit Percent Uti

24、lization发送的丢包数Transmit Discard Packets发送的错包数Transmit Error Packets发送速率Transmit Velocity广播包率Broadcast Packet Per Second接收的广播包数Receive Broadcast Packet Per Second发送的广播包数Transmit Broad Packet Per Second接收利用率Receive Percent Utilization接收和发送利用率总和Interface Receive & Transmit Percent接口累计接收和发送的包数Accumulativ

25、e Interface Receive & Transmit Packets接口累计接收的包数Accumulative Interface Receive Packets接口累计发送的包数Accumulative Interface Transmit Packets接收的丢包数Receive Discard Packets接收的错包数Receive Error Packets接收速率Receive Velocity组播包率Multicast Packet Per Second发送组播包数Receive Multicast Packet Per Second接收组播包数Transmit Mult

26、icast Packet Per Second接口带宽Bandwidth信息指标网卡ID号NIC ID接口名称NIC Name索引Index接口类型Type接口带宽BandwidthMAC地址MAC Address链路(子资源)可用性指标链路可用性Link Availability信息指标链路名称Name链路ID号ID所属网络接口NIC目标IPTarget IP图表 2.7 路由器监控指标举例2.2.3 交换机监控指标举例资源指标类别指标名称英文名称Switch可用性指标网络设备在线可用性Network Device Availability性能指标CPU平均利用率Avg CPU Percen

27、t Utilization内存利用率Memory Percent Utilization网络设备内存池占用容量Total Used Memory网络设备内存池可用容量Total Available Memory总接收吞吐量Receive Throughput总发送吞吐量Transmit Throughput吞吐量Throughput丢包率Discard Packets Per Second所有接口接收的丢包数Receive Discard Packets Per Second所有接口发送的丢包数Transmit Discard Packets Per Second接收和发送ICMP包率Rece

28、ive & Transmit ICMP Packets Per Second发送的ICMP包率Transmit ICMP Packets Per Second接收的ICMP包率Receive ICMP Packets Per Second信息指标网络设备的OIDOS ID连续运行时间Uptime网络设备说明Network Device Info交换机下的IP地址Contained IP网络设备MAC地址MAC Address配置指标CPU个数No. CPU内存总容量Total Memory Capacity网络接口个数No. NICIP地址IP Address网络设备名称Network Dev

29、ice NameCPU(子资源)性能指标CPU利用率CPU Percent Utilization信息指标CPU名称CPU NameCPU ID号CPU Frequency网络接口(子资源)可用性指标管理状态Management Status操作状态Operation Status性能指标ARP包率ARP Packet Per Second接收的ARP包数Receive ARP Packets Per Second发送的ARP包数Transmit ARP Packets Per Second单播包率Unicast Packet Per Second接收单播包数Receive Unicast P

30、acket Per Second发送单播包数Transmit Unicast Packet Per Second发送利用率Transmit Percent Utilization发送的丢包数Transmit Discard Packets发送的错包数Transmit Error Packets发送速率Transmit Velocity广播包率Broadcast Packet Per Second接收的广播包数Receive Broadcast Packet Per Second发送的广播包数Transmit Broad Packet Per Second接收利用率Receive Percent

31、 Utilization接收和发送利用率总和Interface Receive & Transmit Percent接口累计接收和发送的包数Accumulative Interface Receive & Transmit Packets接口累计接收的包数Accumulative Interface Receive Packets接口累计发送的包数Accumulative Interface Transmit Packets接收的丢包数Receive Discard Packets接收的错包数Receive Error Packets接收速率Receive Velocity组播包率Multic

32、ast Packet Per Second发送组播包数Receive Multicast Packet Per Second接收组播包数Transmit Multicast Packet Per Second接口带宽Bandwidth信息指标网卡ID号NIC ID接口名称NIC Name索引Index接口类型Type接口带宽BandwidthMAC地址MAC Address链路(子资源)可用性指标链路可用性Link Availability信息指标链路名称Name链路ID号ID所属网络接口NIC目标IPTarget IP图表 2.8 交换机监控指标举例2.3 服务器监测 该项目,XXXXX提出

33、:支持对Windows、Linux、AIX、Unix操作系统,对主机系统的CPU、MEM利用率、网络端口流量、文件系统利用率、磁盘IO、应用进程服务情况、系统服务、服务器集群、操作系统及应用系统日志的监测 Mocha BSM完全满足需求2.3.1 服务器管理功能Mocha BSM支持多种不同的操作系统,包括以下:n Windows 2000,Windows XP,Windows 2003 Servern AIXn Linux(SUSE linux、RedHat Linux、RedFlag Linux等)n SCO UnixWare、SCO OpenServern Solarisn HP-UXM

34、ocha BSM通过MRAM代理软件或者Mocha Agentless无代理监控,能够实现对AIX、Windows、Solairs、Red hat Linux、HP-UX等各种操作系统关键资源的自动监控,帮助管理员及时发现故障和故障隐患。Mocha BSM针对服务器监控提供的核心功能包括:1) 服务器运行情况的实时图形化展现,即摩卡软件公司的专利技术Mocha VM,通过图形的方式实时展现服务器运行情况。展现的内容包括,多个CPU中每个CPU的利用率、物理内存利用率、虚拟内存利用率、进程运行情况、网卡流量等等。图表 2.9 服务器可视化监控图2) 针对CPU的监控,监控CPU的1分钟、五分钟和

35、15分钟的CPU负载,监控CPU用户态使用时间、CPU系统态使用时间、CPU等待IO的时间和CPU空闲时间等,当CPU的使用率超过阈值时,产生告警通知。针对CPU瞬时增高的问题,Mocha BSM提供了Flapping技术,用户可以自己定义Flapping的值,保证CPU在确实已经多次超过阈值的情况下产生告警。图表 2.10 CPU监控可视化监控图3) 针对内存的监控,Mocha BSM提供了内存利用率、交换空间利用率、交换空间大小、交换空间使用情况、内存页交换速率、内存错页率、内存页面调进速率、内存页面调出速率等指标来监控物理内存、虚拟内存、以及系统页面调入、调出情况。当这些指标超过预先设定

36、的阈值值,产生告警。图表 2.11 内存监控可视化监控图4) 针对磁盘的监控,Mocha BSM通过分区利用率、分区容量、磁盘分区利用率、硬盘容量等指标监控硬盘和分区的使用情况,通过硬盘读速率、硬盘写速率、硬盘平均读速度和硬盘平均写速率等指标监控硬盘的使用情况。图表 2.12 磁盘监控可视化监控图5) Mocha BSM提供对进程的进程名称、进程ID、父进程ID、运行该进程的用户、进程优先级、运行终端等的监控,其中有运行权限的用户可以修改进程的优先级和杀死进程。Mocha BSM还提供对进程运行状态的监控,这包括进程活、进程死、进程sleep、进程等待等状态。当进程启动或者僵死时,产生告警,通

37、知系统管理员。图表 2.13 进程监控可视化监控图6) Mocha BSM提供灵活的监控策略批量监控服务器,并可以灵活定制监控指标的阈值,产生事件的严重程度和紧急程度,事件的接受人等。图表 2.14 策略管理定制监控指标图7) Mocha BSM提供统一的监控界面监控所有的服务器,通过统一的界面展现服务器的状态和监控指标的状态,并可在服务器状态和具体监控界面之间来回切换。Mocha BSM对于各类操作系统提供了大量的资源模型:n 服务器状态n CPU:监控系统CPU的占用情况,如CPU的利用率等n 硬盘:磁盘活动时间、磁盘读写速率等指标n 内存:监控系统内存的状态,内存占用率等n 文件系统:实

38、时监控文件系统的利用率,如根文件系统、var文件系统、tmp文件系统、应用文件系统等。n 虚拟内存:监控虚拟内存的总量、利用率等。n 进程:监控所有重要的进程的启动、停止和状态改变情况。n 网络:监控服务器网络端口的丢包率、利用率、发送速率等指标。n 日志:监控UNIX系统的syslog日志和window的Event Log。n 端口:FTP端口、DNS端口等Mocha BSM通过连续监视重要系统资源,自动检测瓶颈问题和潜在的问题,同时对事件主动做出反应,来帮助管理大型的异构环境。它扩展了现有关键业务服务器的监视能力,能够帮助您实施智能化管理,在终端用户受到影响之前发现问题。图表 2.15 服

39、务器监控图Mocha BSM 可视化监控提供灵活强大的个性化监控n 定制监控内容用户能根据需要定义在首页看到关注的资源。图表 2.16 定制监控内容n 定制监控频率根据硬件情况通过设定不同的监控频率,在满足用户响应速度要求的同时,占用最少系统资源。图表 2.17 定制监控频率n 定制指标阈值图表 2.18 定制监控阈值2.3.2 摩卡代理软件(MRAM)概述图表 2.19 代理软件结构图MRAM代理软件是安装在被管理主机的轻量级的代理软件,它完全采用C语言实现,因此具有极高的运行效率,是真正意义上的“C-Agent”。跟其它厂商的代理软件相比,MRAM的系统消耗的资源更少,对网络通讯的影响更小

40、,且具有以下显著特点:n 只有一个Agent,不同的应用监控通过不同的plug-in来实现。对一台主机,不管运行几个应用,对这台主机的监控,只需要一个Agent代理软件,对不同应用的监控,通过不同的plug-in来实现,Oracle监控,需要通过Oracle监控的plug-in,对DB2的监控,需要通过DB2监控的plug-in。n 提供安全的数据加密。MRAM代理软件和服务器之间通讯采用SSH通道加密技术,确保了数据的安全性。同时由于数据传输之前要经过加密压缩,所以在网络中传输的数据量更少。n 支持请求者身份判断与权限判断。MRAM代理软件支持请求者身份判断和权限判断。只有当请求者经过MRA

41、M允许,并且有请求数据的权限时,MRAM才会响应。n 支持Event Log、Syslog。Window主机的Event Log和Unix、Linux主机的Syslog反应了系统的运行状况,可以及时反应系统运行中的问题,MRAM支持Event Log和Syslog日志的关键字检索功能,用户可以定义自己关心的关键字,当日志中出现相应的关键字时,MRAM产生告警。n 对资源的自动发现功能。某一台主机上安装MRAM代理软件后,MRAM自动发现和识别系统中有多少硬盘、多少分区、多少网卡等,并自动对其监控。n 远程部署、管理功能。MRAM提供了远程安装的部属工具,系统管理员通过部属工具,不需要到每一台主

42、机上安装MRAM代理软件,通过远程部属即可实现对MRAM的安装。图表 2.20 摩卡远程部署工具2.3.3 非代理软件(Mocha Agentless)概述Mocha Agentless无代理监控技术是真正的无代理,不需要在被管理的主机或者应用上安装任何的软件。Mocha Agentless代理技术采用多种采集方式达到对主机、应用和数据库的监控,这些技术包括:WMIPerfMonHTTP/HTTPSSQL*NETPingDNSSNMPSecure Shell (SSH)TELNETJDBCODBC等对于重要性相对较低,不需要进行全面监控、只需要了解大体运行状况的主机,我们建议采用Agentle

43、ss监控方式。2.3.4 AIX服务器监控指标举例资源指标类别所有指标英文名称UNIX主机可用性指标主机在线可用性Host AvailabilityCPU平均利用率Avg CPU Percent UtilizationCPU平均负载(15分钟)CPU Load Average (15 Minute)CPU平均负载(5分钟)CPU Load Average (5 Minute)CPU平均负载(1分钟)CPU Load Average (1 Minute)CPU用户模式百分比CPU User Mode (%)CPU空闲时间百分比CPU Idle Mode (%)CPU系统模式百分比CPU Syst

44、em Mode (%)内存利用率Memory Percent Utilization内存页面调进速率Pages In内存页面调出速率Pages Out硬盘平均写速率Avg Write Velocity硬盘平均读速率Avg Read Velocity分区平均利用率Avg Partition Percent Utilization接收和发送的ICMP包率Receive & Transmit ICMP Packets Per Second等待处理队列Processor Queue Length主机总内存容量Total Memory Capacity主机总可用内存容Total Available Me

45、mory主机已经使用的内存容量Total Used Memory内存错页率Page Swap Velocity内存页交换速率Percent Page FaultPaging Space利用率Paging Space Percent Utilization 分区总容量Total Partition Capacity分区总可用容量Total Available Partition发送的ICMP包率Transmit ICMP Packets Per Second接收的ICMP包率Receive ICMP Packets Per Second信息指标主机操作系统的OIDOS OID主机操作系统Operating System主机操作系统版本OS Version连续运行时Uptime主机说明Host Info系统SPOS SP进程数Processes僵死进程数Hanged Process线程数Threads当前在线用户数UsersPaging Space总大小Total Paging S

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号