IT服务保障解决方案.docx

上传人:小飞机 文档编号:2011765 上传时间:2022-12-31 格式:DOCX 页数:30 大小:2.84MB
返回 下载 相关 举报
IT服务保障解决方案.docx_第1页
第1页 / 共30页
IT服务保障解决方案.docx_第2页
第2页 / 共30页
IT服务保障解决方案.docx_第3页
第3页 / 共30页
IT服务保障解决方案.docx_第4页
第4页 / 共30页
IT服务保障解决方案.docx_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《IT服务保障解决方案.docx》由会员分享,可在线阅读,更多相关《IT服务保障解决方案.docx(30页珍藏版)》请在三一办公上搜索。

1、服务保障解决方案目录一、前言1二、基础架构管理解决方案5三、网络性能管理解决方案11四、应用性能管理解决方案17五、统一性能展示方案25一、 前言随着信息化建设的不断深入,企业逐渐拥有数量众多的服务器,复杂的网络架构,高关联性的各种应用,为互联网(Internet)与企业内网(Intranet)使用者提供各种不同的服务,保持业务的持续性变得越来越重要。随着网络规模的不断扩大和业务应用的日渐复杂,网络与应用安全的重要性与日俱增,如何使网络与各种应用高效率、低故障地运行给信息管理部门和IT管理人员面带来前所未有的挑战。网络与应用性能管理不仅仅是以排除故障为目标,还应该包括实时监控、主动告警、根源分

2、析、自动报告、容量规划、直观展示等,从而保障对网络与服务器资源有效的使用,以及全面的故障排查分析,进而保证最优的信息化投资。当前多数企业IT环境所面临的困难:1、 复杂异构的网络环境随着各单位业务的发展,IT环境基础架构环境愈加复杂,核心交换下连到各局部交换,局部交换机又关联很多的服务器,服务器上继续做虚拟化,运行多个应用等。2、 高复杂性的应用服务某一应用不再是关联到单一的应用服务器,而是从前台的Web server到中间的Application Server一直到后台的Databases都相互关联。3、 缺乏对服务性能和客户体验监控只关注与某一个功能服务的可利用率,忽略客户访问是各个不同功

3、能部分系统工作的结果。单一功能组件的高可用率无法保证客户体验(Web页面访问或应用操作等)的成功率,而客户体验又关系到企业形象与客户满意度等。4、性能管理“孤岛”带来挑战5、缺乏统一的关联基础架构、网络及应用性能的统一展示平台。 传统服务保障方案监控结果展示单一,无法将基础架构、网络环境及应用性能的监控数据集合在一起进行统一展示以达到直观展示业务状态、对问题的快速定位问题根源的目的。该服务保障解决方案是涵盖了基础架构管理、网络性能管理、应用性能管理、统一展示平台等关注于不同层次监控与展示的综合性解决方案,借以实现对公司基础架构、网络环境及应用性能的全面监控。同时将各不同层面的监控模块与统一性能

4、展示模块集成可以统一直观展现公司基础设施架构和网络拓扑结构及应用服务运行状况,实时反映其状态,自动形成报警并定义其影响级,单点跳转到各监控模块深入分析问题根源。该方案,通过颗粒化的源头数据的收集和分析,能够在问题出现之前进行预警并快速定位问题源头,从而减少故障排查的时间,提高系统维护人员的工作效率,实现业务运行的实时监测,保障应用系统的顺畅运行。该方案涵盖了从客户端到后台服务器、数据库的端到端的全面监控,同时其统一的监控展示平台将集中展示目标IT环境的基础架构、网络、应用的运行状况、服务质量、风险、服务可用性等状态,满足不同阶层工作人员直观了解目标IT环境实时状态。借助该服务保障解决方案可全面

5、、具体的实现如下目标: 直观展示公司物理及虚拟设备拓扑结构。 监控虚拟机进程状态、磁盘及文件系统。 快速、准确定位基础架构及应用问题源,减少故障修复时间。 监控设备性能状态(CPU、内存、端口等),分析网络流量(端口、主机、协议等)及应用响应时间(服务器响应时间、网络传输时间等等)。 全面监控服务器、中间件、数据库、业务应用系统运行状况。 监控基于Web页面的业务操作,并自定义事件及用户级别、业务影响等级并自动排序,以便按优先级解决问题。 可深入到代码级别监控Java .Net应用性能。 集成监控数据,图形化、分层次展示监控结果。 可集中管理,分层报警、多种报警、定制多重报表 存储历史数据,可

6、查询历史记录 支持虚拟化主机、网络、物理主机和主流存储监控二、 基础架构管理解决方案在竞争异常激烈的经济环境下,一个强大且可靠的IT基础架构是业务成功的关键。尤其对于拥有自己核心应用的企业而言,停机和性能问题会对生产力和收益造成严重的影响。面对基本的架构管理方案仍有如下问题需要面对: 如何能够将网络、物理、虚拟服务器、数据库等所有的基础设施同时在一个界面上进行统一监控? 如何能够收集、映射、透视整个架构、通过关联各种信息、网元管理器以及工具交付高质量的根本原因,统一成一个方案? 如何能够减少硬件和软件的成本扩张、将多个单点产品汇聚成单个整合的方案,并具有扩展性?该方案产品基础架构管理器在多供应

7、商、多技术的基础架构之上提供自动化的拓扑、服务、故障和配置管理,以确保对业务应用关键服务的有效性。获得专利的根本原因分析和影响分析技术可快速查明降级或出现故障的元素,指出受影响的用户和服务,并予以解决。报告功能可提供有关IT资产、有效性、事件、报警和性能标准的一览式信息。本方案产品可确保关键基础服务的有效性,采用智能的根本原因和影响分析,在问题对业务造成影响之前就对其进行识别、优先排序和纠正。提供具有高度直观的界面、配置管理工具、以及对800多种设备的即装即用支持。网络管理模块,在网络拓扑发现,网络故障分析,网络事件告警等可用性管理方面为用户提供强大的功能。该基础架构管理解决方案从业务角度处理

8、服务、故障和配置管理,确保最重要的业务服务,并使客户获得最优先的响应。将操作密集型的故障解决自动化,改善了服务级别和有效性,同时降低了运营成本。由于识别出能够统一、重新调配或解除的资产,因而,可以更合理地利用IT资产,极大地减少资本支出。借助基础架构管理解决方案所能实现目标:1、 梳理企业IT环境(自动的设备发现与拓扑生成)支持SNMPv1-v3等多种网络管理协议,可以简洁,高效,快速,自动化的发现整个网络拓扑结构(包括内网和外网),可以发现包括防火墙、交换机等在内的各种网络设备,支持虚拟化设备发现与关联。自动准确的发现网络设备之间的连接关系,用不同的图标标示不同的网络设备,网络设备的发现精度

9、可以到达发现每个网络端口,可以发现两台设备之间不同的链路连接。拓扑图可以根据用户的需求进行定制,根据地域,楼层,设备种类进行分类,分层分级显示网络拓扑。可以设置时间,定期自动地进行网络拓扑发现,可以做网络增量发现,准确的发现网络设备的变化情况,提供丰富的网络资产,网络设备可用性,网络设备变更的管理功能。2、预防或避免IT环境故障(强大的事件报警与管理功能)该基础架构管理解决方案提供了强大的事件报警与管理能力,可自定义报警阀值,当网络设备、虚拟机、设备端口等达到或超过定义阀值时就会在拓扑结构中生成报警提示,实现在故障发生前的及时预警。同时针对企业网络里生成的大量事件、需求具有灵活的自动压缩以及事

10、件关联和压制能力。默认的,可以将来自同一个IP地址的同类事件自动进行压缩,在告警栏显示其总次数和最近发生时间,减小故障提示复杂度与处理难度。同时可自定义的对特定的场景进行事件关联与归并,提供多种时间场景关联规则。3、帮助运维人员定位及解决故障(独特的根本原因分析功能)通过将一系列症状或事件进行关联和解释而自动排除故障,确定潜在的原因并生成可控的报警。这个RCA的功能性利用获得专利的感应建模技术,使用复杂的模式、关系和行为系统,创建一个可灵活修改的软件模型。模型之间的关联为协作提供了桥梁,使该方案产品能够将症状和事件相关联,阻止不必要的报警,并对用户、客户和服务的影响进行分析。这种协作包括初期提

11、出的跨模要求和变更信息的能力。4、 解决地理分散性业务需求问题-支持分布式如今地理分散型业务要求软件在其分布式架构中具备高度可扩展性和灵活性,以及容错性。无论是否是由于本地检测、本地管理部门、用户社区场所、和/或其他因素促使对分布管理工作量有所需求,利用该方案产品分布式性能均能够提供确定这些需求所需要的能力和灵活性,从而使您能够使用通用界面和集成的应用程序,将网络管理功能指派到远程工作站。同时,每个管理服务器可根据区域划分接近其管理的设备,减少广泛区域链接上的流量并避免本地网络上的拥堵。支持分布式安装,使用分布式方式的主要优势在于:管理服务器之间设置冗余,创造容错环境。 所提供的次级服务器可作

12、为冗余备份或备用,如此一来,即使运行主要服务器的工作站出现故障,网络管理也可以继续运行。如果故障造成主要服务器无法运行,次级服务器会替代主服务器。5、 支持灵活的事件管理流程功能该方案支持网络管理系统内部事件流程化处理:事件管理组件具有流程化管理的能力,可以定义用户、用户组,对事件可以直接分配给相关的用户或组,并对事件进行转发,处理,记录处理日志等工作。可以在网络管理系统内部实现事件的流转,并监控事件的处理情况,对没有及时处理的事件进行升级和转发,以保证事件的管理效率。6、提供直观的监控视图,方便不同部门工作人员了解架构状况提供基于Java/Web的灵活呈现,可以将管理事件按照用户的管理习惯和

13、需要进行呈现定制,为管理人员提供直观实时的监控界面。直观的服务仪表板,可向执行者、业务经理、呼叫中心操作员和客户提供与其任务相关的信息,用以对与其特殊需求相关的信息进行查看。OneClick界面既可以提供管理人员分类的事件列表,又可以定制综合的逻辑视图,可以根据用户的管理习惯和需要,定义分层、分权的网络实时监控界面。管理人员可以监控网络的总体状态,也可以查看详细的事件信息,并且调用各种用户定制的辅助工具,如PING、Telnet、Traceroute、对事件进行确认/升级/转发/关闭、查询相关事件等等,从而更方便的进行测试和诊断。三、 网络性能管理解决方案 无论什么厂家的什么产品,所有的网络管

14、理工具的目标都相同:帮助您获得更好的网络设备的可视性和可控性。但是对于网络管理来说,这意味着识别各种网络设备的关系和相互依存性,跟踪设备的性能,并且要在产生网络冲突的时候迅速界定引发事件的根源。目前的人工的基础架构管理方式,管理员要花大量时间去研究那些极少带有深层问题原因的告警事件,恢复网络故障对于希望“少花钱,多办事”的企业来说是个很大的挑战。没有先进的管理手段,网络成本越来越高,但是对业务的价值却没有增加。显然,管理一个大型的网络难度和成本会更高,更重要的是网络复杂性增加的时候,目前的网络管理方式却很难有相同幅度的能力增强。 具体原因主要在于:l 业务可用性要求越来越高,业务对网络可用性要

15、求也越来越高,但却难以获知网络可用性,提高网络利用率。l 无法判断网络性能是否能满足业务的要求,是否存在性能瓶颈和资源浪费。l 不能全面了解现有网络的状态,更好地保障关键业务的连续运行。l 不能及时准确定位故障点,并统计发生在网络中的故障总量及平均故障时间。l 无法合理使用最新技术手段减轻人员工作负担。可见,一个全面的网络管理是以支撑业务运营为出发点,根据网络运维管理流程的需求,利用自动化的网络管理软件,依靠管理人员对网络实时数据的监控和分析,为网络的可靠稳定运行和提供高质量的网络服务进行端到端高效管理的过程。该网络性能管理解决方案集成了应用响应时间分析、网络流量分析和设备性能管理三种层面的网

16、络及应用访问监控,解决了类似解决方案监控层面单一,遇到问题无法准确定位的问题。同时其独特的统一展示平台又能将三个层面监控数据进行整合与统一报表展示,方便问题分析。 该解决方案可以有效的管理应用响应时间。通过监控从网络传输至中心机房的所有TCP/IP应用数据包,持续对网络、服务器以及应用性能进行测量和分析,并将相应时间细分成自己所需的基本成分应用、服务器以及网络延迟等的一种分析法。其可以持续的测量和分析所有交易的性能,依据其计算出的基线与阀值对响应时间进行比较,当网络性能下降的时候会以邮件的形式告警,以帮助用户迅速发现问题、定位问题和解决问题。同时该解决方案实现对网络流量颗粒化的分析。网络带宽就

17、像高速公路,只有掌握了车辆的多少和流向,我们才能更好的规划网带宽和流量资源。对于网络可靠性的保障需要对网络流量有个直观了解,网络拥塞会导致数据丢包、延迟增加,致使应用无法正常运行。网络流量管理功能,可详尽直观的展现中心机房到下属各节点之间带宽的使用情况,比如网络上现在运行的应用以及流量模式、正在消耗最大带宽的主机和应用等。了解业务增长对带宽的需求,提供整个企业全年的数据,评估带宽升级所需要的数据,进而提供科学的容量规划。网络流量管理在以下几个方面提升网络性能:l 通过带宽管理可以让以前未知的网络应用的状况能够详细查看。 l 防范突发的流量激增和未知应用的攻击,如DoS攻击等,保障网络安全。 l

18、 通过对核心应用流量的监查,了解核心应用的使用率与效率。 l 保证关键应用所需的带宽,保证关键时候应用不受阻。设备性能分析是网络性能解决方案的物理基础。该方案产品通过简单网络管理协议SNMP收集设备数据并进行分析,实时了解网络环境内设备性能,跟踪交换机、路由器、服务器等网络基础设施的整体可用性和每个接口利用率,确认网络设备的健康状况及利用情况。实时监控所有支持SNMP的设备性能,做到设备性能下降时主动告警,定制图形报表直观展现,红灯引导直达问题根源,解决问题方便快捷。检测设备(物理或虚拟设备)的CPU利用率、内存利用率、硬盘使用等主要性能指标,提高设备利用率和可用性,确保设备当前可用性和性能在

19、可接受限度内。同时可以帮助企业运维人员了解设备性能问题的原因,对设备的健康状况及利用率进行趋势分析、容量规划,帮助企业进行更明智的基础设施投资。借助该方案所能实现的收益1、 提升IT管理能力实施该解决方案对网络基础设施、网络流量、应用性能进行统一的管理,可实现中心机房到各个分支节点的IT环境的可管理性,对现有的IT资源使用状况进行有效的评估和容量规划。监控端口、主机和协议流量分析数据做适当的容量规划监控应用的访问状态,并可继续深入分析问题原因监控设备性能状态与端口利用状态2、提高业务连续性和运营效率该服务保障解决方案有效的监控企业当中应用、网络、设备的健康状况,做到故障预警-性能下降及时报告、

20、出现问题及时告警、问题的定位追踪、根源分析等。3、减少管理人员在问题定位、故障排除的工作量,提升工作效率。提供网络拓扑、报告视图,图形化展示性能状态等功能,做到最全面、最深层次的分析,帮助我们全面快速的确认并排除故障,减少工作量。4、保持对物理服务器上的多层应用架构的可视性5、降低环境变更风险,避免和减少无谓的硬件成本以指定正确的采购策略,验证网络服务器和网络的性能优化。6、详细的数据视图,为管理人员提供整个网络环境的可视性。7、标准化IT管理流程,以业务服务为出发点来驱动技术管理。四、 应用性能管理解决方案在很多时候服务架构的部署不能达到预期的效果,原因多是不可预知的负载和计划外使用引起的性

21、能问题。在复杂环境中解决这些问题非常耗时而且成本很高。有效的发现问题和解决问题要求在整个的应用处理过程中具有完全的可见性,可以反映用户的全部体验。当问题出现时,如果没有对整个业务处理直观的可见性,解决这些问题会极为费时而且成本很高。为了在第一时间阻止这些问题发生,企业应该部署可靠的,可测量的,完整的应用性能管理解决方案。从客户端到应用基础设施的后端,对整个应用的性能和客户体验进行实时监控。Wily APM(应用性能管理)解决方案可以帮助管理服务架构环境中的复杂的处理过程。在服务架构的部署中,当一个问题出现时, Wily APM 可以帮助查明在应用环境中引起网络应用性能问题的部件,让企业可以避免

22、很多可能带来额外部署支出的问题,而且可以坚定企业对IT和业务的信心,同时避免用户的不满,和最终收入受损等不良后果。Wily APM解决方案包括Wily Customer Experience Manager(CEM,基于Web页面的业务交易监控)和Wily Introscope(中间件、应用内部调用关系监控)。因此Wily APM既可以管理在线客户体验、相关的Web应用,以至更加复杂和高度分布化的服务架构和虚拟化环境,同时该集成解决方案可用于管理Java和.NET部署特性,监控基于两种语言开发的应用的内部运行状态。支持企业IT运营部门和业务经理,确保其关键的Java和.NET Web应用满足业

23、务需求,在客户体验水平和性能方面都能够达到预期的目标。该方案支持异构服务架构部署,以帮助确保相互关联的企业如约提供服务。管理性能和保持网络应用实用性对于提供最好的客户服务和达到不断增长的商业需求十分重要。Wily APM解决方案能够实时监控所有业务交易,以便在问题影响最终用户之前进行发现、筛选和解决,从而帮助我们简化和优化对于大型异构.NET和Java Web应用环境的管理。Introscope 的可扩展性改进并支持我们更加高效地管理更多的关键业务应用,让我们能够降低复杂性、优化性能并控制成本。Wily APM解决方案具有强大的快速选择最优化方案的功能,和根本原因分析及历史记录报告功能。Wil

24、y Introscope能够一周24小时连续监控复杂的Java和.NET Web应用、应用服务器、ESB服务器、Process Servers和其它SOA基础设施组件,同时支持IT部门确保关键任务Web应用和Web服务满足业务目标和性能目标。凭借强大的快速筛选、根本原因分析、历史数据收集与报告能力可以辨认和消除瓶颈,优化资源和降低网络应用维护成本。通过支持企业适应瞬息万变的业务环境并为创新、增长和成本控制提供灵活支持,帮助企业解决由当前具有挑战性的经济情况引发的IT管理问题。Wily APM解决方案功能及使用收益 Wily APM 是一个关注与客户体验,实现从客户端到应用后台数据调用的全面监控

25、的服务保障应用性能监控解决方案。该方案以业务为核心,全面分析业务应用本身及其关联基础架构,从而直观展示服务影响严重程度并快速定位业务问题根源。基于Web页面的应用监控,关注客户访问体验状况。通过自定义各个业务的优先级别,客户优先级别,缺陷类型优先级别得出业务影响严重程度,并进行只能排序,当资源有限是确保有限的资源优先解决业务影响严重程度高的事务。记录访问Web应用的用户身份;根据实际环境定制相应用户组(按区域定制、按部门定制等),可协助运维人员定位业务问题原因;自动生成用户访问趋势图,制定用户SLA,实时关注用户体验。自定义设置事务SLA(针对突发事件),分析事务趋势图得到业务运行总体状态趋势

26、。自定义业务价值,可得到某事件的事件成本、IT价值、业务总体价值等信息。针对某一Web访问的突发事件,可拆分该项操作得到各个模块响应所花费的时间,进而得出那哪个业务响应环节(ASP页面响应或数据库调用等)花费时间较长,从而快速定位到问题根源。与后台的应用内部监控模块集成,使得在前台Web也可以看到后台各模块响应(建立会话、调用数据库等)状态。(-下图)应用后台通过安装探针的方式收集业务后台响应数据,生成图形化状态报表,自定义门限阀值,将收集到的响应数据与阀值比较,在报表界面以红黄绿灯的方式体现应用个部分运行状况,并自动将受影响严重的业务交易进行图表显示。针对某一项业务操作,可以追踪显示其应用响

27、应中某个具体模块响应时间以及所占比例情况(深入到代码级别,可用追踪视图、树视图等展示),从而可以直观的定位出问题发生的根源所在,不一定需要编程人员来检查代码,来大大减少运维人员排查、解决问题所花费的时间与精力。借助应用性能管理解决方案,企业可以实现:1、 实时关注到客户体验状况,并可定位受影响客户区域、严重程度等。2、 前台监控界面简单明了,方便企业管理者直观了解企业业务总体运行状态。3、 独特的价值分析模块可帮助管理着分析突发事件对整体业务价值的影响程度。4、 强大的问题跟踪能力保证了运维人员能够快速定位并解决突发事件。5、 系统自带数据库,可长时间保存监控数据,方便查看历史记录。6、 监控

28、操作系统资源CPU、内存、线程等。7、 通过自定义报警规则与报警动作(设置阀值、短信、邮件等)实现提前预警尽可能避免事件发生。 8、 以服务为核心的监控模式,不仅可以显示应用响应状况,同时也关联到基础架构层面,使的运维人员对企业IT环境状况有个宏观掌握。 五、 统一性能展示方案当降级或停机影响关键服务时,客户很快便会失望。 无论他们是外部客户还是您的员工,服务欠佳都会产生负面影响。您可以使用几个管理解决方案监控服务的各个方面,包括对 IT 基础架构组件或最终用户体验的支持。 但在诸多管理解决方案中,没有任何一个解决方案能够为您提供有关所有管理域中服务运行状况和可用性的完整的端到端视图。 如果缺

29、乏可见性,操作人员常常需要猜测是哪些跨网络、系统、数据库或应用程序监控工具报告的故障或性能问题实际上影响了关键的 IT 服务、使服务质量降级或增大了发生停机的风险。 同样,服务的利益相关方可能不了解 IT 是否能使他们实现业务目标。Service Operations Insight (SOI) 通过统一来自各个域管理工具的运行状况和可用性信息并使其与您的 IT 服务一致,可以帮助克服这些挑战。SOI 为您的管理基础架构引入了新的服务管理层,并通过开放的Catalyst可扩展集成平台,利用现有的管理技术投资并为其增添价值。SOI 提供与多个 方案产品和第三方应用程序的集成,而 Catalyst

30、 集成平台使您能够跨所有域管理器调节和同步 SOI 中的数据。SOI 使用多个图形界面显示服务管理数据,这些数据以适当的格式支持各方所需的业务功能,从而使操作人员可以正确地集中精力,合理地协调业务和 IT 目标。SOI 还充当综合的一级操作控制台,以管理来自所有集成产品的事件和报警的完整数据流。 操作人员可以使用 SOI 获得有关所有报警的整合视图,启用重要报警的自动升级,这些报警需要从一个界面跨域快速采取行动和解决问题。SOI 提供用于对报警的逻辑类别进行分组的报警队列、支持详细事件搜索的事件管理层,以及用于为事件筛选、关联和充实定义简单及复杂事件策略的界面。统一性能展示方案,秉承了开放集成

31、,智能的实时业务建模和分析原则,通过连接器将展示平台与各个监控方案连接在一起,手机各方案监控数据及影响状态,形成统一的界面展示。 基于Web页面的业务状态图形展示中,直观展示所有定制的业务(基础架构、网络、应用)运行状态(质量状况、运行状况、风险评估、SLA等),方便管理者直观了解企业总体IT环境及业务服务的状态。对于出现问题的基础设施或业务,可自动分析其受影响程度,形成报警,方便运维人员去分析解决。 其控制台系统,将关联的各个方案的数据与实时状态进行统一的展示,导入各模块服务,自动生成拓扑结构,并针对存在问题的服务生成实时事件告警。对于问题则可下钻到具体的监控模块进行具体分析。 自定义SLA

32、;自定义基础设施间关联关系(包含,依赖于等)。SOI所能实现功能: 与系统、网络、应用程序、工作负荷、安全、帮助台以及其他域的产品的集成,以及与某些第三方管理产品的集成 启用 Catalyst,以采用通用基础架构实现以下特性: 更广泛的集成 配置项调节,可帮助确保多个产品中管理的资源具有一组统一的属性值 配置项关联,可帮助确保多个产品中管理的资源作为一个实体显示在 SOI 中 双向连接器,可从各个域管理器检索数据,并根据 SOI 中调节和其他操作同步源域管理器中的数据 实施特定用例的能力,以及操作基础架构来配置自定义用例和同步规则的能力 开放的、可扩展的连接器框架,能够实现与其他管理解决方案轻

33、松进行基于字段的连接 基于角色的、可通过 Web 部署的、以服务为中心的可视化和报告功能,可支持在组织的所有级别上的业务决策 通过以下过程进行服务建模: 使用从直接监控和管理 IT 组件的域管理器导入的 IT 组件进行手工定义 定义属性(如项、影响和优先级之间的关联关系和传播)以对服务各方面进行优化的能力 进行服务发现来定义策略,这些策略可动态地发现资源并添加到服务,或自动创建配置项之间的关联关系 服务影响和根本原因分析,其中包括以下功能: 影响分析,评估和排定每个服务元素和故障情况相对于服务模型的重要性,并揭示故障或降级对相关服务组件的影响 各种工具,协助确定根本原因,并基于故障、降级和辅助

34、活动的配置项的关联关系和各项的状态对它们进行关联 事件和报警管理解决方案,其中包括以下功能: 事件收集、存储,和跨事件源的联合搜索 事件管理策略,可检测模式并实施处理操作,如在事件成为报警之前对事件进行筛选和关联 管理收集的所有报警,包括不影响受管服务的报警 报警队列,可对相关报警进行分组以进行专门管理 完整的跨域报警审核记录 报警升级跟踪 按优先级排列与服务相关的报警和报警队列中所有报警的控制台视图 与帮助台产品的集成,可提供对 ITIL 突发事件和问题管理过程的访问 服务级别协议 (SLA),您可以针对所监控的服务定义此协议,以便在定义的时段内对照违反阈值跟踪服务度量。借助该方案企业所能实现收益:1、 方便企业管理者宏观掌握公司总体基础架构及业务服务状态。2、 集中报警与状态信息可帮助服务运维人员全面的了解到IT环境状态及受影响 的基础设施或服务的状况。3、不同的组件关联关系可直观的体现服务影响关系,方便定位问题原因。4、评估业务状态,实现提前告警。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号