《ITIL培训课件.ppt》由会员分享,可在线阅读,更多相关《ITIL培训课件.ppt(363页珍藏版)》请在三一办公上搜索。
1、2023/2/14,Xx银行IT服务台系统建设项目,IT服务管理培训讲义,欢 迎,欢迎参加本次IT服务管理(ITSM)培训!非常荣幸有机会与各位一道分享国际IT管理“最佳实践”!,友情提示,请将您的手机声音调至最低或设为振动!上课时间:上午:9:15-12:00下午:1:30-5:30上课过程中,如有问题,可随时举手提出;本讲义仅供参加培训者个人使用,不得外传;请勿进行课堂录音;,课程目标,准确理解IT服务、服务质量、服务管理、IT服务管理和ITIL等核心概念;清晰描述ITIL框架各模块及其之间的相互关系;全面掌握ITIL的十个核心流程和服务台职能及其之间的相互关系;掌握IT服务管理的实施方法
2、和实施效果评价方法;获得参加EXIN ITIL Foundation认证考试的资格;学会如何利用ITIL来改进现有的系统运维和服务支持工作;通过培训,使培训对象了解主流服务支持系统的相关知识,提高其操作水平、操作能力。,自我介绍,您个人的基本情况?(姓名、工作经验、工作单位等)您当前对ITSM/ITIL的了解情况?您对本课程有什么期望?,2023/2/14,IT Service Management OverviewIT服务管理简介,现 实,20的原因是技术方面的,80的原因是管理方面的,调查发现(一):导致服务器、网络和应用出现故障的十大原因:,病毒攻击(57.1%)缺乏有效的监控制度和手段
3、(51.7%)IT设备本身的性能问题(41.1%)应用系统/数据库本身存在Bugs(39.2%)员工缺少技能培训(37.5%)维护不及时或缺乏有计划的维护(35.7%)缺少总体规划/重复建设(33.9%)不同部门的IT人员之间缺乏协调(32.1%)缺少运营管理方法论的指导(30.4%)员工不按规定/流程操作(28.6%),20%技术,40%操作错误,40%应用故障,对 策,调查发现(二):减少基础设施故障最有效的措施:,推行流程管理(60.7%)实行统一的安全管理与控制(53.6%)争取公司高层领导的重视和支持(51.8%)对员工进行有针对性的培训(51.8%)定期分析系统和网络的性能(51.
4、8%)进行集中式管理(48.2%)进行冗余备份和灾备(33.9%)加强对用户的培训和教育(32.1%)设立统一的IT支持前台(35.7%)使用网络、系统或数据库监控系统(30.4%),管理的问题还是需要用管理的手段来解决!,IT管理&服务的层次和定位,Technical Management,Service Management,网络,服务器,数据库,主机,桌面,系统,应用,其它,安全管理,运营管理,外包管理,其他,需求管理,项目组合管理,IT服务战略管理,项目1,项目3,项目2,项目4,客 户用 户,服务提供者,ERP支持和维护,安 全,存储&备份,面向项目的管理和面向服务的管理,备 件,我
5、们的解决方案?,Process A,Process B,Process D,Process C,Process E,Process n.,“支离”的IT服务:,1,通过流程进行整合:,2,如何实现流程管理?,3,ITSM是最受认可的解决方案,4,IT服务管理(ITSM)的含义,一个领域,它将,进行有效而合理的整合,以提供高质量的IT服务。,IT服务管理是一套通过SLA来保证IT服务质量的协同流程。它融合了系统管理、网络管理、系统开发管理等管理活动以及变更管理、资产管理、问题管理等许多流程理论和实践。Gartner,IT服务管理是一种以流程为导向、以客户为中心的方法。它通过整合IT服务与企业业务
6、,提高了企业的IT服务提供和服务支持的能力和水平。itSMF,ITSM的核心思想,IT组织,不管是企业内部的还是外部的,都是IT服务提供者,其主要工作就是提供低成本、高质量的IT服务。IT服务的质量和成本则需从IT服务的客户(购买IT服务的)和用户(使用IT服务的)方加以判断。ITSM也是一种IT管理,但与传统的IT管理不同,它是一种以服务为中心的IT管理。ITSM的“三大目标”:,IT服务管理(ITSM)的“范围”,ITSM VS.ERP/CRM/SCMITSM主要适用于IT管理、而不是企业的业务管理;前者面向IT管理,后者面向业务管理。ITSM VS.IT规划ITSM不是通用的IT规划方法
7、;ITSM的重点是IT的运营和管理,而不是IT的战略规划。ITSM VS.技术管理ITSM的主要目标不是管理技术;ITSM的主要任务是管理客户和用户的IT需求;有关IT的技术管理是系统管理和网络管理的任务。,ITSM对IT服务的作用,“支持服务真的就能满足我们所有的需求吗?一些IT供货商在蔑视用户的认知能力,把我们当小孩哄。服务价格完全由它们说了算。”中国化工信息中心副主任李中,规范化,规模化,语言,服务内容,价格,服务规模,客户规模,“牵涉到核心业务,IT外包要谁做?IT服务商是否懂业务?有没有安全保障?定价怎样算合理?”协和医科大学肿瘤医院计算机室主任李怀成,在规定的时间,完成规定的任务!
8、,1,2,通过调查,我们看到:只有1.4%的大型企业选择将后台系统外包给第三方;3.3%的大型企业将前后台全部外包给第三方。2003年度中国大型企业信息化调查报告,“双 规”,像制造产品一样生产服务,输入,输出,服务,成本,IT生产车间,ITIL降低成本,ITIL提高服务质量,流程(Process Flow),ITSM/ITIL!,如何实现IT服务管理(ITSM)?,IT 服务管理,ITIL,ITSM和ITIL之间的关系,ITSM是目标,ITIL 是工具!,ITSM流程模型,IT服务连续性管理,用户,客户,应用管理,服务级别管理,IT服务财务管理,能力管理,可用性管理,配置管理,变更管理,安全
9、管理,事件管理,问题管理,服务台,网络管理,CRM,服务支持,服务提供,发布管理,ITSM的发展趋势,70s,80s,90s,系统管理,网络管理,分布式应用管理,ITSM,市场成长率:Gartner:32%cagrIDC:30%cagrMeta:26%cagr,ITSM的发展趋势(续),ITSM在全球:15万人获得ITIL证书2000家公司加入itSMF15个国家成立itSMF分会10万册itSMF Pocket Guide被售出100种ITSM类软件80的财富500强企业实施过ITSM项目,ITSM在中国:1999年进入中国目前处于推广阶段Big4全部进入、全力推广实施ITSM项目客户:上海
10、证交所、国家统计局中国移动、中国联通中国银联、中国工商银行汇丰银行、交通银行太平洋保险、海关总署,2023/2/14,IT Infrastructure Library(ITIL)Overview,ITIL是什么?,ITIL是:IT Infrastructure Library的简称;英国商务办公室从20世纪80年代开始开发的一套IT管理方法;已成为事实上的行业标准,并以其为中心在全球形成了完整的产业;任何单位和个人都可免费使用的“公共框架”;实际上是一系列由所谓“最佳实践”(Best Practice)形成的图书:,ITIL不是:硬 件软 件一个可以直接使用的标准,OGC开发ITIL的目标,
11、建立一系列完全的、一致的、连贯的最佳实践规范,以提高IT服务管理质量,并推动采用IT技术提高业务有效性鼓励私营机构开发相关服务和产品(培训、咨询及工具)以支持ITIL,ITIL2.0 框架,ITIL框架(续1),业务管理(Business Perspective)在提供IT服务的时候,首先应该考虑业务需求,根据业务需求来确定IT需求;业务管理模块指导业务管理者以自己习惯的思维模式:分析IT问题,了解IT基础架构支持业务流程的能力了解IT服务管理在提供端到端IT服务过程中的作用。服务管理服务管理模块是ITIL的核心模块;ITIL把IT管理活动归纳为十个核心流程和一些辅助流程,然后利用这些流程进行
12、有关IT管理工作;一共包括十大流程和一项服务台职能。,ITIL框架(续2),IT基础架构管理(ICT Infrastructure Management)侧重于从技术角度对基础设施进行管理;覆盖了IT基础设施管理的所有方面,包括识别业务需求、实施和部署、对基础设施进行支持和维护等活动;目标是确保IT基础架构稳定可靠,能够满足业务需求和支撑业务运作。应用管理(Application Management)为了确保应用系统满足客户需求并方便对其进行支持和维护,IT服务管理的职能应该合理地延伸,介入应用系统的开发、测试和部署;应用管理模块指导IT服务提供方协调应用系统的开发和维护,以使它们一致地为客
13、户的业务运作提供支持和服务。,ITIL框架(续3),安全管理1999年新增到ITIL中;目标是保护IT基础架构,使其避免未经授权的使用;为确定安全需求、制定安全政策和策略以及处理安全事件提供全面指导;侧重从政策、策略和方法的角度指导如何进行安全管理。IT服务管理实施规划“如何做”(How);作用是指导如何实施上述模块中的各个流程,包括对这些流程的整合;指导客户确立远景目标,分析和评价现状;确定合理的目标并进行差距分析;确定任务的优先级,以及对流程的实施情况进行评审。,ITIL 服务支持与服务提供职能与流程,Service Support流程,事件管理,问题管理,变更管理,发布管理,配置管理,事
14、 故 问题和已知错误 变更 发布 配置项关系,事 故,事 故,服务台,业务、客户和用户,沟通、更新和权益措施,事件请求、需求,客户调查报告,变 更,发 布,管理工具,CMDB,Service Delivery 流程,可用性管理,能力管理,IT服务财务管理,IT服务连续性管理,需求、目标和绩效,服务级别管理,业务、客户和用户,请求和需求,警告和期望调整,管理工具和IT基础架构,沟通、更新和报告,为什么使用 ITIL?,IT服务提供商利用ITIL 概念和实践可以:提高客户对IT服务的满意度加强与客户的交流对于关键系统和基础架构,使之达到更高的可靠性提升服务的性价比在所有员工中建立一种共识,谁在使用
15、 ITIL?,世界范围内超过10,000家的公司欧洲,加拿大,和澳大利亚的IT从业者微软,惠普,IBM等国际厂商IT支持服务供应商,受ITIL影响的工具,HP Openview Service Desk“根据ITIL的最佳实践设计”Remedy Strategic Service Suite“和ITIL的最佳实践相兼容”CA Unicenter Service Desk“和ITIL相适应”Peregrine Service Center“基于世界范围内顶尖的IT从业者多年的经验,以及最佳实践的全球标准,包括ITIL。”,基于ITIL的框架,Microsoft Operations Framew
16、ork(MOF)“结合了ITIL的工业标准,以及微软产品与技术的特殊要求”HP IT Service Management Reference Model“建立在惠普的服务管理与流程的经验,以及ITIL和最佳实践基础之上。”,ITIL 管理者,OGC仍然拥有ITIL ISEB(信息系统考试委员会)EXIN(信息科学考试学院)itSMF International&Chapters,1,2,3,4,“四架马车”,2,3,1,4,2023/2/14,服务台(Service Desk),议 程,概述基本概念主要活动与其它流程之间的关系成本、效益和问题关键成功因素和绩效指标总结,概 述,定义:报告事件
17、和请求提供用户支持的中心,它主要关注运作层次的用户支持。目标:为客户和用户提供单一联系点;协调客户(用户)和IT部门之间的关系,为IT服务运作提供支持,从而提高客户的满意度;作为首次联系点,服务台通过截取不相关问题和容易回答的问题减轻了其他IT部门的工作量。“过滤器”、“路由器”、“应答机”、“监控器”、“灭火器”、“传声机”,基本概念(1):呼叫中心/帮助台/服务台,呼叫中心/帮助台/服务台呼叫中心:组织中负责处理大规模基于电话的交易的部门,这种方式在银行和保险业中使用较多。帮助台:负责管理、协调并尽快地解决IT服务运营中发生的意外事件的部门。帮助台需要确保客户的每个请求不会被丢失、遗忘或忽
18、略。服务台:不仅负责处理事件、问题和询问,同时还为其它活动和流程提供接口。这些活动包括客户变更请求、维护合同、软件协议、服务级别管理、配置管理、可用性管理和IT服务连续性管理等。,基本概念(2):集中式服务台,定义:由一个物理上的服务中心集中处理所有的服务请求,为用户提供了单一联系点。优点:降低总体运营成本;管理控制上得到了加强;提高了资源利用率。缺点:灵活性较差,难以针对各地用户的特殊情况提供个性化的服务。,用户1,用户2,用户3,集中式服务台,第三方支持,网络运营支持,应用系统支持,桌面支持,二线支持,基本概念(3):分布式服务台,定义:每个地区或分部都创建了自己的服务台以支持自己的业务运
19、作。优点:便于提供本土化、个性化的服务,响应速度快。缺点:当用户很多且需要的服务比较相似时,这种模式容易造成重复建设,浪费人力和物力,增加服务台运作的总体成本。,基本概念(4):虚拟式服务台,定义:和用户保持单点联系的一种特殊的分布式服务台。优点:降低了运营成本;加强了统一管理;提高了资源利用率。缺点:难以提供现场支持;实施要点:统一接入方式,包括流程、规程和术语;统一数据输入语言;保持客户和用户的单点联系,如利用虚拟桌和呼叫自动转移技术实现全球或地区统一电话号码;适当安排服务专家或工程师出现在客户服务现场;使用统一的事件处理和管理流程。,基本概念(5):呼叫中心/非技能型服务台,呼叫中心只负
20、责记录呼叫请求而不提供解决;呼叫请求被转发到相应的专家部门;在有些情况下,呼叫请求的记录和转发可以通过语音响应系统自动进行。非技能型服务台呼叫请求被记录下来,并用通用的术语进行描述;大多数被立即转发至相应的支持人员;在很大程度上只是一个调度部门优点在于事件记录被标准化了,并且是代表着用户的利益对事件进行监控和管理的;其缺点是响应时间更长,首次呼叫解决率要远低于技能型服务台。,基本概念(6):技能型服务台/专家型服务台,技能型服务台比前面的几种服务台具有更多的技能和经验;通过使用文档化的解决方案,它可以解决许多事件,虽然有些事件还是要转发给相关的支持小组;首次呼叫解决率通常都要远远高于非技能型服
21、务台。专家型服务台具有关于全部IT基础架构的专家知识以及独立地解决大部分事件的专门技术。,主要活动,响应呼叫请求发布信息供应商联络运营管理任务基础架构监控,呼叫请求用户与服务台进行的联系;所有的呼叫请求都应该记录下来以便进行进展监控以及为流程控制提供有关的数量指标。呼叫请求:事件(包括标准变更)错误报告:真实的故障以及对服务的抱怨服务请求:服务请求在ITIL中被规类为事件,但它并不包括IT基础架构中出现的故障。呼叫请求:变更(非标准变更)不被当作服务请求处理的非标准变更;针对这种变更的请求必须遵循标准的变更管理流程,需要提出一项正式的变更请求(RFC)。,主要活动:,响应呼叫,发布信息,供应商
22、联络,运营管理,基础架构监控,发布内容当前或预期发生的错误,特别是在他们受到影响之前;有关新的和现有的服务项目、服务级别协议(SLA)的供应以及定购程序和成本等方面的信息发布方式消极的方式,如提供一个公告牌积极的方式,如E-mail、屏幕上显示的联机消息或屏幕求助消息,主要活动:,响应呼叫,发布信息,供应商联络,运营管理,基础架构监控,联系事项:打印机、工作站的维修和替换;电信设备的维修和替换;对纯粹感觉上的事件(干扰)以及变更和服务请求的处理。,主要活动:,响应呼叫,发布信息,供应商联络,运营管理,基础架构监控,进行备份和恢复、提供局域网连接。对当地服务器进行磁盘空间管理、创建帐号、设定和重
23、设密码等也是服务台的职责。,主要活动:,响应呼叫,发布信息,供应商联络,运营管理,基础架构监控,主要活动:,响应呼叫,发布信息,供应商联络,运营管理,基础架构监控,服务台可能有权进入各种工具系统,这些系统被用来估计那些影响关键设备的故障可能产生的影响,如路由器、服务器、网关、关键任务系统、应用系统以及数据库等。通常,这些工具在某个故障出现或正对基础架构产生威胁时就能自动地排除这些故障并通知事件管理。正常情况下,使用这些工具系统主要是运营小组的任务,由他们将有关的信息报告给服务台。,与其它流程之间的关系,服务台与事件管理,服务台与变更和发布管理,服务台为变更和发布管理接收相关的RFCs和传达相关
24、的发布信息。服务台可能还要承担软件和硬件的安装工作,因而在发布管理或变更管理中也承担了一个角色。,服务台致力于在错误发生时尽可能快地恢复约定的服务级别。服务台通常提供有关用户对服务级别管理流程质量的体验(用户满意度)方面的有价值的信息。用户满意度 VS.客户满意度;服务台协助降低服务中断所造成的影响的响应时间和解决时间。,与其它流程之间的关系(续1),服务台与配置管理,服务台与服务级别管理,服务台可以告知用户其受到支持的产品以及有权使用的服务。如果服务台没有被授权来解决用户的请求,则应该礼貌地告知用户这点并将请求通报服务级别管理。服务台在处理用户请求时应该以服务级别协议作为双方协调的依据。,当
25、服务台记录有关事件和问题时,需要验证呼叫者以及相关的IT组件,这需要结合配置管理流程中的CMDB进行。,关键成功因素和绩效指标,关键成功因素:如果呼叫请求很难到达服务台,则用户可能不会去联系它转而试图自己解决错误,或在组织内找一个可以帮助他们的人来帮忙解决。如果用户试图直接联系有关的专家,则他们通常应该先向服务台询问。应该制定良好的SLA、OLA以及服务目录以确保服务台提供的支持有一个明确的重点。关键绩效指标:对来电是否快速接听(如90的呼叫在x秒内得到响应)?呼叫是否在x分钟内被转到二线支持(如果它们不能在服务台得到解决)?在没有求助其它支持层次如二线支持、三线支持或供应商的情况下事件被解决
26、的百分比;每个工作站/用户被处理的呼叫的数目,以及整个服务台该项指标的总数;,2023/2/14,事件管理(Incident Management),议 程,概 述基本概念主要活动关键角色与其它流程之间的关系成本效益及可能的问题分析关键成功因素和绩效指标总 结,概 述,定义:事件管理是负责记录、归类和安排专家处理事件并监督整个处理过程直至事件得到解决和终止的流程。目标:在给用户和公司正常的业务活动带来最小影响的情况下,尽快的返回到SLA中定义的正常服务级别。保留事件的有效记录以便能够权衡并改进处理流程,给其他的服务管理流程提供合适的信息,以及正确报告进展情况。,基本概念(1):事件/服务请求,
27、事件(Incident):在某一服务中不属于标准操作的并能导致或可能导致这个服务的中断或服务质量下降的任何事件;服务请求(Service Request):用户想要获得有关的支持、提供、信息、建议或文档而提出的请求,它并不属于IT基础架构方面的故障;一个服务请求可能是要求进行一个标准变更,但是只要它属于标准服务的范畴,那么就应当由事件管理而不是变更请求流程进行处理。如果被请求的服务不是事先已经定义好的标准服务,并且它将改变IT基础设施的状态,那么我们将据此提交一个变更请求(Request For Change,RFC)。,基本概念(2):影响度/紧急度/优先级,影响度:影响度指就所影响的用户或
28、业务数量而言,事件偏离正常服务级别的程度;紧急度:解决故障时,对用户或业务来说可接受的耽搁时间;优先级:处理事件和问题的先后顺序;,基本概念(3):升级,定义:如果某一事件不能在规定的时间内由一线支持小组解决,那么更多的有经验的人员和有更高权限的人员将不得不参与进来,这就是升级。它可能发生在事件解决过程的任何时间和任何支持级别。职能性升级(Functional Escalation)需要具有更多时间、专业技能或接入特权(技术机构)的人员来参与事件的解决。这种升级可能会超越部门界限而且可能会包括外部支持者。结构性升级(Hierarchical Escalation)当经授权的当前级别的机构不足以
29、保证事件能及时、满意的得到解决时,需要更高级别的机构参与进来;一般情况下应优先使用职能性升级,只有当在某些事件不能得到及时解决时才考虑使用结构性升级;,基本概念(4):一线、二线、N线支持,第1线支持(也称为第1排支持人员)通常由服务台来提供;第2线的支持则由管理部门提供;第3线的支持由软件开发人员和系统结构人员提供;第4线的支持由供应商提供。,检测和记录,事件匹配,事件归类初步支持,解决?,调查分析,解决?,调查分析,解决?,确定解决,确定解决,确定解决,结束事件,继续,否,否,否,是,是,是,主要活动,接收和记录归类和初步支持匹配调查和诊断解决与恢复终止跟踪与监控,主要活动:,接收记录,归
30、类和初步支持,匹配,调查诊断,解决恢复,终止,Why记录?已有的事件记录可帮助对新发生的事件进行诊断;问题管理可通过对事件的记录来发现问题的原因;如果所有的来电呼叫都被记录下来,那么对某一事件的影响度的判断会容易一些;如果没有事件记录,那么将不能监控经过协商服务级别是否得到履行;避免在解决问题时出现几个人同时解决同样的问题,或在对某一事件的处理过程中什么工作都没有做等情形;Who报告?由某一用户发现由系统发现由某一服务台员发现由另一IT部门的人发现,跟踪监控,主要活动:,记录What?(部分)事件编号(唯一的);事件类别;记录事件的时间和日期;事件记录人(或组)的姓名(或ID);有关用户的姓名
31、、部门、电话和工作地点;回复用户的方式(如电话,电子邮件等);事件症状描述;How记录?分配一个事件索引序号大多数情况下系统会自动分配一个唯一的事件索引序号。通常,在后续沟通过程中用户可使用通过提供的查询序号来查看事件状态。记录基本的诊断信息时间、症状、用户、处理问题的人、地点以及受影响的服务或硬件等信息;附加事件信息包括与事件相关的其他信息(例如一个脚本或交谈程序记录)或配置管理数据库中的一些信息(通常以数据库中定义的关系为基础)。警告如果存在一个具有高影响度的事件,例如某一重要服务器的瘫痪,则应警告其他用户和管理部门。,类别将事件归入某一类别或某一子类如按事件发生的可能原因分类或按与事件相
32、关的支持小组进行分类。优先级影响度紧急度服务按照SLA的有关要求,需要用一个列表来标识与事件相关的服务。这个列表同时也提供了按照SLA对相关服务的升级时间。,主要活动:,接收记录,归类和初步支持,支持小组如果服务台不能在预先确定的时间范围内解决事件,决定应该由那个支持小组来负责处理该事件。时间表以优先级和SLA为基础,受影响的用户将会被通知预计解决问题的最长时间(一个周期时间);以及什么时候可进行进一步的升级。事件索引号工作流状态:新建;已接收;已计划;已分配;活跃状态;已暂停;已解决;已终止。,主要活动:,接收记录,归类和初步支持,主要活动:,接收记录,归类和初步支持,对事件进行分类之后,要
33、检查以前是否发生过类似的事件。如果发生过,则查看是否存在解决方法和应急措施。如果新事件与某一问题或某一已知错误具有相同症状,那么可将事件指向这些已知的问题或错误。,服务台将那些没有快速解决方法或超过他们专业水平的事件安排给具有更高专业水平和技术能力的支持群体。支持小组将对事件进行调查并尽快加以解决,如不能解决,则将其转交给其他的支持小组。,接收记录,归类和初步支持,主要活动:,主要活动:,接收记录,归类和初步支持,成功完成对事件的分析解决之后,负责解决问题的支持小组应在系统中记录故障的解决方法;对某些解决方法来说,必须要向变更管理发送一个变更请求(Request For Change,RFC)
34、;如果没有找到解决事件的方法,那么事件依然保持开放(Open)状态。,主要活动:,接收记录,归类和初步支持,一旦解决方法执行完毕,支持小组要把事件处理情况反馈给服务台。服务台应联系事件的报告人以确认问题的确已经得到解决。如果服务台可以确定问题已经得到很好的解决,那么事件就可以关闭(Close)了,否则需要在适当的地方重新开始处理流程。在事件关闭的过程中,必须要对事件的记录进行更新以指明对事件最终的分类和优先级,受影响的服务、用户、客户,以及导致事件发生的配置项(CI)等。,主要活动:,接收记录,归类和初步支持,作为所有事件的拥有者(Owner),服务台负责对事件的发展情况进行监控以及通知用户有
35、关事件的状态。用户在某一状态变更后可能作出适当的反馈,如在预期的事件周期内发生的进一步的事件移交安排或变更等。在对事件进展进行跟踪和监控时,可能需要将事件进行职能性升级,转派给其他支持小组来处理,或进行结构性升级,以加强处理事件的力度。,关键角色,事件经理:对以下事情负责:监控处理流程的效果和效率;控制支持小组的工作;为改进工作提供建议;开发并维护事件管理系统;通常指派给服务台经理;支持人员:第一线支持负责记录、分类、匹配、转交、解决和终止事件;其它的支持小组主要参与调查、诊断和恢复工作。,与其它流程之间的关系,事件管理与配置管理,事件管理与问题管理,问题管理需要了解事件记录以便查出任何潜在错
36、误。问题管理通过提供与特定问题相关的信息、已知错误、应急措施以及当前修补方法等来给事件管理提供帮助。,配置管理显示基础架构的某一部分由谁来负责,这样当与这一部分相关的事件发生时可以迅速地进行追踪。CMDB还有助于决定合适的应急措施,如转移打印队列,将用户转移到另一个服务器等。在进行事件注册时,配置的详细信息也被链接到了事件记录以提供更好的相关错误信息。,与其它流程之间的关系(续1),事件管理与变更管理,事件管理与服务级别管理,服务级别管理监控与用户就提供的服务支持达成的协议。事件管理必须熟悉服务级别协议(SLA)以便在与用户进行沟通时可用到这些信息。事件记录可用来生成报告来判断是否真正地提供了
37、规定级别的服务。,可通过实施变更来解决事件,如更换监视器等。变更管理为事件管理提供关于预定变更及其状态的信息。不正确的变更实施或者包含错误的变更也可能引发事件。此时,事件管理也可以为变更管理提供关于这类事件的信息。,与其它流程之间的关系(续2),事件管理与可用性管理,事件管理与能力管理,能力管理关注与其职能相关的事件,如由缺少磁盘空间或响应时间过长导致的事件。业务经理、系统经理或系统本身可将这些事件通报事件管理系统。,可用性管理需要使用由配置管理提供的事件记录和状态监控。,成本效益分析和可能的问题,成本:初始执行成本(如对流程和过程的定义以及相互间的沟通);培训和指导人员(顾客和支持人员);选
38、择和购买支持流程的工具等;与人事和工具使用相关的成本。可能的问题:用户和IT人员故意避开事件管理程序;事件处理超载和堆积;过多的升级可能会打乱专业技术人员的正常工作而产生负面影响;缺乏清楚的定义和协议;缺少奉献精神,关键成功因素和绩效指标,成功的事件管理需要:及时更新的CMDB来帮助估计事件的影响度和紧急度。知识库(例如一个最新的问题数据库或已知错误数据库)。帮助识别事件,以及有什么解决方法和应急措施可以使用;适当的自动系统。用于记录、跟踪以及监控事件;与服务级别管理间的紧密联系以确保适当的优先级和解决时间。事件管理流程的关键绩效指标:事件的总数;平均解决时间;每个事件的平均支持成本;在SLA
39、的目标之内解决的事件所占的百分比;不需拜访用户就解决的事件数;每个服务台工作站或每个服务台员工平均解决的事件数。,2023/2/14,问题管理(Problem Management),议 程,概 述基本概念主要活动关键角色与其它流程之间的关系成本、效益和问题关键成功因素和绩效指标总 结,概 述,定义:通过调查和分析IT基础架构的薄弱环节、查明事件产生的潜在原因并制定解决事件的方案和防止事件再次发生的措施,将由于问题和事件对业务产生的负面影响减小到最低的服务管理流程。调查基础架构和所有可用信息,包括事件数据库,来确定引起事件的真正的潜在原因以及提供的服务中可能存在的故障。目标:将由IT基础架构中
40、的错误引起的事件和问题对业务的影响减少到最低程度;查明事件或问题产生的根本原因,制定解决方案和防止事件再次发生的预防措施;实施主动问题管理,在事件发生之前发现和解决可能导致事件产生的问题。,基本概念(1):问题/已知错误/变更请求,变更请求说明了变更的内容及与变更有关的配置项。根据请求,变更管理小组和用户及其它有关人员对变更实施结果进行评价并计划进一步的变更。,如果出现了一个已知错误,则应当提出一个变更请求。但是,在通过一项变更将此已知错误永久性地修复之前,它将仍将作为一个已知错误。,基本概念(2):事件管理VS问题管理,事件管理 VS.问题管理:问题管理的主要目标是要查明事件发生的潜在原因并
41、找到解决此事件的方法或防止其再次发生的措施;事件管理的主要目标是在事件发生后尽可能快地恢复客户服务,即使采取的是一些应急措施而不是永久性的解决方案;事件管理强调速度;问题管理强调质量,把速度放在第二位;为了发现事件原因和防止事件再次发生,问题管理可能需要花费更多时间解决事件且可能推迟恢复服务。,基本概念(3):应急措施,Workarounds(应急措施)解决某个事件的替代方案,这种方案可在限定的时间内产生一个可接受的结果。,基本概念(4):问题控制/错误控制,问题控制问题控制是问题管理流程的第一项活动。问题控制负责找出问题并调查其根源,其目标是通过确定问题根源并采取应急措施来把问题转化成已知错
42、误。错误控制错误控制指监控和管理已知错误直到其尽可能地得到适当的处理。为此,它需要向变更管理提交变更请求(RFC),并在实施变更后对变更进行实施后评审以评估其效果。,基本概念(5):实施后评审(PIR),实施后评审(PIR)用于解决问题、已知错误及相关事件的变更一旦实施后,在终止有关记录工作之前必须对变更进行实施后评审(Post-Implementation Review,PIR)。如果变更成功实施,那么对所有问题和已知错误及相关事件的记录工作都可以终止了。许多公司进行实施后评审是为了确保与问题相关的所有事件终止(包括确认客户是否同意终止事件)之后才能终止此问题。如果与其相关的所有事件没有全部
43、终止,则需将该问题重新置为“未解决”状态。,主要活动,问题控制(Problem Control)错误控制(Error Control)主动问题管理(Proactive Problem Management),如何确定问题?举例:对某一事件进行分析表明该事件可能再次发生,或者有大量发生并且加重的趋势。对基础架构进行分析可以找出可能会产生事件的薄弱环节(也可由可用性管理和能力管理来进行分析);服务级别可能会受到威胁(能力、性能、成本等)记录下来的事件不能与一个现有的问题或已知错误发生关联。,主要活动:,问题控制,错误控制,主动问题管理,如何归类?类别:-确定问题的相关领域,如是硬件还是软件问题;影
44、响度 主要指对业务流程的影响紧急度 也包含多长时间的延期是可接受的;优先级 紧急度、影响度、风险和所需资源的综合考虑状态 如问题、已知错误、已解决、已关闭但正在进行实施后评审等。,主要活动:,问题控制,错误控制,主动问题管理,主要活动:,问题控制,错误控制,主动问题管理,调查和诊断 一旦找到问题的根源以及与此问题相关的一个或多个配置项,就可建立配置项和相应事件之间的关联;之后如果找到了解决此问题的应急措施,此问题就转变为已知错误。临时修复措施(Temporary fixes)在解决问题的过程中,如果问题导致了严重的事件,那么找到一个临时修复或紧急修复的方法是非常必要的。但是如果临时修复措施需要
45、对基础架构进行一些改动,那么必须首先提交变更请求(RFC)(这主要是指在找到问题的最终原因之前)。如果特别严重而且不容耽搁,就必须启动紧急变更请求处理程序。,主要活动:,问题控制,错误控制,主动问题管理,描 述:根据对IT基础架构进行的分析,问题管理可以找到可能出现问题的薄弱环节,在事件发生前发现和解决有关问题和已知错误,以尽量减少问题和已知错误对业务的影响。趋势分析:找出IT基础架构中不稳定的组件,分析其原因,以便采取措施降低配置项故障对业务的影响;分析已发生的事件和问题,研究其变化趋势;通过其它方式和途径分析,比如系统管理工具、用户反馈等。制定预防措施:提交变更请求(RFC);提交有关测试
46、、规程、培训和文档方面的反馈信息;进行客户教育和培训;对服务支持人员进行教育和培训;确保遵守问题管理和事件管理的规程;改进相关的流程和程序。,主要活动:,问题控制,错误控制,主动问题管理,关键角色,问题经理开发并维护问题控制和错误控制流程;帮助提高问题控制和错误控制的效率和效用。提供管理信息并运用这些信息主动预防事件和问题的发生;对问题管理人员进行管理;获取问题管理行为所需的资源;开发并改进问题控制和错误控制系统;对主动性问题管理的有效性进行分析和评价。问题支持人员被动性职责:通过分析事件细节确定并记录问题;以问题的优先级为基础对其进行调查和管理;提出RFC监控已知错误的进展情况;为事件管理的
47、应急措施和暂时修复提供建议;实行重大问题评审。主动性职责:确认问题的发展趋势;提出RFC防止问题扩散倒其他系统;,与其它流程之间的关系,问题管理与配置管理,问题管理与变更管理,变更管理流程负责控制执行变更,包括由问题管理为消除问题而发出的RFC。变更管理通知问题管理关于纠正性变更的进展和完成情况。这些纠正性变更的评价需要与问题管理进行磋商。,配置管理提供关于基础架构、设计图、硬件和软件配置及服务等组件的重要信息。这些关系对问题管理的调查工作至关重要,因为他们定义了整个IT基础架构之间的相互关系。,与其它流程之间的关系(续1),问题管理与事件管理,问题管理与服务级别管理,服务级别管理包括就实施I
48、T服务时的服务质量问题进行协商和谈判。服务级别管理为问题管理提供用于定义问题的信息。而问题管理过程应当遵守、支持规定的服务级别。,有效的事件记录对成功地进行问题管理来说非常重要,因为这些信息是用于发现问题的。问题管理支持事件管理流程的工作,它为事件管理提供应急措施。,与其它流程之间的关系(续2),问题管理与可用性管理,事件管理与能力管理,能力管理为问题管理提供用于定义问题的重要信息。而问题管理找出与能力有关的问题,查明原因并进行纠正,以此来支持能力管理的工作。,问题管理通过找出服务失败的原因及补救方法来支持可用性管理的工作。可用性管理致力于基础架构的结构及设计,通过优化可用性的设计、规划和监控
49、来防止问题和事件的发生。问题管理在分析服务失败的原因时与可用性管理一起工作。,成本、效益和问题,成本:购买支持和诊断工具成本;人力成本;从外部供应商和支持机构雇佣额外的专业人员所需的成本。效益:提高IT服务的质量和管理水平 基础架构中的失败或错误已被记录并已消除;提高用户的效率 服务的质量的提高;提高支持人员的效率 解决方法已被记录下来,事件管理代理可更加快速有效地解决事件;提升IT服务的名誉 因为提高了服务的稳定性,顾客在开展新的业务时会更加信赖IT机构;加强管理,增加操作知识,提高学习能力 问题管理保存的历史信息可用于确定事件或问题发展的趋势,因此可阻止发生新的可避免事件。历史信息也有助于
50、在准备RFC时的调查也诊断工作。改善对事件的记录水平 问题管理为事件的记录和分类引入标准,以有效的找出问题及其症状。它同时也可提高事件的报告水平。更高的第一线支持问题解决率 由于问题管理使事件和问题的解决方法和应急措施在知识库中可用,所以事件由或问题由第一线支持人员解决的可能性更大。,问题:事件管理和问题管理之间的联系不密切 如果事件细节和问题以及已知事件细节间的界面不是很清楚,那么事件管理将很难注意到对问题采取的应急措施,同时,问题管理也很难实现对问题的影响度进行评估和监控。这样还可能造成关于IT基础架构的专业知识记录以及历史数据的减少。问题管理的成功很大程度上取决于事件管理和问题管理这两个