《软件项目运维方案ppt课件.pptx》由会员分享,可在线阅读,更多相关《软件项目运维方案ppt课件.pptx(14页珍藏版)》请在三一办公上搜索。
1、运维管理体系,运维团队,运维过程,团队角色,角色职责,素质要求,人员组成,运维规范,质量考核规范,工作内容界定,制度规范,运维流程,运维监控,ITIL 运维体系,对象界定,安全管控,采集平台,质量管控,监控中心,应用中心,知识管理,流程协作,协作监控,事件升级,运维流程-概述,运维流程主要是通过流程协作的形式对于运维过程中运维事件进行处理。建立维护工作平台管理积累运维知识,记录运维流程轨迹,并对整个运维过程管控。包含四个部分: 运维流程管理,运维知识管理,运维过程监控,运维事件升级管理。,运维流程-流程呈现,通过目前流行的地图呈现形式,将运维流程各关键流程节点直观展现,详细描述已经流转节点以及
2、预计描述未来节点走向。节点中呈现相关节点信息。,流程发起,节点一,当前节点,节点三,【MPT20152011200001】属于提数流程,目前处于正在处理状态,完成度为50%,当前处于第二节点,距离预警时间为2小时,工单紧急度为一般,到达时间处理人预期完成时间实际完成时间剩余处理时间,WEB门户,手机WIDGET,桌面WIDGET,展现渠道,运维流程-故障,问题流程一,输入,客户,服务台,维护工程师,运维经理,输出,发起阶段,处理阶段,电话,邮件,QQ,工单,开始,事件发起,有效性,ITIL单登记,FAQ解决,单独处理,编写处理方案,执行处理方案,事件升级,反馈客户结果,验证结果,FAQ,ITI
3、L事件单,ITIL归档,Y,N,Y,N,Y,故障,问题流程根据发起人的不同分为外部流程与内部流程。外部流程发起人为运维项目使用人员,内部流程是运维团队内部人员在巡检,稽核,或者使用过程中发现的故障,问题。本流程为外部流程,运维流程-故障,问题流程二,团队成员,服务台,维护工程师,运维经理,输出,处理阶段,开始,事件发起,ITIL单登记,FAQ解决,单独处理,编写处理方案,执行处理方案,事件升级,反馈结果,验证结果,FAQ,ITIL事件单,ITIL归档,Y,N,N,Y,本流程是内部流程,运维流程-提数,发布,变更流程,提数流程,发布流程,运维流程-运维交接流程,开发团队,运维团队,提交运维申请,
4、提交软件文档,检查文档质量,合格?,测试软件质量,填写 测试结果,合格?,重新交接,交接成功,输出,注: 交接过程中,提交的软件文档一般包含需求说明书,概要说明书,详细设计说明书,数据字典,测试报告,试运行情况报告分析,部署文档等,必须保持项目实际情况与文档一致性。 运维团队测试包含功能测试,用户测试,业务逻辑测试,集成测试,压力测试,需要在流程中填写相关的测试总结以及上传测试报告,不合格需要说明不合格原因。 以上过程需要再严格的规范下进行,不然,流程会因为只是个形式而失败,达不到预期效果,开发团队将软件项目交接给运维团队进行项目运维,该过程是一个责任过度的过程,需要严格的规范以及流程进行支撑
5、。该部分叫做运维交接流程。,运维流程-运维知识管理,整个运维过程中,知识的积累沉淀,传承至关重要,可以有效的避免对同一事件重复运维以及由于人员流动导致知识流失。 良好的知识库体系应当包含知识广泛的收集渠道能力,知识强大的管理能力,知识有效的应用能力。,知识分类,智能检索,知识应用能力,知识地图,知识视图,业务培训,问卷调查,知识采集,知识共享,知识审核,知识评价,知识推荐,知识传播,知识服务组件,常用FAQ管理,知识版本管理,知识管理能力,在线考试,知识收集能力,人工收集,其他知识系统收集,智能分析知识收集,知识渠道展现,运维团队成员,使用用户,客户,电脑,平板,手机,ITC人员,运维流程-预
6、警监控,预警监控主要对运维流程监控,通过设定预警规则,生成预警信息,后台自动调度的方式将预警信息推送。 预警过程的紧急度以及影响度,根据具体处理情况以及历史预警日志,系统智能将预警信息升级。,预警分析,监控点采集,自动调度,信息推送,预警流程,涉及到运维流程中的事件到达提醒,事件将超期提醒,事件逾期通告,对采集点进行监控,通过预设定规则,区分紧急度,信息接收对象生成预警信息,依据时间,事件紧急程度等实际情况,系统智能按频率触发监控,推送流程,依据接收人不同的角色信息,推送相应的预警信息,按运维流程紧急度,严重度,相应处理时间限制将预警级别划分为红,橙,黄警告根据流程紧急度,严重度,处理时间限制
7、等规则化时间升级条件,满足条件事件流程自动升级,并进行预警,流程升级,运维流程-事件升级,如果某一事件不能在规定的时间内由一线支持小组解决,那么再多有经验的人员和有更高权限的人员将不得不参与进来。这就是升级,它可能发生在事件解决过程的任何时间和任何支持级别,升级分为职能性升级和结构性升级。两者的区别如下:职能性升级:需要具有更多时间、专业技能或访问权限(技术授权)的人员来参与事件的解决结构性升级:当经授权的当前级别的结构不能保证事件能及时、满意地解决时,需要更高级别的机构参与进来运维过程中应当尽量在运维团队内解决,避免结构性升级,运维工程师,无法完成事件,产出,项目经理,内部专业工程师,外围开
8、发团队/移动技术部门,协调资源,解决,协调资源,组织团队解决,解决方案,职能性升级,结构性升级,Y,N,运维流程-制度规范,运维过程中,运维工作如何界定,项目交接给运维团队时机以及交接要求,运维人员对事件如何正确处理等都属于运维制度规范内容。,工作内容界定,交接规范,管理制度规范,涉及运维过程中已经交接运维团队项目提数,咨询,查证,数据库库巡检,数据稽核,服务器巡检,服务器漏洞修复,应急演练,故障处理,故障发现,数据修改,项目报告等,新项目需稳定运行3个月以上时间才能交接给运维组新项目交接给运维组必须对接手维护的同事做系统业务培训项目交接必须提供 项目需求文档.doc项目操作手册.doc项目维
9、护手册.doc 项目常见问题处理.doc 项目详细设计文档.doc 项目数据字典,服务时间响应规范:规范服务方式,故障级别相应服务行为规范现场服务支持规范ITIL单操作规范,运维监控-监控平台,目前ITC自建系统应用较多。影响业务流程可用性因子很多。如何变被动为主动,对事件进行事前管理,快速发现问题,智能分析故障,减少运维过程中事件带来不良影响力以及大量运维工作量。 建立完善的运维监控平台,以电子监控的形式辅助运维,提升运维效率以及业务功能可靠性。,展现渠道,监控中心,采集平台,监控对象,应用中心,网络系统,操作系统,业务系统,接口系统,采集工具集成,采集方式,采集调度,监控规则,监控视图,报
10、表中心,安全审计,智能提数,电脑,平板,手机,数据中心,告警级别,告警调度,告警规则,信息推送,运维流程-监控对象,网络系统监控点: 网络互通、端口开放情况、网络权限、网络延迟等监控频率:实时监控,操作系统监控点: CPU使用、内存使用、硬盘使用、用户数、进程数等适用系统:windows,unix监控频率:实时监控,业务系统监控点: 系统状态、占用内存、链接数、关键业务状态等监控方式:间隔频率监控,接口系统监控点: FTP可用性、web service可用性、servlet等监控方式:间隔频率监控,重点关注,运维流程-监控中心,在IT日益发展的当今,业务与IT已经紧密结合.一个IT项目的关联着
11、系统,数据库,应用,网络,业务,用户等多方面因素。对单个IT资源进行监控已经越来越满足不了IT运维需求。集成传统的监控方式,将整体业务作为主体,构建业务监控视图。 监控主要体现为四字原则:看、监、析、告,看得见:可以的通过网络拓扑图的这种表现形式将检测点以及检测点周边环境直观呈现,一目了然,监得到:对于监控点进行多层级别监控,通过监控规则快速识别监控点异常。,析得清:通过对监控点设置规则,监控中心可以对故障进行智能分析,检查,主动将故障发生的关注点告知运维人员,告得快:通过手机短信,手机widget监控视图,WEB视图,EAMIL等多种方式,将监控问题故障及时准确的发给运维人员。,监控中心成功四要素,1,2,3,4,