XX商业银行自动化运维解决方案.docx

上传人:牧羊曲112 文档编号:4926681 上传时间:2023-05-23 格式:DOCX 页数:11 大小:352.94KB
返回 下载 相关 举报
XX商业银行自动化运维解决方案.docx_第1页
第1页 / 共11页
XX商业银行自动化运维解决方案.docx_第2页
第2页 / 共11页
XX商业银行自动化运维解决方案.docx_第3页
第3页 / 共11页
XX商业银行自动化运维解决方案.docx_第4页
第4页 / 共11页
XX商业银行自动化运维解决方案.docx_第5页
第5页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《XX商业银行自动化运维解决方案.docx》由会员分享,可在线阅读,更多相关《XX商业银行自动化运维解决方案.docx(11页珍藏版)》请在三一办公上搜索。

1、XX商业银行自动运维管理平台解决方案1前言经过多年的发展,银行行业IT基础架构设施和应用系统已经颇具规模,一方面,它成 为各项业务经营活动的支撑平台,是全系统的网络中心、数据中心和业务处理中心,业务对 IT环境的依赖性越来越强;另一方面,随着银行从“生产中心”向“服务中心”的转型, 应用系统的日益完善与业务上的逐步创新也使得IT架构的复杂度不断加深。在这种背景下, 银行IT部门的工作职责越来越重。但是,由于缺乏先进有效的技术手段和维护体系,银行IT系统运维管理工作普遍面 临以下问题: 过多依赖IT部门员工的个人经验和手工操作,缺乏有效手段把日常操作运维流程 固化,建立标准化、智能化、自动化的操

2、作流程。 监控的内容、范围和深度都很有限,故障预警和处置响应时效滞后,监控系统多而 复杂,无法在统一平台上进行监控管理,较难满足关键业务持续性运营的要求,无 法保证系统的安全、稳定、高效运行; IT部门人力不足,难以应对繁重的运维要求,一旦出现IT事故将直接影响业务, 如果缺乏快速的自动化切换手段,将难以满足监管部门对IT系统运行指标和服务 水平的合规风控要求,IT部门肩负重大责任。银行行业的发展推动着中国经济体制和社会资源配置方式的变革,它的平稳运行影响着 社会的稳定和谐。因此,银行IT部门的工作质量和效率、信息资源的可用性、系统的安全 性和稳定性,显得更加重要和突出。为切实提高IT部门的支

3、撑能力与服务水平,降低运营成本和系统风险,银行普遍意识 到需要引入先进的管理思想以覆盖“监视”、“管理”、“控制”这IT管理领域三大功能区域 的全部管理需求,真正实现:面向业务的监视、面向流程的管理、面向运维的自动化控制。2建设目标对系统的运行监控,各银行已经逐步构建了相应的系统,监控管理在行业已经得到了比 较普遍的应用。本方案重在提供面向运维的自动化控制的解决思路,通过自动化运维管理平 台,建立标准化、智能化、自动化的运维流程体系。(1) 建立自动化操作平台,以实现日常业务操作流程的自动化、标准化、智能化,包括对业 务应用的远程开启、关闭操作、对运维主机的远程开启、关闭管理,对日常批量作业的

4、 自动化执行处理。提高信息系统执行效率和可靠性,杜绝因个体差异可能带来的人工操 作失误(2) 建立以业务服务可用性为核心,面向运维监控的统一展现平台。提供多种采集手段,采 集现有的业务系统监控数据,将不同业务分散的监控数据进行整合,实现在统一的监控 平台集中展示、集中报警。(3) 建立智能化的自动巡检体系。自动地对各类应用系统的运行状况进行周期性巡检,并提 供相应的巡检记录和巡检报告;(4) 实现运维文件的统一配置管理。可以实现对系统配置文件、系统日志文件的自动化管理, 包括文件的变化情况、应用状态、日志文件关键字等监控提示;(5) 建立容灾切换管理平台,实现故障切换操作的自动化、演练测试操作

5、的自动化。提供容 灾切换流程的向导管理、容灾切换状态的实时监控、容灾切换流程的自动执行,构建标 准化、智能化、可视化的切换管理平台;缩短故障处理时间及容灾切换时间(6) 建立监控和运维管理相关数据的分析、挖掘和可扩展、定制的综合报表平台。3系统设计原则1. 高效稳定、安全可靠的设计原则本系统底层采用高效C+语言开发,注重对资源开销的低能耗,对现有应用无任何 不良影响,系统资源占有高峰时期不超过2%,客户机与服务端信息交换流量3k/5秒, 网络占用可忽略不计。网银级别安全认证技术,确保登录身份认证安全,系统提供严 格的操作轨迹审计,所有操作执行可稽核。2. 简单应用,具有良好的交互界面运维管理系

6、统为绿色软件,无需安装,操作简单,紧密结合维护人员的操作习惯, 用户界面基于采用基于Windows风格的操作界面,完全采用中文界面,方便用户的操作, 升级包如杀毒软件般自动分发升级,易于维护易于使用。3. 平台应具有很好的开放性系统具备开放集成能力,可以实现与集中监控系统的对接实现数据交互,与现有 IT工作管理平台的运维流程管理对接的功能。4. 系统应具有良好的扩展性系统不仅可以满足现阶段管理的需要,未来随着业务的不断发展,系统具备的开放 式脚本、配置化流程可以适应各种自动化任务管理的需要。自动化运维平台架构4.1.技术架构自动化运维管理平台采用三层架构,既支持B/S模式,也支持C/S模式,兼

7、容多种数据 库(MySql、Oracle等)的部署。系统核心引擎采用高效C+语言开发,注重对资源开销的 低能耗。系统基于原子化、部件化的设计理念,确保技术架构的可复用性、灵活性。系统遵 循绿色软件理念,无需安装,部署简单。ClientServerDataBase Server任务调度Tablet PCNotebook PCControl第三方监控系统流程设计 引擎Desktop PC4.2.部署架构自动化运维系统按照银行业务对安全性的要求设计为三层结构:客户端、服务器端及控 制端。系统部署简单方便。1、单级架构适用于单级网络架构的部署,例如中心机房的服务器及应用部署说明: 自动化运维管理平台客

8、户端部署于生产环境各业务系统主机之上,进行操作脚本和 监控脚本的配置,并提供给服务器端的调度运行操作脚本,并将采集到的业务系统 运行状态反馈给服务器端; 应用自动化运维管理平台服务器端部署于自动化运维系统服务器。服务器端可以实 现对运维系统的数据管理以及消息转发处理,是系统调度和处理的核心部分。该服 务器使用双网卡,根据信息安全规范分别连接生产环境与办公环境等不同网段,服 务器端统一调度各客户端操作脚本的运行并进行统一的权限管理;系统同时提供了 双机热备的解决方案,出现服务器单点故障的时候,系统可以实现快速的自动切换。应用自动化运维管理平台控制端部署于运维管理人员的工作终端之上,管理员通过 控

9、制端访问服务器端,根据服务器端的授权管理自己权限范围内的业务系统,实现 自动化运维与业务系统监控信息的展现,实现对管理客户端的各种流程任务操作。2、多级架构适用于多级网络架构的部署,通过该模式,可以实现对多级机房、不同辖区服务器机群的统一管理。说明:自动化运维管理平台提供跨广域网、多网段分布式部署模式,实现对不同管理网络的逐 级管理,并保证数据备份恢复机制,确保形成统一的运维网络。各网段使用单一服务器实现对网段内各客户端应用的调度管理。各网段数据可以通过级联服务器实现对关键数据的上传保存及展示。服务器之间可以通过数据库提供的备份机制实现相互间的数据备份。 服务器间可以按照管理授权,实现跨网的操

10、作及监控。5自动运维应用功能5.1自动化流程操作建立统一应用自动化操控平台,实现对业务系统的各个业务操作的流程规范化、标准化 和自动化远程操控,将操作步骤固化在管控流程定义中,按照业务系统启动、关闭时间定时 自动完成对运维服务器、业务系统的操作、日终批量流程处理。能够按照日常工作要求提供 对应用流程自动化操作功能。 基于实时监控前提的自动化运维管理平台,确保自动化的执行流程安全、稳定、可 靠,确保流程的正确执行。 基于原子化、部件化的设计理念实现自动化流程的管理。流程执行是基于对不同机 器、应用的执行,而机器、应用的操作是基于其操作脚本。因此我们设计的执行对 象是机器、应用,再通过机器应用的操

11、作部件构造流程。系统既可以对机器、单个 应用进行自动化操作,也可以让不同机器、不同应用组合成不同流程进行操作; 支持各种主流操作系统平台,包括AIX、Linux、Windows环境下业务应用的管理。支持对Windows GUI、Bat、exe等作业调度,可抓取Windows标准控件文字信 息,具有屏幕截图功能。支持对Linux、unix进程调度,抓取启动、运行、关闭进 程的后台日志及标准输出,监控各类进程运行状况。 提供中文化脚本配置模式实现对应用的自动化控制,脚本配置方便、易用。同时也 支持开放式脚本、AUTOIT等脚本模式, 系统提供类visio的图形化流程设计器,可通过拖拽定义等可视化操

12、作。实现流程 配置,流程支持多分支,子流程嵌套功能,支持时序和依赖关系定义。对于每个流 程活动,支持即时执行和定时执行;允许用户配置超时处理方式,包括重复执行指 定次数、停止执行、继续执行下一个活动等。流程能够按时间日历进行任务调度分 批、关键流程执行提供审核授权。整个流程作业的执行过程需以可视化方式展现,运维人员可以清晰观察流程执行的 整个过程。系统提供远程实时登录浏览的模式,能够对执行流程故障进行快速人工 干预,确保远程操控的稳定、安全、可靠。5.2批量作业自动化实现批量作业的自动化调度,任务执行状态的监控,任务执行失败预警,并做好批量调 度的日志记录等功能。每天日终批量操作、事务数据收集

13、、每月批处理、月报制作等大量 的作业执行的按步骤的提醒,大大降低作业执行的错误和遗漏的发生,提高了银行对批量 作业执行的效率和对风险的可控制性。1、数据备份及日志管理统一调度: 实现各业务系统数据硬盘备份的批量调度,实现数据异地集中管理。 实现个系统日志的定期备份整理,并实现数据异地集中管理。2、日终批处理统一调度: 实现核心、前置、卡系统日结批量调度及执行监控。3、定时任务统一调度: 统筹调度管理各业务系统的定时任务,包括数据的批量卸载及装载。确保各系统的 待处理任务安全可靠的处理完毕。5.3自动巡检按照日常巡检习惯,根据定制的检查项进行监控检查,对于系统的运行状况,能够采集 关键系统的运行

14、指标,能够自动生成巡检记录及巡检报告,满足流程检查及巡检管理的需要, 实现巡检记录的电子化存档管理。自动巡检监控内容包括关键业务运行指标状态、目录是否可访问、文件是否存在及大小 时间、进程是否存在、程序界面文字及颜色、日志文件内容关键字搜索、数据库内容等。可 以通过组合多项检查内容,根据各项检查结果与预先设置的目标做比较(包含、等于、大于、 小于、介于)判定系统健康程度,自动生成巡检记录及巡检报告,并提供对巡检记录的实时 查询功能,实现对巡检日志的电子化。系统提供日历任务调度功能,支持按次、日、周、月、年等时间频率定时实现预定计划 的巡检任务安排;系统可以实现巡检事件与告警任务的关联,及时解决

15、巡检所发生的系统潜在风险,确保 系统的运行安全。5.4业务系统监控自动化运维管理平台提供多种采集手段,采集现有的业务系统运行指标,整合第三方监 控系统数据,在统一的监控平台中实现集中展示、集中报警。业务监控功能的实现包括了数据采集、数据分析、数据传输和平台管理四部分组成。系统支持对银行现有业务应用系统的各种形式的数据的采集,能够对日志文件、UNIX/LINUX 界面、windows界面、BS架构界面中的要素实现信息的采集、存储、发送。包括监控界面 上的文字、图片、颜色、声音,也可对数据库、数据文件进行数据采集。采集的数据支持数 据库或磁盘文件存放方式,在数据传输上支持主动推送或被动获取,实现对

16、监控指标快速集 成和展示。对数据采集频率、方式,传输时间点、报警阀值等能够提供配置方式,可灵活设 置。业务监控可以按照银行业务的分类,实现不同业务视图的实时监控。包括核心交易业务 系统、网上银行、信用卡业务、中间业务、呼叫中心、信贷管理等,系统对上述业务运行指 标进行实时采集,并与系统、网络等维度数据进行关联,真正实现以业务为视角审视IT系 统的整体运行状态;5.5应用配置及版本管理随着银行IT系统的规模越来越庞大,生产服务器及灾备服务器的数量在不断增多,行 业应用软件也不断地增加,软件版本和补丁不断地升级,在操作系统、数据库、应用软件版 本及配置方面,管理的难度也越来越大,如何有效地防止系统

17、管理人员或IT运行维护人员 对生产配置文件的误操作,以及发生误操作后的快速告警和补救措施,已成为IT生产运维 管理部门需要解决的迫切问题。自动化运维系统提供对应用配置及版本进行管理,可供IT管理部门及时准确把握各操 作系统的版本与配置的变化情况,跟踪应用软件版本与系统参数的变化情况,对操作系统及 应用系统的参数配置和版本进行有效控制与管理。 发现生产数据文件,包括系统文件和业务应用软件的任何数据文件是否被人修改, 并能在第一时间报警,详细记录了被修改的情况。 被关注的生产数据文件的属性一旦发生变化,包括增、删、改动作,及文件权限和 文件版本发生变化时,系统能自动将文件备份到指定的文件服务器上。

18、5.6容灾切换管理按照容灾能力的高低,目前数据容灾可分为多个层次,按国际标准SHARE 78定义的容 灾系统有七个层次:从最简单的仅在本地进行磁带备份,到将备份的磁带存储在异地,再到 10建立应用系统实时切换的异地备份系统;恢复时间也可以从几天到小时级再到分钟级、秒级 或0数据丢失等。无论是采用哪种容灾方案,数据备份还是最基础的,除数据备份外,容 灾切换管理非常重要。自动化运维系统的容灾切换管理主要包括应用的热备管理、生产与灾备中心的一致性管 理、容灾切换演习管理、容灾切换流程导航管理。期望能够从自动化、智能化容灾切换管理 的角度提升容灾切换的效率,进而从从业务连续能力、应用系统连续能力两方面

19、来保证业务 应用系统的正常运行。1、服务器应用热备管理系统同时提供对生产机房备机系统的管理,提供备机应用关系对照表,备机应用切换策 略,便于实现主备机的快速切换。避免出现单点故障。番智理M囱啪 冬曾机想理U明为1关田斓,主”ft*/圳嫩式F交删行帝二日竺 njitlff ziF ,L8 fl &3.】睥IB 9 B3.政俏主林苻机手动自程序V竺可J府四1LS 9 63.1B3*生产中心与灾备中心一致性管理容灾系统的维护和管理是容灾切换成功的重要保证,自动化运维系统提供了对生产系统 与灾备系统业务一致性的管理功能。生产中心任何业务处理过程的改变都必须完整地复制到 备份中心;所有新业务系统上线时,

20、必须通知备份中心,并在备份中心配置好数据同步机制; 对原程序的改动也必须保证两个中心同时上线。系统能够对生产中心与灾备中心所有应用文 件、配置文件的时间、大小、内容进行核查的功能,确保两中心系统的一致性。 容灾切换演习管理18 9 63.1 胡rhl* am吊nW有玉歧1L8以明IBm.WwklA蹒i行部19.9.2.11#此.9.巳口占俾主机点机手劫自程岸TI. - 1: : r L6 9.2. J51ipIB. 9. .152:圳二如孕腕,iLLiM/.is.g k. aaIB. 9.65.的:二至:脂.昨*T:LS/g.2.aafIB 9.W.52审Ab.- 士 1 点,;一王t.n A

21、mf LUUKL.:K.:r,吉主抽隹,改初瞄g 号为ig:剧忏目袖密号的、:.-:= 心自动曜挞,重寤行 1伺瞒强序壬:;日一|.-Lb.g.tsiQ1日.9.巳53#灵主机桐弟 蝴1尹为主瞄,小-与一,” 5 : *.、,二;,:.、.国庞行剽II粮艘岸容灾演习是对容灾项目建设是否成功的检验标准,也是对容灾维护管理流程和文档检测 的重要手段。通过演习可以及时发现问题,并确保各相关部门的配合和人员的操作准确无误。 本系统的容灾演习功能包括:切换步骤知识库、演习计划管理、演习流程管理、核查恢复规 划、制定回退计划、触发演习场景、执行恢复规划、总结报告、维护等。4、容灾切换流程导航管理容灾切换流程的建立也至关重要,容灾项目的实现过程是人员、流程、技术相辅相成的过程,容灾管理流程的建立是容灾系统成功运作的保证。通过建立固定化的、标准化的切换流程,指导维护人员按照实现规定的步骤进行系统切换和演习工作,才能保证容灾技术的最终实现为了顺利实现系统间的切换。系统提供按流程图展示切换步骤的驱动模式,实现整个切换流程的可视化管理,达到统一指挥、实时交互、有序传递的切换效果,确保切换流程的顺利开展。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号