《机房重要信息系统应急预案讲解.docx》由会员分享,可在线阅读,更多相关《机房重要信息系统应急预案讲解.docx(24页珍藏版)》请在三一办公上搜索。
1、XXXXX)计算机机房应急预案一、 适用条件1 适用范围本预案适用于 XXXXXX 计算机机房发生电力、火灾、空调故障和水浸等突发事件的应急处置工作。1 适用场景电力事件:由于机房电力不可用引发的应急事件。以机房为参照物:第一种情况:机房输入无电(大楼 突然停电;大楼有电,机房市电输入无电) ;第二种 情况:机房本身供配电故障。火灾事件:机房设施本身产生的火灾以及外部火灾威胁。空调故障:有机房空调故障引发的机房温度升高的应急事件。水浸事件:机房内部遭到水患,影响或破坏机房正常运行。二、应急处置流程机房突发事件处置总流程停电事件处置流程火灾事件处置流程空调事件处置流程水浸事件处置流程XXXXXX
2、通信网络应急预案、 适用条件1 适用范围本预案适用于 XXXXXX 通信网络类突发事件的应急处置工 作。2 场景描述1.网络拥塞事件发生网络通信故障, 或网络负载超过了可用资源, 出现数据 包丢失, 导致传输时延增大, 网络吞吐量下降甚至网络完全瘫痪 等现象, 造成核心信息体统或核心业务系统无法处理业务, 必须 采取应急处置措施,开展处置工作的突发事件。2.网络中断事件发生网络线路中断、 设备故障等事件, 导致通信网络系统部 分或全部中断,造成核心信息系统或核心业务系统无法处理业 务,必须采取应急处置措施开展处置工作的突发事件。、 应急处置流程1.通信网络突发事件处置总流程2.通信网络拥塞事件
3、处置流程启动拥塞事件处置流程领导小组事件 分析和定位1r1r1r其他故障设备故障攻击事件网络管理员提 供备品支持联系厂家维 修或者更换否是攻击源是否在本地进行设备替换领导小组联系中支科 技部负责人和数据中 心有关人员进行处置办公室联系攻击 源单位,应急小 组成员采取有效 措施领导小组成员 采取有效措施 拒绝攻击,联 系中支科技部门结束拥塞事件处置流程网络管理员外援机构线路运营商线路故障定位分析软件提供备品支持线路恢复服务2.通信网络拥塞事件处置流程启动中断事件处置流程应急小组 事件分析否内部线路否设备软件否设备硬件否外部通信故障故障故障线路故障7是是是T是 ”11f1F网络管理员网络管理员故障
4、原因系统集成商产外援机构维保商品厂商提供备品支持软件更新支持网络管理员网络管理员网络管理员内部线路恢复明确处置步骤设备替换中支科技科分析事件提 岀处置建议中支科技部门负责人指导处置工作领导小组成员明确处置步骤领导小组成员 开展处置工作结束中断事件处置流程XXXXX)计算机系统应急预案一、 适用条件1 适用范围本预案适用于 XXXXXX 计算机系统突发事件的应急处置工 作。2 场景描述1.系统崩溃事件 发生系统崩溃,出现蓝屏,无法启动,卡 XP 等情况造成无 法办公,必须采取应急处置措施,开展处置工作的突发事件。2.系统中毒事件 发生系统中毒或者木马入侵事件,导致系统速度变慢, IE 指向可疑,
5、软件无法使用,甚至杀毒软件无法使用情况时,必须 采取应急处置措施,开展处置工作的突发事件。二、 应急处置流程1、计算机系统处置流程2.系统崩溃处置流程3、系统中毒处置流程16XXXXXX信息科技系统应急操作手册1、主线路故障:故障现象: 联通协议转换器故障灯报警。故障解决方法:联通和电信两条 2M SDH 线路,联通线路为主线,电 信线路为备线,当线路发生故障时在协议转换器上会出现告 警信号,如 AIS 灯为红色等信息。主线路发生故障时,备用 的电信线路会自动切换为主线路,代替联通线路。在发现故 障后及时上报领导及通知联通大客户经理进行故障解决。2、OA 线路故障故障现象:访问数据中心 OA
6、协同办公系统速度突然变慢或无法连 接。故障解决方法: 当线路出现故障时系统访问速度变慢,通过查看设备状 态指示灯判断线路是否故障,及时通知联通客户经理及数据 中心网络中心,联调解决问题。3、外联线路故障故障现象:相对应的业务无法进行, 如:无法登录人行 FTP 服务器, 无法登录银监局 1104 报表系统等。故障解决方法: 我行现外联单位主要有人民银行、银监局。当线路出现 故障时,应与运营商及时联系,并通知相关使用部门。4、与数据中心连接相关设备故障 故障现象:支行所有柜员终端无法登录,数据中心服务 器无法访问可能出现故障的设备及处理方法:(1)锐捷路由器故障: 首先检查锐捷路由器,查看是否有
7、掉电现象,如果没有 掉电则查看路由器是否出现硬件故障, (如查看路由器后面的 接口卡的状态灯的颜色, 红色为故障, 绿色为正常 )。如果无 法在短时间内修复则立刻启用备用路由器代替原路由器,将 V35 线缆与内网以太口网线正确接好后开机即可(注:备用 路由器配置已经提前配好,与主路由器配置完全相同) 。( 2 )核心交换机故障: 检查生产网交换机,有无断电情况,如果断电将电源重 新接好。然后对交换机使用 PING 命令, PING 网关地址, 如果不通,则表示交换机自身故障或配置出现故障,此时立 刻更换备用交换机。具体操作步骤如下: 温备设备切换:将主交换机上的所有连接线依次插拔 到备用交换机
8、上,连接完成后使用 PING 命令, PING 数据 中心对端地址。查看是否可以 PING 通,如果 PING 通,则 问题解决。使用 quit 命令退出系统。 冷备设备切换: 首先使用 CONSOLE 连接到备用交换 机,进入交换机后首先使用 dis cu 命令查看交换机是否有配 置,输入 sys 命令,在提示符为 shengchan-sw 状态下, 直接导入配置信息, 使用 save 命令进行存盘。 测试是否 ping 通数据中心端地址。如果 PING 通则故障排除。 冷备设备无法启动: 使用替代设备替换, 使用命令 del config.cfg 删除交换机中的配置信息,并重启交换机,然后
9、 再将备份配置信息导入设备的操作。使用 ping 命令测试数 据中心对端地址。如果 PING 通则故障排除。(3)前置服务器故障: 直接更换备用服务器,更换后查看服务器的状态是否正常, 如光路诊断器是否有报警,硬盘灯是什么颜色,红色代表故 障,绿色代表正常。 IP 地址是否与原生产设备配置相同,测 试业务是否正常处理,如能正常办理,说明恢复成功。(4)生产路由器故障:对路由器进行检查, 使用内网计算机, ping 数据中心 对 端地址。如果 PING 通则表示线路及广域网路由设备没有问 题,如果不通则表示广域网路由设备出现故障,更换备机并 测试是否联通。并与数据中心网络中心联系。5)外连设备故
10、障 故障现象:人民银行或银监局 ftp 服务器无法访问 可能出现故障的设备及处理方法: 外联路由器故障:大小额前置服务器无法正常工作,ping 人民银行对端地址, 如果不通则有两种可能, 一为对端 设备故障,此时应与人民银行及时联系,二为线路故障,应 立刻将路由器以太口接到备用路由器上,再使用 PING 对端 的备用线路地址,如果 PING 通表示线路正常,如果仍无法 访问,则立刻上报领导及人民银行。其它类似故障处理方法 参照此方法。 防火墙故障:当主防火墙出现故障时银监局及人民银 行的网站或 FTP 无法访问, 将线路连接到备用防火墙上, 测 试是否连通,连通则故障解决。如果经过以上处理故障
11、仍然存在,则立刻联系人民银行 及银监局相关业务部门,询问是否是对方服务器故障。上报 行领导及数据中心科技部,并与对方单位人员保持联系,直 至故障解决。(6)外网设备故障故障现象: NOTES 及 SameTime 办公软件无法登录, 所有外网网站无法打开。可能出现故障的设备及处理方法:外网 H3C 交换机故障:将线路切换到备用交换机上, 并使用 console 线连接到电脑, 使用超级终端对其进行配置检查,如配置正常则再将原有网线全部连接到备用交换机 上。数据中心服务器故障:数据中心服务器改造或升级引 起的暂时无法连接,应立刻与数据中心沟通,确认故障解决 时间,并上报相关领导。( 7)大小额支
12、付系统硬盘故障: 当单块硬盘故障时,主机面板会报警,硬盘灯会闪烁, 机器会自动切换到备份硬盘上,此时做好切换到备用服务器 的准备,联系设备供应商,反馈硬件故障信息,尽快排除故 障,若需要更换硬盘则尽快联系生产商进行调换工作。并及 时向主管领导汇报故障信息和故障处理进度。( 8)前置机软件系统故障: 检查前置备份应用程序与数据中心最新发布程序是否 一致,如不一致则更新数据中心最新程序包文件,更新后测 试业务是否正常,业务正常则故障排除。如发现其他问题, 则判断是否 SCOUNIX 操作系统问题, 如发现操作系统问题, 则将备机替换到生产环境。核对更新包是否数据中心发布最 新版本,是最新版本则通知
13、业务部门测试业务是否正常。并 及时向主管领导及数据中心汇报故障处理进度。( 9 )其它故障现象及解决方案:交易不能正常处理:1、业务终端不能正常登陆:检测终端与前置机之间的线路物理连接是否正常,若线 路没有问题则尝试换一下故障终端的辫子插孔,重启终端, 看是否排除故障;若仍存在故障,可尝试重启联结终端的锐 捷路由器;如果是营业部及所有支行终端全部故障,首先查 看前置服务器运行状态,看是否能否 PING 通,若前置机工 作正常, 则往数据中心汇报, 咨询数据中心服务器运行状况, 判断是否是全行故障,如果是全行故障,在数据中心数据中 心指导下排除。如果是我行前置机故障,参考前置机服务器 故障及前置
14、机软件故障解决。另外在排除故障过程中可以使 用杀毒软件,检测生产网络是否存在 ARP 等攻击病毒,导 致丢失正确的网关地址。如是病毒导致,则立即切断收病毒 侵害的计算机网络。如果是前置机系统故障,在短时间内无 法解决,刚立即切换到备用前置机,切换成功后通知各支行 系统管理员重启支行机房内的生产网路由器,并进行终端的 业务测试,测试完成后整理问题出现原因,并向上级领导进 行汇报。2 、密押服务器故障: 密押服务器目前采取热备方式, 当主设备故障时,密押服务器会自动切换到备用设备。通过 密押服务器前面板灯观察设备运转状态,若系统灯或告警灯 闪烁则说明设备出现故障, 使用 ROOT 用户登陆大小额前
15、置 机使用 vi 命令查看 /SJL10_TCTD 目录下的 host_cfg.dat 文 件,查看配置文件中备用服务器的 ip 地址,如果备用 IP 在 前面,说明密押服务器已切换到备机运行,使用 PING 命令 检查主密押服务器的线路是否联通,如果是线路故障,检查 物理连接是否正常,如果是系统故障,在非营业时间,重启 主密押服务器并再次检查线路。在线路正常状态下,运行支 付系统前置机 /SJL10_TCTD 目录下 testPIN_clnt 程序,若 返回 return_code=0, 说明设备运转恢复正常。断开备用密 押服务器线路,运行大小额前置机/SJL10目录下的 testMAC_c
16、lnt 程序,检查配置文件 host_cfg.dat 是否恢复 初始设置,然后恢复备用机的网线。如果还有故障,则需要 联系密押服务器的售后服务支持进行维修工作,并及时向主 管领导汇报故障信息以及处理进度。3、黑客攻击应急处置 发现网络或系统异常,由事业保障部网络管理员和系统维护人员进行检测,查明异常原因,确认为黑客攻击的,经 应急领导小组批准,切断攻击源的网络连接,迅速向数据中 心级公安部门报告。4、停电故障应急处理营业网点停电后由 UPS 电池供电,应关闭与业务无关的 各类办公设备,立即与供电部门联系电力恢复事宜,确信停 电时间超过电池供电时间后,应准备好发电机,随时准备启 动使用,并检查汽
17、油存量,如不能满足发现需要,应立即购 买添加。5、防火应急处置机房发现异味(糊味) 、烟雾和初始火情,应根据警报 情况进行检查,同时立即向行领导报告。机房管理人员在发 现起火点时应立即利用火场手持气体灭火器进行扑救。在接 到火警报告后事业保障部负责人和本行应急领导小组相关 人员应尽快到达现场,组织灭火。对手持气体灭火器无法控 制的火情,应立即切断所有电源,人员迅速撤离机房后,向 “119 ”报警。在条件允许情况下,首先抢救重要数据备份 信息,同时立即向数据中心报告火灾情况。遭遇严重火情、 需紧急疏散时,组织机房内员工,从消防通道立即撤离火灾 区域;发生爆炸事件或突发电气大火等紧急情况下,可先组 织疏散再向上级报告。火灾发生后,事业保障部负责人和本 行应急领导小组相关人员负责组织保护现场,未经公安消防 机关同意, 无关人员不得进入现场。 经公安消防机关同意后, 事业保障部组织力量尽快恢复计算机系统,具备条件后经主 管行领导批准,可恢复正常运行。