彩信业务平台应急指导书.docx

上传人:李司机 文档编号:5201597 上传时间:2023-06-13 格式:DOCX 页数:24 大小:81.44KB
返回 下载 相关 举报
彩信业务平台应急指导书.docx_第1页
第1页 / 共24页
彩信业务平台应急指导书.docx_第2页
第2页 / 共24页
彩信业务平台应急指导书.docx_第3页
第3页 / 共24页
彩信业务平台应急指导书.docx_第4页
第4页 / 共24页
彩信业务平台应急指导书.docx_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《彩信业务平台应急指导书.docx》由会员分享,可在线阅读,更多相关《彩信业务平台应急指导书.docx(24页珍藏版)》请在三一办公上搜索。

1、彩信业务平台应急指导书中国电信系统集成有限责任公司内蒙古分公司2010年08月目录2第1章目的3第2章使用对象3第3章适用场合3第4章应急处理流程说明34.1 紧急情况界定34.2 应急措施及应急流程4第5章常见故障及应急处理篇55.1 硬件故障篇65.1.1 电源故障65.1.2 防火墙、交换机故障65.1.3 路由器故障65.1.4 超级彩信平台服务器硬件故障65.2 软件故障篇225.2.1 超级彩信平台程序软件故障225.2.2 超级彩信平台数据库软件故障23第6章预警处理篇236.1 CPU过负荷预警处理236.2 内存预警处理236.3 磁盘空间预警处理236.4 超级彩信平台程序

2、故障预警处理236.5 超级彩信平台数据库故障预警处理23第7章应急资源配备23第1章目的为保证公司业务的正常运行,避免与减少公司各服务器出现严重问题,在出现问题时能根据本方案及往常的备份资料迅速及时恢复系统的正常运行;保证公司数据的完整性,并可随时恢复;减少故障对公司的缺失。为了规范项目,便于保护人员在紧急情况下对硬件及软件的常见问题做出及时的推断与分析,特编写业务平台的应急预案书。第2章使用对象项目保护人员第3章适用场合网络安全漏洞造成数据被恶意攻击破坏,未使用容灾方案,数据在外界灾害中被破坏,用户硬件故障造成的数据缺失,电力实效。第4章应急处理流程说明4.1 紧急情况界定发生电力故障时第

3、一时间保证重要服务器、路由器及交换机的电源,关掉业务不是很重要的服务器,这样能够在断电时保证网络的基本运行,确保各分公司正常连接办公网、有关业务系统基本不受影响0并询问人事部故障处理时间,假如断电时间超出UPS使用时间,可通知各部UPS电源可待机时间。在UPS电源只够支撑半个小时的时候,电话通知各部做好文档储存工作,一线营业部门做好手工记帐准备,服务将在15分钟后中断。确定各部做好储存工作后将各组服务器关机,等待电力恢复。电力恢复后,将各服务器与网络设备开机,检查各组服务器与网络运行情况,发现故障及时跟进处理,确认运行正常后,电话各部通知服务己恢复正常运行。恢复后将结果报知部门经理并做好有关记

4、录。执行麻统恢复4.2 应急措施及应急流程硬件故障应急流程:当发生硬件故障时第一时间分析故障原因,用排除法找到故障原因.假如是内存、硬盘、电源故障可及时使用备用零件替换.假如是CPU、主板可用备用服务器顶替,以确保服务不中断。假如当值人员无法排除故障,可向本部同事请求技术支持并向本部经理汇报情况,由经理统一协调。发生故障同时电话通知有关业务部门,告知故障原因、处理时间,故障处理结束后电话通知使用部门与部门经理告知处理结果。并将处理结果在服务重视大事件处理登记表做好记录。软件故障应急流程:当发生软件故障时第一时间分析故障原因,当系统出现崩溃时,可通过系统GHOST备份还原系统。(系统GHoST在

5、本机与文件服务器都做了备份)。当系统中病毒时,可进入安全模式查杀病毒与木马,安全模式无法进入的话可将硬盘外挂到另一台电脑进行查杀。当服务器数据库损坏后,可及时通过SQL恢复本机的备份数据。(数据库在本机与磁带机都有备份)。假如当值人员无法排除故障,可向本部同事请求技术支持并向本部经理汇报情况,由经理统一协调。发生故障同时电话通知有关业务部门,告知故障原因、处理时间,故障处理结束后电话通知使用部门与部门经理告知处理结果。并将处理结果在服务重视大事件处理登记表做好记录。人为及自然损坏应急方案:当发生人为及自然损坏时,第一时间通知部门经理由经理统一协调,发生服务器被盗与暴力破坏服务器时,可选择报警,

6、追究破坏者刑事责任,从其它公司部门借调服务器,重新恢复有关数据。当发生数据被盗时,查看监控录像或者服务器日志。报警追究刑事责任。发生不可抗力服务器自然损坏时,从其它公司部门借调服务器,重新恢复有关数据。并将处理结果在服务重视大事件处理登记表做好记录。第5章常见故障及应急处理篇本篇要紧介绍在日常保护及应急处理中的一些常见硬件及软件故障,指导有关超大彩信平台保护人员掌握H常应急处理方法及流程。5.1 硬件故障篇本篇要紧介绍在日常保护及应急处理中的一些常见硬件故障,指导有关超大彩信平台保护人员掌握日常应急处理方法及流程。5.1.1 电源故障电源指示灯报警,正常状态为绿色,报警状态为红色,建议联系供应

7、商更换电源。5.1.2 防火墙、交换机故障防火墙、交换机故障会导致与各个外部实体网源连接中断,同时,也会导致超大彩信平台数据库与业务进程之间的通讯中断,导致程序特殊,业务全阻。5.1.3 路由器故障5.1.4 超大彩信平台服务器硬件故障5l4l服务器故障常见问题安全第一一为您与您的系统着想A小心:许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或者按照在线或者电话服务与支持团队的指导,执行故障排除与简单的维修工作。由于未经Dell授权的维修所造成的损坏不包含在保修范围内。请阅读并按照产品附带的安全说明进行操作。系统启动失败故障排除在启动过程中,假如系统在出现视频图像或

8、者LCD消息之前停机,特别是在安装操作系统或者重新配置系统硬件之后发生这种故障,请检查下列情况。外部连接故障排除视频子系统故障排除检查显示器与系统与电源的连接。检查系统到显示器之间的视频接口连线。假如系统连接了两台显示器,请断开其中一台的连接。系统仅支持将台显示器连接到前面板或者背面板视频连接器。请尝试使用已知可正常工作的显示器。假如检测程序运行成功,则问题与视频硬件无关。USB设备故障排除从系统中暂时拆除键盘与鼠标电缆,然后再重新连接。将键盘/鼠标连接至系统另一面的USB端口。假如问题得以解决,请重新启动系统,进入系统设置程序,检查是否己启用不工作的USB端口。将此键盘/鼠标更换为其它可正常

9、工作的键盘/鼠标。假如问题得以解决,请更换有故障的键盘/鼠标。假如问题仍然存在,请继续执行下一步骤,开始对与系统相连的其它USB设备进行故障排除。关闭所有连接的USB设备,断开它们与系统的连接。假如键盘不能正常工作,还能够使用远程访问。重新连接,每次打开一个USB设备的电源。假如某一设备造成同一问题,请关闭该设备的电源,更换USB电缆,然后再打开该设备的电源。假如问题仍然存在,请更换此设备。串行I/O设备故障排除关闭系统与所有连接的外围设备,并断开系统与电源插座的连接。将串行接口电缆更换为另一条可正常工作的电缆,并打开系统与串行设备。假如问题得以解决,则请更换接口电缆。关闭系统与串行设备,将该

10、设备更换为同类设备。打开系统与串行设备。假如问题得以解决,请更换串行设备。NIC故障排除重新启动系统,并检查与NIC操纵器有关的任何系统信息。假如链路指示灯不亮,请检查所有电缆的连接。假如活动指示灯不亮,则网络驱动程序文件可能已损坏或者丢失。使用交换机或者集线器上的另一个连接器。假如使用的是NIC卡而非嵌入式NIC,请参阅NIC卡的说明文件。确保安装了相应的驱动程序并捆绑了协议。请参阅NIC的说明文件。确保将网络上的NIC、集线器与交换机设置为相同数据传输速率与双工。请参阅每个网络设备的说明文件。确保所有网络电缆的类型无误,同时未超出最大长度限制。受潮系统故障排除A小心:许多维修工作只能由获得

11、认证的服务技术人员来完成。您只应按照产品文档中的授权或者按照在线或者电话服务与支持团队的指导,执行故障排除与简单的维修工作。由于未经Deli授权的维修所造成的损坏不包含在保修范围内。请阅读并按照产品附带的安全说明进行操作。关闭系统与连接的外围设备,并断开系统与电源插座的连接。冷却导流罩硬盘驱动器SD卡USB存储钥匙NIC硬件卡锁内部SD模块扩充卡与两个扩充卡提升板集成存储操纵器iDRAC6Enterprise卡电源设备处理器与散热器内存模块风扇支架使系统完全干燥至少24小时。重新安装处理器与散热器、内存模块、电源设备、冷却导流罩与风扇支架。将系统重新连接至电源插座,然后开机。受损系统故障排除A

12、小心:许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或者按照在线或者电话服务与支持团队的指导,执行故障排除与简单的维修工作。由于未经Dell授权的维修所造成的损坏不包含在保修范围内。请阅读并按照产品附带的安全说明进行操作。关闭系统与连接的外围设备,并断开系统与电源插座的连接。确保已正确安装下列组件:扩充卡与两个扩充卡提升板电源设备风扇与冷却导流罩处理器与散热器内存模块硬盘驱动器托盘确保所有电缆均已正确连接。系统电池故障排除关闭系统并断开系统与电源插座的连接,然后至少等待一小时。将系统重新连接至电源插座,并打开系统。进入系统设置程序。小心:许多维修工作只能由获得认证的

13、服务技术人员来完成。您只应按照产品文档中的授权或者按照在线或者电话服务与支持团队的指导,执行故隙排除与简单的维修工作。由于未经Dell授权的维修所造成的损坏不包含在保修范围内。请阅读并按照产品附带的安全说明进行操作。对电源设备进行故隙排除小心:要使系统运行,务必至少安装一个电源设备。仅使用安装的一个电源设备长时间运行系统,而且PS2电源设备托架中并没有安装电源设备挡片,则可能导致系统过热。小心:假如对电源设备不匹配错误进行故障排除,请仅更换指示灯闪烁的电源设备。假如更换另一电源设备来形成匹配电源对,则可能导致故障状态与系统意外关机。要从高输出“配置更换为“能量智能”配置或者进行反向更换,则务必

14、关闭系统电源。吃注:安装完电源设备后,请等待几秒钟,以便系统识别电源设备并确定其是否能够正常工作。状态指示灯呈绿色亮起,表示电源设备能够正常工作。假如问题仍然存在,请用相同类型的电源设备更换故障电源设备。系统冷却问题故障排除小心:许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或者按照在线或者电话服务与支持团队的指导,执行故障排除与简单的维修工作。由于未经Dell授权的维修所造成的损坏不包含在保修范围内。请阅读并按照产品附带的安全说明进行操作。确保不存在下列情况:卸下了系统护盖、冷却导流罩、驱动器挡片、电源设备挡片(在单电源设备配置中)或者前后填充面板。在单处理器配置

15、中卸下了FAN5挡片或者散热器挡片,环境温度太高,关于系统的工作温度要求,请参阅使用入门指南。外部通风受阻。系统内部电缆妨碍了通风。风扇故障排除A小心:许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或者按照在线或者电话服务与支持团队的指导,执行故障排除与简单的维修工作。由于未经Dell授权的维修所造成的损坏不包含在保修范围内。请阅读并按照产品附带的安全说明进行操作。小心:所有冷却风扇均可热插拔。要在系统运行时保持正常的冷却效果,请每次仅更换一个风扇。根据LCD面板或者诊断软件的指示找到出现故障的风扇。匕注:等待至少30秒钟,以便系统识别风扇并确定风扇是否正常工作。假

16、如问题仍未解决,请安装新的风扇。系统内存故障排除小心:许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或者按照在线或者电话服务与支持团队的指导,执行故障排除与简单的维修工作。由于未经Dell授权的维修所造成的损坏不包含在保修范围内。请阅读并按照产品附带的安全说明进行操作。假如诊断程序指示出现故障,请按照诊断程序提供的更正措施进行操作。假如系统无法运行,请关闭系统与连接的外围设备,并断开系统与电源的连接。等待至少IO秒钟,然后将系统重新连接至电源。打开系统及连接的外围设备,并留意屏幕或者LCD面板上的消息。关闭系统与连接的外围设备,并断开系统与电源插座的连接。将系统重新

17、连接至电源插座,并打开系统与连接的外围设备。假如问题未解决,请继续执行下一步。关闭系统与连接的外围设备,并断开系统与电源的连接。假如诊断检测程序或者错误信息指示特定内存模块出现故障,请更换该模块。将系统重新连接至电源插座,并打开系统与连接的外围设备。在系统进行引导时,注意观察屏幕上或者系统正面LCD面板上显示的所有错误信息。内部SD卡故障排除小心:许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或者按照在线或者电话服务与支持团队的指导,执行故障排除与简单的维修工作。由于未经Dell授权的维修所造成的损坏不包含在保修范围内。请阅读并按照产品附带的安全说明进行操作。关闭系

18、统与所有连接的外围设备,并断开系统与电源插座的连接。打开系统与连接的外围设备,并检查SD卡是否运行正常。插入已知可正常工作的其它SD卡。打开系统与连接的外围设备,并检查SD卡是否运行正常。A小心:许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或者按照在线或者电话服务与支持团队的指导,执行故障排除与简单的维修工作。由于未经Dell授权的维修所造成的损坏不包含在保修范围内。请阅读并按照产品附带的安全说明进行操作。关闭系统与所有连接的外围设备,并断开系统与电源插座的连接。打开系统与连接的外围设备,并检查USB钥匙是否运行正常。插入己知能正常工作的其它USB钥匙。打开系统与

19、连接的外围设备,并检查USB钥匙是否运行正常。光盘驱动器故障排除小心:许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或者按照在线或者电话服务与支持团队的指导,执行故隙排除与简单的维修工作。由于未经Den授权的维修所造成的损坏不包含在保修范围内。请阅读并按照产品附带的安全说明进行操作。尝试使用其它DVDo确保已正确安装与配置光盘驱动器的设备驱动程序。关闭系统与连接的外围设备,并断开系统与电源插座的连接。确保电源电缆已正确地连接至驱动器与系统板。将系统重新连接至电源插座,并打开系统与连接的外围设备。磁带备份装置故障排除小心:许多维修工作只能由获得认证的服务技术人员来完成

20、。您只应按照产品文档中的授权或者按照在线或者电话服务与支持团队的指导,执行故障排除与简单的维修工作。由于未经Dell授权的维修所造成的损坏不包含在保修范围内。请阅读并按照产品附带的安全说明进行操作。尝试使用其它盒式磁带。确保已正确安装与配置磁带驱动器的设备驱动程序。请参阅磁带备份装置说明文件,熟悉有关设备驱动程序的全面信息。按照磁带备份软件说明文件中的说明重新安装磁带备份软件。关于外部磁带备份装置,请确保接口电缆完全连接至磁带设备与操纵器卡上的外部端口。关于SCSI磁带备份装置,请验证是否为磁带设备配置了唯的SCSIID号,与接口电缆是否已正确终止。请参阅磁带备份装置的说明文件,熟悉有关如何选

21、择SCSIID号与如何终止SCSI电缆的说明。关闭系统与连接的外围设备,并断开系统与电源插座的连接。检查内部电缆与操纵器连接。关于SCSI磁带设备,请重置扩充卡插槽中的SCSl操纵器卡,并确保接口电缆牢固地连接至SCSI连接器。关于SATA磁带设备,请重置与系统板SATA连接器相连的接口电缆。确保电源电缆已正确地连接至驱动器与系统板。将系统重新连接至电源插座,并打开系统与连接的外围设备。假如问题仍未解决,请参阅磁带驱动器说明文件以获得其它故障排除指导。硬盘驱动器故障排除小心:许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或者按照在线或者电话服务与支持团队的指导,执行

22、故障排除与简单的维修工作。由于未经Dell授权的维修所造成的损坏不包含在保修范围内。请阅读并按照产品附带的安全说明进行操作。A小心:此故障排除步骤可能会破坏硬盘驱动器上存储的数据。进行故隙排除之前,请备份硬盘驱动器上存储的所有文件。根据诊断检测程序的结果,按需要继续执行下列步骤。假如已在RAID阵列中配置硬盘驱动器,请执行下列步骤。重新启动系统,并进入主机适配器配置公用程序,关于PERC操纵器,请按VCtI1,关于SAS操纵器,则按O有关配置公用程序的信息,请参阅主机适配器附带的说明文件。确保已正确配置RAID阵列的硬盘驱动器。退出配置公用程序并同意系统引导至操作系统。确保已正确安装与配置操纵

23、器卡所需的设备驱动程序。有关详情,请参阅操作系统说明文件。匕注:对SAS或者PERC操纵器进行故障排除时,另请参阅操作系统与操纵器的说明文件。重新启动系统并按住相应的按犍组合进入配置公用程序:组合键,用于SAS操纵器组合键,用于PERC操纵器有关配置设置的信息,请参阅操纵器的说明文件。检查配置设置,进行必要的更正,然后重新启动系统。A小心:许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或者按照在线或者电话服务与支持团队的指导,执行故隙排除与简单的维修工作。由于未经Dell授权的维修所造成的损坏不包含在保修范围内。请阅读并按照产品附带的安全说明进行操作。关闭系统与连接

24、的外围设备,并断开系统与电源插座的连接。假如使用电池缓存PERC操纵器,请确保RAID电池已正确连接且PERC卡上的内存模块已正确就位(假如可用)。确保电缆已牢固地连接至存储操纵器与SAS背板。将系统重新连接至电源插座,并打开系统与连接的外围设备。扩充卡故障排除小心:许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或者按照在线或者电话服务与支持团队的指导,执行故障排除与简单的维修工作。由于未经Dell授权的维修所造成的损坏不包含在保修范围内。请阅读并按照产品附带的安全说明进行操作。匕注:进行扩充卡故障排除时,请参阅操作系统与扩充卡的说明文件。关闭系统与连接的外围设备,

25、并断开系统与电源插座的连接。将系统重新连接至电源插座,并打开系统与连接的外围设备。关闭系统与连接的外围设备,并断开系统与电源插座的连接。将系统重新连接至电源插座,并打开系统与连接的外围设备。运行相应的联机诊断检测程序。关闭系统与连接的外围设备,并断开系统与电源插座的连接。重新安装其中一个扩充卡。运行相应的诊断检测程序。处理器故障排除小心:许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或者按照在线或者电话服务与支持团队的指导,执行故障排除与简单的维修工作。由于未经Dell授权的维修所造成的损坏不包含在保修范围内。请阅读并按照产品附带的安全说明进行操作。关闭系统与连接的

26、外围设备,并断开系统与电源插座的连接。将系统重新连接至电源插座,并打开系统与连接的外围设备。运行相应的联机诊断检测程序。关于有多个处理器的系统,关闭系统与连接的外围设备,并断开系统与电源插座的连接。A小心:卸下处理器时,请注意不要碰弯ZIF插槽上的任何插针。碰弯插针会对系统板造成永久损坏。将系统重新连接至电源插座,并打开系统与连接的外围设备。运行相应的联机诊断检测程序。关闭系统与连接的外围设备,并断开系统与电源插座的连接。5.1.4.2MD3000存储故障常见问题5.2 安全第一一为您与您的存储设备着想要执行本说明文件中的某些步骤,务必拆装存储设备内部组件。拆装存储设备内部组件时,请勿尝试执行

27、维修操作,除非本指南与说明文件中有所说明。A警告:只有通过培训的维修技术人员才能卸下存储设备护盖并拆装存储设备的任何内部组件。执行任何步骤之前,请参阅产品信息指南,以获取有关安全预防措施、拆装存储设备内部组件与防止静电损害的全面信息。5.3 启动例行程序表5-1.启动例行程序期间的现象观察/倾听:操作警报信息。请参阅存储管理说明文件。访问物理磁盘时听到的特殊、持续刮擦声或者摩擦声。匕注:存储设备中务必至少安装两个物理磁盘。5.4 排除外部连接故障5.5 排除受潮存储设备的故障问题液体洒落在存储设备上。湿度过大。操作A警告:只有通过培训的维修技术人员才能卸下存储设备护盖并拆装存储设备的任何内部组

28、件。执行任何步骤之前,请参阅产品信息指南,以获取有关安全预防措施、拆装存储设备内部组件与防止静电损害的全面信息。1.关闭存储设备电源并断开所有电源连接。6 .使存储设备完全干燥至少24小时。7 .重新安装前面步骤中卸下的所有组件。8 .将存储设备重新连接至电源插座,然后打开存储设备电源。5.6排除受损存储设备的故障问题存储设备跌落或者损坏。操作A警告:只有通过培训的维修技术人员才能卸下存储设备护盖并拆装存储设备的任何内部组件。执行任何步骤之前,请参阅产品信息指南,以获取有关安全预防措施、拆装存储设备内部组件与防止静电损害的全面信息。1 .确保已正确安装下列组件: 所有物理磁盘(位于各自托盘中并

29、连接至存储设备中间板) 电源设备/冷却风扇模块 RAID操纵器模块 存储设备中间板确保所有电缆均己正确连接同时连接器中没有弯曲的插针。5.7排除电源设备故障问题存储设备状态指示灯指示设备存在问题。电源设备故障指示灯亮起。操作A警告:只有通过培训的维修技术人员才能卸下存储设备护盖并拆装存储设备的任何内部组件。执行任何步骤之前,请参阅产品信息指南,以获取有关安全预防措施、拆装存储设备内部组件与防止静电损害的全面信息。2 .关闭存储设备与连接的外围设备的电源,然后断开存储设备与电源插座的连接。3 .找到故障电源设备。O注意:电源设备/冷却风扇模块支持热插拔。存储设备能够靠一个工作的电源设备运行;但是

30、,两个模块都务必安装,以确保正常冷却。假如一个电源设备/冷却风扇模块工作正常,则能够将另一个模块从存储设备中卸下,但时间不能超过5分钟。5分钟之后,存储设备将会过热并可能导致自动导热关闭。匕注:安装完电源设备后,请等待几秒钟,以便存储设备识别电源设备并确定其是否能够正常工作。5.假如问题得以解决,跳过此过程的其余部分。5.8排除存储设备冷却故障问题系统管理软件发出与风扇有关的错误信息。操作确保不存在下列情况:环境温度太高。外部通风受阻。5.8.1排除风扇故障问题 存储设备状态指示灯呈琥珀色。 系统管理软件发出与风扇有关的错误信息。 风扇状态指示灯说明风扇出现故障。操作A警告:只有通过培训的维修

31、技术人员才能卸下存储设备护盖并拆装存储设备的任何内部组件。执行任何步骤之前,请参阅产品信息指南,以获取有关安全预防措施、拆装存储设备内部组件与防止静电损害的全面信息。A警告:冷却风扇均可热插拔。要在系统运行时保持正常的冷却效果,请每次仅更换一个风扇。1 .找到故障风扇。2 .确保出现故障的电源设备/冷却风扇模块已正确连接至存储设备中间板。5.9排除SAS物理磁盘故障A警告:只有通过培训的维修技术人员才能卸下存储设备护盖并拆装存储设备的任何内部组件。执行任何步骤之前,请参阅产品信息指南,以获取有关安全预防措施、拆装存储设备内部组件与防止静电损害的全面信息。O注意:此过程可能会破坏物理磁盘上存储的

32、数据。继续进行之前,请备份磁盘上的所有文件。问题MDStorageManager中找不到某个物理磁盘。操作2.检查物理磁盘与中间板连接器是否有明显损坏。问题物理磁盘状态LED呈琥珀色闪烁。操作1.查看MDStorageManager以找到可能的恢复措施。匕注:假如系统正在重建物理磁盘,请等待重建完成。3.检查磁盘与中间板连接器是否有明显损坏。问题MDStorageManager中找不到多个物理磁盘。操作3.假如重置了电缆,请重新引导主机服务器。5.10排除存储设备连接故障问题连接的主机操纵器找不到存储设备。操作某些事件会导致RAID操纵器模块出现故障与/或者关闭。不可恢复的ECC内存错误或者P

33、CI错误或者严重的物理条件会导致锁定。假如RAID存储阵列配置为用于冗余访问与高速缓存镜像,则未出现故障的操纵器能够正常恢复而不可能丢失数据或者关闭。下列各节全面介绍了典型的硬操纵器故障。5.11.1 无效的存储设备仅Dell支持的存储设备支持RAID操纵器模块。在存储设备中安装时,操纵器将执行一组验证检查。RAID操纵器模块完成这些初始检测且操纵器正常工作后,存储设备状态LED将呈蓝色稳固亮起。假如RAID操纵器模块检测到非Dell支持的存储设备,则操纵器将放弃启动。假如存在无效的存储设备,RAID操纵器模块不可能生成任何事件来向您发出警报,但是存储设备状态LED将呈琥珀色闪烁以说明故障状态

34、。5.11.2 ECC错误不管RAID操纵器模块处于冗余配置还是非冗余配置,RAID操纵器固件均能够检测到ECC错误,并能够从单位ECC错误中恢复。由于同级RAID操纵器模块能够接管(假如有必要),因此配有冗余操纵器的存储阵列也能够从多位ECC错误中恢复。假如RAID操纵器模块遇到最多10个单位错误或者最多三个多位错误,它将会进行故障时转移。5.11.3 PCI错误当RAID操纵器模块配置为用于冗余时,存储设备固件能够检测到并仅从PCI错误中恢复。假如虚拟磁盘使用高速缓存镜像,则该虚拟磁盘将故障时转移至同级RAID操纵器模块,这表示对恶劣高速缓存进行的刷新。5.11.4 严重条件假如RAID操

35、纵器模块检测到可能导致存储设备立即出现故障与/或者数据丢失的严重情况,则存储阵列将生成严重事件。假如出现下列情况之一,则存储阵列处于严重情况: 多个风扇出现故障 任意背板温度传感器均处于临界范围 背板/电源设备出现故障两个或者多个温度传感器不可读没有检测到或者不能与双工配置中的同级进行通信匕注:假如两个RAID操纵器模块同时出现故障,存储设备将无法发出关于任何存储设备组件的严重事件警报或者非严重事件警报。存储设备处于严重情况下时,它的存储设备状态LED将呈琥珀色闪烁。5.11.5非严重条件非严重情况是不可能导致立即出现故障但务必进行更正以确储存储阵列持续可靠性的事件或者状态。非严重事件示例包含

36、: 一个电源设备出现故障 一个冷却风扇出现故障 冗余配置中的一个RAID操纵器模块出现故隙 一块电池出现故障或者被卸下 冗余虚拟磁盘中的一个物理磁盘出现故障存储设备处于非严重情况下时,它的存储设备状态LED将呈琥珀色稳固亮起。5.12软件故障篇本篇要紧介绍在日常保护及应急处理中的一些常见软件故障,指导有关超大彩信平台保护人员掌握日常应急处理方法及流程。5.12.1 超大彩信平台程序软件故障5.12.1.1 windows2008sever常见问题it办法我们使用的是双机方案,其中任何一台服务器操作系统宕机,另一台服务器会做为备机启用,同时联系供应商重新安装操作系统。5.12.2 超大彩信平台数

37、据库软件故障第6章预警处理篇6.1 CPU过负荷预警处理与供应商联系,增加一颗E5530CPU6.2 内存预警处理与供应商联系,增加内存。6.3 磁盘空间预警处理与供应商联系,增加盘柜,集连盘柜6.4 超大彩信平台程序故障预警处理与供应商联系,并重启故障服务器。6.5 超大彩信平台数据库故障预警处理与供应商联系。第7章应急资源配备建议平常建立故障应急方案,要紧包含:1)当前所有网元配置备份(建议异地备份2份):2)当前业务版本备份;3)当前操作系统、数据库、支持软件(如TomCat、JDK等)的备份;4)工具软件的备齐:FTP、CRTXmanagersDamewareEtherealsUE、PCAnyWhere等;5)硬件设备:插座、螺丝起、串口线、网线、测试手机(卡)、交通车辆、通讯工具等;6)远程支持环境:包含联系人员、远程登陆方式、第三方厂家联系等;

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号