OceanStorS3100S3200S6800存储设备信息收集指导书1.1-2023年0718-B.docx

上传人:李司机 文档编号:6798826 上传时间:2024-02-22 格式:DOCX 页数:22 大小:437.86KB
返回 下载 相关 举报
OceanStorS3100S3200S6800存储设备信息收集指导书1.1-2023年0718-B.docx_第1页
第1页 / 共22页
OceanStorS3100S3200S6800存储设备信息收集指导书1.1-2023年0718-B.docx_第2页
第2页 / 共22页
OceanStorS3100S3200S6800存储设备信息收集指导书1.1-2023年0718-B.docx_第3页
第3页 / 共22页
OceanStorS3100S3200S6800存储设备信息收集指导书1.1-2023年0718-B.docx_第4页
第4页 / 共22页
OceanStorS3100S3200S6800存储设备信息收集指导书1.1-2023年0718-B.docx_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《OceanStorS3100S3200S6800存储设备信息收集指导书1.1-2023年0718-B.docx》由会员分享,可在线阅读,更多相关《OceanStorS3100S3200S6800存储设备信息收集指导书1.1-2023年0718-B.docx(22页珍藏版)》请在三一办公上搜索。

1、资料编码产品名称OceanStorS3100/S3200/S6800使用对象华为工程师、合作方工程师产品版本通用编写部门集成产品部资料版本V1.1OceanStorS3100S3200S6800存储设备信息收集指导书拟制:王旭波日期:2006-12-14审核:日期:审核,日期:批准:日期:HUAWI华为技术有限公司版权全部侵权必究MUAWl修订记录日期本描述作者2006-12-14Vl.0完成初稿王旭波2007-7-18VI.1修改了截图(华为化后的图片),修改治理软件名称、版本邢涛目录第1章故障信息收集概述1第2章故障信息收集方法22.12.22.3 收集RecoveryGuru信息72.4

2、 收集存储设备界面信息9第3章其它相关信息收集1.03.13.23.33.43.54.1关键词:OceanStor,S3100,S3200,S6800,信息收集摘要,本文主要说明OCeanSlor系列存储设备(包括S3100,S3200,S6800)发生故障时,现场工程师应当如何应用OCeanStOrManagerSUite治理软件(本指导书以OCCanStOrManagerSUile9.19版本为例进展说明)快速、全面、准确收集最需要的故障定位信息,以加快故障的响应和处理速度。同时对于有肯定存储设备维护阅历的工程师也可以根据ReCoVeryGUrU的故障恢复提示进展维护处理。缩略语清单:参考

3、资料清单:第1章故障信息收集概述OceanStor系列存储设备发生故障时,如何准确、快速、全面地收集故障信息,对故障的定位和排解格外重要。OceanStor系列存储设备(包括S3100,S3200,S6800)主要使用OceanStorManagerSUite治理软件对其进展治理和监测。当存储设备发生故障时需要通过OceanStorManagerSuite治理软件收集的主要信息有:(1)配置文件信息(StOrageArrayProfile);(2)日志文件信息(EVentLog);(3)ReCOVeryGUrU信息;(4)存储设备界面信息。为了全面定位故障信息,还需要现场收集的信息包括:(1)

4、读连接状态诊断信息。(2)存储设备的连接信息(包括存储设备掌握器与扩展磁盘框的级连、存储设备与主机和光纤交换机三者之间的连接);(3)主机的相关信息;(4)光纤交换机的相关信息;(5)发生故障前对存储设备、主机和光纤交换机所做的相关操作等。对于有肯定存储设备维护阅历的工程师可以直接依据ReCoVeryGuru的故障恢复提示信息进展维护处理。说明:(1)本指导书主要是以OCeanStOrManagerSuite9.19为版本进展介绍和说明,对于其它版本的OCeanStOrManagerSuite治理软件收集方法类似,可能菜单的所在位置会略有不同,但都可以找到。(2)对于OceanStorMana

5、gerSllite9.10以上的软件版本,很多信息和操作命令都放在AdVanCed菜单项里。Ml IAWPI第2章故障信息收集方法下面将具体介绍如何收集配置文件信息(StOrageArrayProfile)日志文件信息(EventLog)sRecoveryGuru信息、存储设备界面信息。在收集信息之前,确保治理终端上已经安装配置了OCeanStOrManagerSUite治理软件。2.1收集配置文件信息(StOrageArrayProfile)1 .在安装配置好OCeanStorManagerSuite治理软件以后,翻开C)CeanStOrManagerSUite治理软件,连接到要治理的存储设

6、备。如以下图2口: S3200 - OceanStor Ianacor Suite (Array Ianaecacnt)Storage Airay View Mappings Volume Group Volume Controller Drtve AcNanced Help里型勺切到立 国 LoQlcsWhysiM View 由 M.pngsMevrL9calB OstBogeAjroyS3200 电 VaUmeGrOUPl(RAD 5) 1 (4 GB)QiFree Cepacty (268 466 GB) C VoMnc Group 2 (RAO S)田 & Volume Grp 3(R

7、AO 5)t Volume Group 4 (RAD O)VoJume Group 5 (RAO 5)Try 85 - FIWC 女Orort)BBB00BBB00B000gg(beck) A ceeB 4jooS7,EVoMneGroup7(RAOS)图2-1OceanStorManagerSuite治理界面2 .点击“StorageArray-*View-*Profile,如以下图2-2:图2-2查看Profil菜单3.在弹出的窗口中点击“SaveAs”,如以下图2-3:图2-3PrOfil查看界面4.以文本方式保存该文件,建议文件名为“日期一prof11eRl比方20061214_pro

8、file.txt2. 2收集日志文件信息(EVentLog)1 .进入OCeanStOrManagerSUiIe治理界面,点击Advanced-*TroubIeshooting-*ViewEventLo”,如以下图2-4:gsS3200-OccanStorlanacrSuite(ArrayIanaecacnt)AtfancedHelpCollectAllSupportData.CollectDriveData.MaintenanceRecoveryTroubleshootingStorageArrayXAewMappingsVolumeGroupVolumeControllerDrNe星I典型

9、国马IQJ到LogicelZPhysicalVteW以MoppingsViewNUAWCI图2-4查看EventLog菜单M11WPI2 .在弹出的窗口中选中“Viewonlycriticalevents”,并将uRetrievemostrecentcriticalevents*后面的条目改为最大值8191,并点击uUpdaten更,之后再点击SeleCtAlr按钮,然后点击“SaveAs”按钮,如以下图2-5:3gS3200-EentLoeRetrieve most recent critical events:8191 ypdate 06-12-1410:2205l.rr06-12-141

10、0:220506-12-1410:22:0506-12-1410:220506-12-1410:220506-12-1410:220506-12-1410:220506-12-1410:220506-12-1410:220506-12-1410:220506-12-1410:220506-12-1410:220506-12-1410:220506-12-14 1 0:22:05SQC0SSSSSSQS3E3Power-fan CarHSterTrayIOO1StotOActivate controller firmware comptet.Interconnect-battery.TrayIO

11、O1StotOActivate controller firmware startedDrive Channel PortDrive Channel Port 2Controller mlswlre for dve channel.Drive Channel PortDrive Chamel Port 1Controller miswire for drive channel.DriveNoneESM - loss of communicationDriveNoneUnsupported SCSI chipDriveNoneController out of memoryDriveNoneDr

12、ive wrie faiure - retries exhaustedDriveNoneDrive read failure - retries exhaustedDriveNoneError on drive openDriveNoneDrive by-passed condition resolvedDriveNoneDrive by-passedDriveNoneDrive by-passed - data rate (speed).Tray 100, Stot 0 Activate controller firmware failedViewonlycriticaleventsView

13、detaisDescriptionDs4eTimePriorityComponentTypeComponentLocationSelectAlISaveAs.ICloseIClearAll.IHelpDisplaying14of14criticalevents(14totalevents).图2-5CriticalEventLog查看界面3 .保存该日志文件,建议文件名为“日期。gfritical,如20061214OgqitiCaI。4 .将图2-5中的“Viewonlycriticalevents”项取消掉,并将*Retrievemostrecentcriticaleventsn后面的条目

14、改为最大值8191,并点击“Update”更,之后再点击SeleCtAlr按钮,然后点击“SaveAs”按钮,如图2-6:ggS3200-EventLogRetrievemostrecenteverts:8191jUpdateIViewortycriticaleventsViewdetailsDateZTimePriorityComponentLocationDescriptionActivateCorrtrolerfirmwarefailed6-12-1410:22:05Tray100lSIotO06-12-14 1 0:22:0506-12-14 1 0:22:0506-12-14 1 0

15、:22:0506-12-14 1 0:22:0506-12-1410:22:0506-12-14 1 0:22:0506-12-14 1 0:22:0506-12-14 1 0:22:0506-12-14 1 0:22:0506-12-14 1 0:22:0506-12-14 1 0:22:0506-12-14 1 0:22:0506-12-14 1 0 22:05Activate CorrtroaerhrmWare mplet. Actrvate ContrOaerHrmWare started Controller mis wire for drive channel. Controlle

16、r mis wire for drive channel . ESM - loss of communication Unsupported SCSI chip Controller out of memory Drive write failure - refries exhausted Drive read tailire - retries exhausted Error on drive open Drive by-passed condtion resolved Drive by-passedDrive by-passed - data rate (speed).Power-fanc

17、anisterInterconnect-battery.DriveChannelPortDriveChanndPortDrrveDriveDriveDriveDriveDrrveDriveDriveDriveTray1001SIotOTray100,SIotODriveChannelPort2DriveChannelPort1NoneNoneNoneNoneNoneNoneNoneNoneNoneSelectAllSaveAs.OoseCIearAJI.HelpDisptayiig14of14totalevents.图2-6AllEventLog查看界面MliAWPl5 .把日志文件再保存一次

18、,建议文件名为“日期og_all,如20061214_log_allo2.3收集RecoveryGuru信息1 .进入OCeanStorManagerSUite治理界面,点击“Recoveryfromfailures“按钮菜单栏上左边数第五个按钮),如图:2-7所示。图2-7RecoveryGuru按钮位置2 .在弹出的窗口中把GUrU告警信息保存下来,假设有多个告警信息,要分别选择,然后分别点击“SaveAs”保存,文件名建议分别命名为gurul,guru2,guru3,如图2-8:图2-8RecoveryGuru查看界面3 .假设点击主界面的Rec。VeryGUrU按钮之后弹出下面窗口,则

19、说明存储设备并没有明显的问题。图2-9存储无故障提示2.4收集存储设备界面信息1.将存储设备治理主界面图形保存下来可以承受抓图的方式保存,如图2-10o图210存储设备治理主界面第3章其它相关信息收集为了全面定位故隙信息,还需要现场工程师收集的其他相关信息有:(1)收集读连接状态诊断信息;(2)存储设备的接线图(包括存储设备掌握框与扩展硬盘框的级连、存储设备与主机及光纤交换机三者之间的连接);(3)主机的相关信息;(4)光纤交换机的相关信息;(5)发生故障前对存储设备、主机和光纤交换机所做的相关操作等。3.1收集读连接状态诊断信息1.进入OCeanStorManagerSUite治理界面,点击

20、“Advanced-Troubleshooting-*RunDiagnostics-*ReadLinkStatusn,如以下图3-1:$ Volume Group Volume Controller Drive Atf*ancd HelpIISMappingrs VlevrMaintenance Troubleshooting cy(i8,-n)n5)5)ry51CCPTray 100 -Ftore Recovery(front)(back)CollectAll Support Data.Collect Dnve Data.View Event LogDrive Channels.Captur

21、e State InformationRun DiagnosticsPrepareforRemovalController.Read UnkStatus.Discrete Unes.Troy1(rot)-7F口口口口口口口叩口口口口口口口Tray2(Iront)-五口口口口口口口口口口口口口鹿口照比图3-1ReadLinkStatus菜单MliAWPI2.在弹出的窗口中先设置基线,即点击llSetBaseline-按钮,将弹出如下窗口,如图3-2O图3-2基线设置界面3.点击“Yes”按钮,将弹出如下窗口,如图3-3。图33确认设置基线MUWI4 .点击uOKn按钮,将弹出如下窗口,如图3-4

22、O图3-4ReadLinkStatus检测界面5 .点击“Run”按钮,将弹出如下窗口,如图3-5。lSIS3200-ReadLixkkStatusDiagno:SelectRuntogatherthereadlinkstatusdataThedatadisplayedwishowthechangeinthevariouserrorcountsfromthetimewhenthebaselinewaslastset.Ifyouwanttosetanewbaselinebeforegathefingthedata,selectSetBaseline.ForInformationonanalyzi

23、ngthedata,refertotheOninehelp.Datagatheredon(controllertime):06-12-1411:08:25Showdeviceson:AIIChannelsDevicesConnecto.IAL.IBaselineTimeSa1*glt.ITWLFL.L.p.11.DriVeChannel1回ControlefinslotAInternal1x.06-12-1411:07:.OGoI:03797544=IQDrive(1,11Controller.19j0.06-12-1411:07:.(01:03107910BDriVerlZControlle

24、r.200.06-12-1411:07:.0ft01:03861441UDriVe113Controller.21j0.06-12-1411:07:.00:01:03354156BDrive1,4Controller.22.06-12-1411:07:.00:01:03120163BDrive(1.5Controller.23.06-12-1411:07:.00:01:03499415gDrive1,6Controller.24.06-12-1411:07:.00:01:03867533QDrive1.Controller.25.06-12-1411:07:.(01:03501768BDriv

25、e(1,8Controller.26.06-12-1411:07:.00:01:03165011QDrive(1,9jController.27/0.06-12-1411:07:.OGOI:03399353f441rocCAnAA7ZCOCCOOI.Run1SetBaseine.ISaveAs.ICloseIHelpIMliAWPl图3-5正在检测ReadLinkStatus6.过一段时间以后至少观看10分钟以后J,点击SaveAs”按钮,将ReadLinkStatusDiagnostics信息保存,建议文件名为“日期.Diagnostics,如20061214_Diagnostics。说明:

26、(1)图3-5中,假设全部的诊断数据都为0,则说明存储工作正常。(2) “RunReadLinkStatusDiagnostics,对应用的性能有肯定的影响,尽量不要在业务繁忙时收集信息。(3) “SetBaSeline”只需在每次故障发生时,第一次故障信息收集时设置基线,以后对本次故障再进展信息收集不需要重设置基线。设置的基线只是作为ReadLinkStatusDiagnOStiCS信息收集的一个时间起点。3.2 存储设备的接线图请现场收集OCeanStor存储设备掌握框与硬盘扩展框的级联接线方式,以及存储设备与光纤交换机、主机之间的连接关系,并用示意图描述出来。3.3 主机的相关信息主机的

27、相关信息可以参考下表收集,表3-1。表3-1主机信息表工程型号版本补丁其他操作系统数据库双机软件HBA卡Failover软件应用软件3.4 光纤交换机的相关信息光纤交换机的相关信息可以参考下表收集,表3-2。表3,光纤交换机信息表型号Firmware版本其他3.5 其它信息收集和反响发生故障前对存储设备、主机和光纤交换机所做的相关操作等。第4章故障信息的发送4.1 相关接口人请将上述收集到的信息发给相关接口人,如下:研发杨道明(33929)欧阳戟(ht07506)_技术支持贾小江(47678,接口人)石格喜(2202,请抄送)注:假设比较紧急,可以分两次发,先把其次章收集到的信息发过来(大局部状况下可以据此定位出故障所在),然后再发第三章收集到的信息。4.2 现场处理对于有肯定存储设备维护阅历工程师可以直接依据ReCoVeryGuru的故障恢复提示信息对故障进展维护处理。依据二线支持或研发供给的意见进展处理或者进一步收集信息。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号