存储维护管理课件.ppt

上传人:牧羊曲112 文档编号:1748540 上传时间:2022-12-17 格式:PPT 页数:41 大小:706.75KB
返回 下载 相关 举报
存储维护管理课件.ppt_第1页
第1页 / 共41页
存储维护管理课件.ppt_第2页
第2页 / 共41页
存储维护管理课件.ppt_第3页
第3页 / 共41页
存储维护管理课件.ppt_第4页
第4页 / 共41页
存储维护管理课件.ppt_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《存储维护管理课件.ppt》由会员分享,可在线阅读,更多相关《存储维护管理课件.ppt(41页珍藏版)》请在三一办公上搜索。

1、DELL 存储,常见存储管理、故障处理和注意事项,DELL 存储常见存储管理、故障处理和注意事项,常见故障原因,经验表明,造成客户存储故障的外部原因主要有以下几种:存储内部错误的开关机顺序。机头或扩展柜的速率开关处于错误的位置。不规范的软硬件升级。对存储子系统进行破坏性操作。不规范的故障修复操作。维护过程中触发了相关的隐患。存储系统没有冗余的配置方案。,常见故障原因经验表明,造成客户存储故障的外部原因主要有以下几,开关机步骤,开机:SAN交换机EXP磁盘扩展柜主控柜主机 关机:主机主控柜EXP磁盘扩展柜SAN交换机 不正确的开关机顺序可能会导致部分硬盘离线以及数据无法访问。注意:在DS5000

2、按下电源按钮关机后,在控制器代码和所有电源灯熄灭前绝对不能进行任何操作!,开关机步骤开机:,管理软件,Storage Manager客户端管理软件连接方式如下: 将装有Storage Manager Client客户端软件的工作站,通过以太网Hub或Switch,同时连接到DS4000/DS5000的两个控制器。打开Storage Manager Client客户端软件 控制器有一个出厂默认的IP地址:控制器A/B:192.168.128.101/102 (控制器A/B:192.168.129.101/102 ),管理软件Storage Manager客户端管理软件,存储子系统状态标识,存储子

3、系统状态标识,管理界面-企业主管理界面,管理界面-企业主管理界面,管理界面子系统管理界面,管理界面子系统管理界面,子系统部件标识,子系统部件标识,故障检测按钮,使用“Recovery Guru” 故障检测按钮检查DS4000/DS5000子系统的整体状态 “听诊器”,故障检测按钮使用“Recovery Guru” 故障检测按钮,故障检测按钮,正常故障,故障检测按钮正常,控制器和扩展柜的硬件状态,点击物理硬盘右侧的状态检查按钮,可以打开查看具体部件的硬件工作状态,控制器和扩展柜的硬件状态 点击物理硬盘右侧的状态检查按钮,可,查看控制器信息,选择“Storage Subsystem Menu” “

4、View” “ Profile”,查看控制器信息 选择“Storage Subsystem M,故障数据收集,收集 All Support Data菜单:Advanced-Troubleshooting-Collect All Support Data .,故障数据收集收集 All Support Data,故障数据收集,查看Major Event Log 菜单:Advanced-Troubleshooting-View Event Log,故障数据收集查看Major Event Log,故障数据收集,查看链路信号噪音检测报告 菜单:Advanced-Troubleshooting-Run D

5、iagnostics-Read Link Status ,故障数据收集查看链路信号噪音检测报告,电池和缓存,电池和缓存的设计原理为了保证写缓存数据的安全性,DS4000/DS5000系统中,只要电池发生故障(处于Failed状态)或者超过微码所规定的设计寿命,那么写缓存就会被自动禁用为了保证写缓存数据的安全性,默认两个控制器的Cache Mirroring写缓存镜像功能是打开的。因此当一个控制器的写缓存被禁用之后,另外一个控制器的写缓存也不能使用了。,电池和缓存电池和缓存的设计原理,电池和缓存,写缓存禁用之后的故障现象主机端应用程序响应变慢,从topas检查主机性能指标,I/O waiting

6、显著增加,每个逻辑盘的busy接近100%,但是IO吞吐量很小,每秒只有几十K到1M不等:,电池和缓存写缓存禁用之后的故障现象,电池和缓存,电池的更换策略如果电池当前是处于“Failed”或“Removed”状态如果电池当前状态正常,只是接近或已超过告警寿命,电池和缓存电池的更换策略,在AIX上使用MPIO的一些注意事项,AIX版本5.2以上,除了原有的集成的RDAC功能以外,操作系统还新增了MPIO的功能来实现外部磁盘的多通路访问。AIX 5.2/5.3默认是使用RDAC,而AIX6.1默认是使用MPIO。 RDAC和MPIO的兼容性DS3000: 只支持 MPIO DS4000: 支持方式

7、:RDAC, MPIODS5000: 支持方式:MPIO (DS5000在AIX上不再支持RDAC),在AIX上使用MPIO的一些注意事项AIX版本5.2以上,除,在AIX上使用MPIO的一些注意事项,如何在AIX上确认当前正在使用MPIO还是RDAC 在AIX中执行“manage_disk_drivers” 以下是一个当前使用MPIO的例子: #manage_disk_drivers 1: DS4300: currently MPIO; supported: RDAC/fcparray, MPIO 2: DS4500: currently MPIO; supported: RDAC/fcpa

8、rray, MPIO 3: DS4700/DS4200: currently MPIO; supported: RDAC/fcparray, MPIO 4: DS4800: currently MPIO; supported: RDAC/fcparray, MPIO 以下是一个当前使用RDAC的例子: 1: DS4300: currently RDAC/fcparray; supported: RDAC/fcparray, MPIO 2: DS4500: currently RDAC/fcparray; supported: RDAC/fcparray, MPIO 3: DS4700/DS42

9、00: currently RDAC/fcparray; supported: RDAC/fcparray, MPIO 4: DS4800: currently RDAC/fcparray; supported: RDAC/fcparray, MPIO,在AIX上使用MPIO的一些注意事项如何在AIX上确认当前正,在AIX上使用MPIO的一些注意事项,如何检查当前磁盘的工作路径RDAC:fget_config -Av MPIO: mpio_get_config -Av,在AIX上使用MPIO的一些注意事项如何检查当前磁盘的工作路,常见故障处理和注意事项,控制器微码是不是有重大隐患的版本? 06

10、.23.05.00: 隐患一:当某个控制器内存校验出错时,故障控制器无法正确的被隔离offline,从而导致逻辑盘LUN不能切换到好的控制器上,主机访问中断。 隐患二:DS4800写缓存被禁用,主机写性能大幅度下降,从而影响业务。 07.10.23.00: 隐患一:更换故障硬盘后,之前已经接管的热备盘无法CopyBack 隐患二:Media Scan被自动禁用,常见故障处理和注意事项,常见故障处理和注意事项,EXP扩展柜的ESM微码版本有没有重大隐患? EXP710的ESM的微码隐患(9681以下版本) 当一块硬盘故障时,MEL里面显示Fiber Channel Link up和Link do

11、wn的Event,发生大面积的多块硬盘的同时故障,客户数据访问中断。 EXP810和EXP420的ESM的微码隐患(98D0以下版本) 当一块硬盘故障时,MEL里面显示Fiber Channel Link up和Link down的Event,发生大面积的多块硬盘的同时故障,客户数据访问中断。,常见故障处理和注意事项EXP扩展柜的ESM微码版本有没有重大,常见故障处理和注意事项,要特别注意前面板右下方的(2GB/4GB)速率开关,是否处于正确的位置。速率开关处于4GB位置时,2Gbps的硬盘将不能被识别;相反速率开关处于2GB位置时,4Gbps的硬盘是可以使用的,但是性能将会下降。这种情况比较

12、容易被忽视。速率开关的更改需要关机下电。注意:所有3Gbps的SATA硬盘,都推荐运行在4Gbps。,常见故障处理和注意事项,常见故障处理和注意事项,磁盘扩展柜的光纤连线符合IBM的规范。在控制器有冗余的光模块条件下,建议将多个扩展柜连接在多个冗余环路上,尽量不要将所有的扩展柜串联在一个环路里。,常见故障处理和注意事项磁盘扩展柜的光纤连线符合IBM的规范。,常见故障处理和注意事项,只要使用了光纤交换机,做Zone是强制要求。每一个Zone必须只包含两个成员,一个对应主机的一张光纤卡的一个端口,另一个对应DS4000/DS5000的一个控制器的一个端口。,常见故障处理和注意事项,常见故障处理和注

13、意事项,逻辑盘不在最优路径“Logical Drive Not On Preferred Path” 。这个问题指的是DS4000/DS5000的逻辑盘(LUN)没有挂在原本所属的控制器下。,常见故障处理和注意事项逻辑盘不在最优路径“Logical D,常见故障处理和注意事项,原因分析:(主要有6点) 从主机的光纤卡到Logical Drive的光纤物理链路有问题。P-Series主机的dar0的虚拟设备配置有问题光纤交换机fabric1的Zone设置有问题。主机光纤卡HBA和DS4000/DS5000控制器的主机端口Host Port之间的光纤连线方式不正确,没有符合IBM的规范。控制器发生

14、过重启,或者控制器已经Offline(离线),常见故障处理和注意事项原因分析:(主要有6点),常见故障处理和注意事项,检查的确认方法:(主要有8点) 确认从主机的光纤卡到逻辑盘Logical Drive的物理链路是完全正常的。查看光纤交换机相应的主机光纤卡端口和DS4000/DS5000控制器端口的状态灯登陆主机,运行“fget_config -Av”确认dar的虚拟设备配置正常确认光纤交换机的Zone设置没有问题。确认主机光纤卡HBA和DS4000/DS5000控制器的主机端口Host Port之间的光纤连线方式是正确。在SM客户端管理软件里面确认DS4000/DS5000的控制器状态正常检

15、查DS4000/DS5000内部的Mapping是否正确确认 Linux主机的host type是否正确。,常见故障处理和注意事项检查的确认方法:(主要有8点),常见故障处理和注意事项,恢复方法 在Storage Manager客户端管理软件里面运行: Advanced Recovery Redistribute Logical Drives 在Storage Manager客户端管理软件里面,更改每一个逻辑盘Logical Drive的所属控制器 菜单:Logical DriveChangeOwnership/Preferred Path 注意:在恢复之前,一定要确认从主机的光纤卡到Logi

16、cal Drive的通道是完全正常的,只有在完全确认上述几种故障都已经解决之后,才能实施恢复。否则后果一定是灾难性的!,常见故障处理和注意事项恢复方法,常见故障处理和注意事项,Storage Manager客户端软件不能连接和访问DS4000/DS5000的控制器 首先排除网络方面的问题看看控制器的两位数字LED的显示是否正常如果控制器的两位数字LED的显示在循环变化,或者Ping的时通时断,这时候可以通过串口连上控制器,观察并捕获屏幕的输出。控制器能Ping通但是Storage Manager连不上如果能安排停机时间,重启机头是最有效的解决方法。,常见故障处理和注意事项Storage Man

17、ager客户端软,常见故障处理和注意事项,拔除DS4000/DS5000系统中所有未使用(没有光纤连接)的光电转换模块SFP 会导致光纤链路的不稳定在MEL Event Log中,会发现有大量的“Fibre Channel Link Down”和“Fibre Channel Link Up”的提示信息。,常见故障处理和注意事项拔除DS4000/DS5000系统中所,常见故障处理和注意事项,特别注意:不规范的实施DS4000/DS5000系统EXP扩展柜和物理硬盘的升级和迁移,可能会造成客户数据丢失! DS4000/DS5000系统增加新的EXP扩展柜(升级)DS4000/DS5000系统增加新

18、的物理硬盘(升级) 将一个或多个EXP扩展柜,从一个现有的DS4000/DS5000系统迁移到另一个DS4000/DS5000系统(迁移) 将一块或多块硬盘,从一个现有的DS4000/DS5000系统迁移到另一个DS4000/DS5000系统(迁移) 以上工作必须严格按照最新版的IBM官方文档里面所规定的步骤进行。,常见故障处理和注意事项特别注意:不规范的实施DS4000/D,常见故障处理和注意事项,注意定期保存DS4000/DS5000系统的All Support Data(ASD) DS4000/DS5000的All Support Data里面记录了所有Array的配置信息和主机Mapp

19、ing的信息,在关键时刻对于客户的数据恢复有着非常重要的作用。,常见故障处理和注意事项注意定期保存DS4000/DS5000,常见故障处理和注意事项,寻找DS4000/DS5000的Recovery Profile SM客户端软件的一个功能记录了DS4000的Array和LUN的基本信息,常见故障处理和注意事项寻找DS4000/DS5000的Rec,常见故障处理和注意事项,不能对处于“Degraded”状态的Array的故障硬盘使用Revive操作! 当Array变成Degraded状态时,主机的访问将会恢复。故障硬盘仍然处于被隔离的静止状态造成数据丢失!,常见故障处理和注意事项不能对处于“D

20、egraded”状态的A,常见故障处理和注意事项,故障误报微码和旧版的不兼容通过升级微码解决通过重启机头解决,常见故障处理和注意事项 故障误报,常见故障处理和注意事项,绝对不能在生产系统使用SM客户端管理软件的“Reset Configuration”功能删除DS4000/DS5000系统里面所有的Array/Lun信息将所有配置恢复成出厂设置值,常见故障处理和注意事项绝对不能在生产系统使用SM客户端管理软,常见故障处理和注意事项,DS5000维护注意事项 DS5000的关机流程和DS4000是不一样的: 关闭两个电源的开关 - 控制器缓存(Cache)中的数据自动备份到控制器内部的闪存(USB Flash)中,控制器的LED 交错的显示 “os”和“bb” - 控制器电源在数据备份完成后才会关闭因为这个差异,DS5000的关机过程耗时比较长, 大概5-10分钟(控制器的LED会交错的显示“os”和“bb”),关机后,控制器的代码和电源灯会熄灭。 在DS5000按下电源按钮关机后,在代码熄灭和所有电源灯熄灭前绝对不能进行任何操作!,常见故障处理和注意事项DS5000维护注意事项,常见故障处理和注意事项,常见故障处理和注意事项,常见故障处理和注意事项,常见故障处理和注意事项,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号