IBM服务器维护手册.docx

上传人:牧羊曲112 文档编号:4885230 上传时间:2023-05-21 格式:DOCX 页数:38 大小:120.17KB
返回 下载 相关 举报
IBM服务器维护手册.docx_第1页
第1页 / 共38页
IBM服务器维护手册.docx_第2页
第2页 / 共38页
IBM服务器维护手册.docx_第3页
第3页 / 共38页
IBM服务器维护手册.docx_第4页
第4页 / 共38页
IBM服务器维护手册.docx_第5页
第5页 / 共38页
亲,该文档总共38页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《IBM服务器维护手册.docx》由会员分享,可在线阅读,更多相关《IBM服务器维护手册.docx(38页珍藏版)》请在三一办公上搜索。

1、第一类、机房环境及物理检查一、机房内环境要求1. 温度与湿度:最佳工作温度:20-25摄氏度极限工作温度:10-40摄氏度湿度:8-80%(在23摄氏度条件下)如果不是工作在最佳温度,请注意改善机房环境2. 同时机房要保证清洁.机房应保持清洁,若空气灰尘过多,很容易造成资源读写错误及磁盘机中磁盘或读写磁头毁损。二、电源要求电 压:要求电压稳定,尖峰电压会损坏设备电压范围:220V +/- 10%,即 200-240V, 50-60Hz电源功率:视机器类型和系统配置而定电源线 : 标准的零,地,火三相电,其中零,地电压不得超过.电源接驳: 用符合电流要求的空气开关或其他设备和主机电源线接驳, 保

2、证计算机系统的可靠工作应使用稳压电源和UPS,并建议配备发电机组; 对于冗于电源的接入,建议采用两路单独输入.三、硬件检查检查服务器、磁阵的安装、电源线、7133和主机接线符合要求。服务器状态检查:1. 当服务器处于启动和正常工作状态时,其前面板上的液晶显示屏上应无信息显示。2. 当液晶显示器上出现带数字和字母的信息时,说明有硬件告警。可以通过查询相关机型的Service Guide查到相应告警原因,情况严重的, 则要立即通知IBM技术专家进行问题排查。7133状态检查: 磁阵前面板上有7133机柜的状态灯(与电源灯并排)和各硬盘的状态灯(一 排小灯,与各硬盘位置一一对应)。1. 当机柜的状态

3、灯出现橙黄色时,说明有硬件告警,此时要检查磁柜的电 源、接线、硬盘等。如果有硬件故障则立即进行更换和更正,如果查不出 具体问题,则需要联系相关专家进一步诊断。2. 当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿 灯一直亮,如该硬盘有读写操作,则绿灯会不规则闪烁,当硬盘损坏时或 SSA环路出现问题时,则硬盘状态灯将熄灭,或者呈闪烁状态:以13秒 的频率有规律地、不停地闪烁第二类、系统日常维护流程系统启动系统启动正常顺序如下:首先对外设(磁盘阵列、磁带库等)加电。待所有外设加电自检完成后,主机加电正常起机。主机加电后,系统进行 自检,在液晶显示屏显示” ok”后,才能按白色POWE

4、R键起机.启动主机HACMP,启动后可用命令tail -f /tmp/来检查启动情况,在 HACMP未完全启动前不要进行下一步。检查服务器的网络地址,路由表(可用netstat -i , netstat -rn等), 检查文件系统,逻辑卷(可用mount , lsvg -o等)。检查各项应用是否工作正常。系统关闭停止 HACMP ( smitty clstop)。查看HACMP的状态,检查服务器的网络地址,路由表(可用netstat -i , netstat -rn等),检查文件系统,逻辑卷(可用mount , lsvg -o等)。 在HACMP未完全停止前不要进行下一步。关闭主机(shutd

5、own - F)。重启系统可以使用:shutdown -Fr如有必要的话,按磁盘阵列前方的白色按钮关闭磁盘阵列。LOGGING TURNED ON1E2AC07E 09 T O errdemonERRORLOGGING TURNED OFF1E5EER4T 09 T O clstrmgrOPERATORNOTIFICATION其中IDENTIFIER为错误编号,当需要检查详细信息时常会用到。TIME STAMP为时间标签,它记录的是出错时间,其格式:月月日日时时分 分年年T为Type ,它记录的是错误类型P :为永久错误,需引起注意为临时错误。C为Class,它记录的是错误种类,如H : Ha

6、rdwareS : SoftwareO : Errloger command messagesU : undeterminedRESOURCE_NAME为错误来源DESCRIPTION为错误描述#errpt -aj 查看系统详细记录内容其中IDENTIFIER为错误编号,如#errpt -aj 09#errpt -dH查看系统所有的硬件出错记录系统与数据备份 有效及时的系统备份是系统管理的非常重要的一环。当系统出现故障时, 特别是文件系统被严重损坏或硬盘损坏时,常需要使用系统备份来恢复系 统。在以下情况下应做系统备份:1、新装机。在硬件及系统软件安装完成后,应做系统备份。2、软件改动。系统软件

7、或应用软件有改动时,应做系统备份。3、定期备份。对系统进行定期备份,最好每两或三个月做一次备份备份注意事项:进行系统备份无须停止业务,业务可以继续进行。建议客户进行定期的系统备份(使用命令smitty mksysb)。客户也可根 据需要利用SMIT对系统的特定的VG或FS进行备份。smitty mksysb只备份rootvg中mount起来的文件系统,其它文件系统或 数据并没有做备份,所以数据备份需要另外完成(建议客户使用TAR格式)在条件允许的情况下,最好有一盘以上备份带,以防止磁带损坏。系统备份过程中有时候会提示有些/tmp目录下的文件无法备份,显示如下:Creating list of

8、files to back up.Backing up 34025 files1694 of 34025 files (4%)2733 of 34025 files (8%)backup:0511-449 An error occurredaccessing ./tmp/: A file or directory in the path name does not exist.backup: 0511-449 An error occurred accessing ./tmp/: A file or directory in the path name does not exist.backu

9、p: 0511-449 An error occurred accessing ./tmp/: A file or directory in the path name does not exist.15458 of 34025 files (45%)31920 of 34025 files (93%)0512-003 mksysb may not have been able to archive some files.The messages displayed on the Standard Error contained additional information.这是正常现象,备份

10、成功。系统恢复当系统发生比较严重的故障以致采取一般性维护手段不能在短期内恢复原 系统,在与客户进行蹉商后,可将最近一次的系统备份带倒回机器内以全 面恢复系统到最近一次做备份时的系统环境,然后可将当日的数据备份再 倒回系统内。至此,系统可恢复正常运行。此后,客户应当与IBMT程师 再进行整个事件的全面分析与回 顾,以期找到故障发生的原因,并采取相 应措施以杜绝类似事件再次发生。DUMP当系统运行出现软件故障导致系统down机时,机器的液晶显示器会出现 888 102 xxx 0c0 (xxx可能为700或其它),AIX常会将当时系统的运行情 况记录下来,这就是DUMP。当DUMP产生后,请将磁带

11、放入磁带机,用命令# snap -a -o /dev/rmt0 将DUMP文件拷贝到磁带设备/dev/rmt0中。注明磁带机的block size, DUMP产生的日期和机器的型号及序列号。同时,请用#errpt-a /tmp/将 error log记在/tmp/中,并将/tmp/和/tmp/hacmp.*拷贝到软盘或磁带 上。将磁带和软盘交给IBMT程师。日常检查服务器状态的项目及其相关命令1运行lsdev命令配以各种参数,所列各种设备状态都应为Available。#lsdev -C -H -S a列出系统中可用设备。#lsdev - Cc processor列出系统中的所有CPU。#lsd

12、ev-Cc memory列出系统中的所有内存。#lsdev-Cc disk列出系统中的所有硬盘。#lsdev-Ccadaptergrepent列出系统中的所有网卡#lsdev-Ccadaptergrepscsi列出系统中的所有SCSI卡。#lsdev-Ccadaptergrepssa列出系统中的所有SSA卡。2 lspv命令#lspv显示系统中可用的PV。#lspv hdiskn显示hdiskn的具体信息。#lsdev - Cc pdisk显示磁盘阵列的硬盘的具体信息。对SSA硬盘的检测:在对主机进行工作之前可以先把磁盘阵列上电,等主机完全启动后,登录到主机上,运行以下命令“ lsdev -C

13、c pdisk “, 应该可以看到所有SSA硬盘,并且状态应为Available. 03 Isattr 命令# Isattr - E - I mem0列出系统中内存mem0的大小,本项目中内存有 4GB。4 lsvg命令#lsvg列出系统中所有的vg。#lsvg rootvg列出rootvg的详细信息。#lsvg - o列出激活的vg5 oslevel 命令#oslevel显示操作系统版本信息。6 netstat 命令#netstat - in 显示系统中各网卡的配置。可查看网卡的IP配置好了 没有。7 # diag命令运行硬件诊断程序检测主机内所有硬件,检测结果为“No trouble fo

14、und ”显示各部分工作正常。8 使用#diag命令(选择:Task Selection-SSA Service Aids)对 SSA 硬盘链路连接的校 验,可以通过SSA工具里的Link Verification来检测。如有必要,可以 用Certify Disk运行硬盘诊断部分进行硬盘的表面分析测试,由1%至 100%,检测结果显示主机内置硬盘的所有扇区均读写正常。9 lsps - a查看PAGING SPACE的使用情况,如果使用率超过70%,就需要采取措施。10 Isvg - o | Isvg - il | grep - i stale查看有无stale的Iv,如果输入该命令之后有输出结

15、果,就需要采取措施11 有否发给root用户的错误报告(mail)o12 检查双机状态:Issrc - g cluster检查ha三个工作进程是否激活,/usr/sbin/cluster/clstat -a检查双 机状态是否up,并检查日志,看是否有异常信息。13 用 vmstat, topas, sar 命令检查系统性能,检查cpumemoyrIO,是否存在性能瓶颈。14 检查能否顺利进入CDE界面,如果不能进入的话,要检查/etc/hosts表中有否错误的项目。15 用smitty ssaraid查看磁盘阵列RAID盘的状态是否是Good。如果 是degrade或其他状态表示RAID盘出现

16、问题了16 用sysdumpdev - l查看系统的DUMP设置是否正常。17 用instfix -ik | grep ML当前操作系统补丁版本补丁程序(PTF) 是否满足稳定运行的需要。一般要求433操作系统补丁要打到10以上,操 作系统补丁要打到5以上18 使用df -kP查看磁盘空间占用率,请确保以下文件系统的占用率高于80%立即上报:性能监控与调优通过命令vmstat 1来观察.kthrmemorypagefaultscpu r b avm fre re pi po fr sr cy i n sy cs us sy id wa命令解析:vmstat命令的输出可以反映系统整体运行状况,包

17、括cpu、内 存、虚拟页面、系统进程和系统调用情况。检查CPU是否为瓶颈,分别检查CPU的四项数值和kthr的两项数值.检查MEM是否为瓶颈,分别检查Memory的两项数值和Page的六项数值.通过命令sar -mu -P ALL来观察。命令解析: sar可以用来收集反映系统运行状况,在这里主要是查看CPU的运行状况,CPU是否负载均衡,是否存在分配不均的情况。通过命令ps gv | more来观察。PID TTY STAT TIMEPGIN SIZE RSS LIM TSIZ TRS %CPU %MEM COMMAND0-A4:2071214516xx0 14504swapper1-A1:3

18、3103 78952 79044327682536/etc/ini命令解析:PS可以用来查看进程的当前状态。在这里通过参数的配搭,可 以观察目前正在运行的进程所耗的时间,CPU和memory量.其中,%CPU表 示进程所占用的CPU资源情况,%MEM表示进程所占用的内存情况。主要检 查是否有标示为defunc的僵尸进程耗用系统资源,以及informix数据 库的oninit进程的系统消耗情况。在机器上用dd命令进行磁盘阵列的写操作校验,与此同时用iostat 1 -d hdiskX观察磁盘。Disks:%tm_actKbpstps Kb_read Kb_wrtn命令解析:iostat可以用来查

19、看系统的I/O的输入输出情况,在这里主要 查看阵列上的硬盘的每秒读写量,同时估算磁盘阵列读写速度HHhHhh通过命令netstat - a进行查看。Active Internet connections (including servers)Proto Recv-Q Send-Q LocalAddressForeign Address(state命令解析:netstat可以用来查看系统的网络情况,在这里主要是查看网 络客户端连接的情况和开销,检查参数为state,如有死连接,state状态 为fin_wait,这样耗用系统网络资源,从而导致网络性能下降构成瓶颈。安全工作守则a. 系统定期进行系

20、统备份,系统盘建议镜像。b. 当有系统变更或进行操作系统补丁安装的时候,必须作一次系统备份。c. 在7133和shark发现有硬盘故障的时候,请提醒客户注意当天的数据备 份。在更换硬盘的时候,请确认当天数据备份已经完成。d. 在更换敏感的电子元件,时候一定要防静电。e. 在插拔外围设备的时候,请把外围设备下电。f. 在进行主机微码升级时候,请留意微码的完整性。g. 在进行文件删除的时候,请留意当前路径是否正确。h. 在进行文件解压缩的时候,请留意参数和路径。维护电话在日常维护中碰到问题和疑难,可以致电:IBM免费技术支持保修热线:800-810-66770100客户技术咨询热线:800-810

21、-1818IBM广州分公司联系电话:本帖最后由 mfkqwyc86 于 2010-11-4 12:32编辑# # 君子务本,本立而道生。-mfkqwyc86,飞鹰工作室ITPUT个人空间:0 1.【Oracle RAC】 Linux + Oracle 11gR2 RAC 安装配置详细过程02.Oracle RAC】 Oracle RAC更改VIP IP地址_2节点的实验 03.Oracle RAC】 Oracle RAC删除一个节点_3节点的实验04. OracleRAC Oracle RAC 增加一个节点_3 节点的实验05. Oracle RAC+DGOracle RAC+ASM+Data

22、Guard 配置实验记录 06. Oracle RAC Oracle RAC CRS、OCR、Voting 破坏重建 07. Oracle 表分区管理】Oracle Partition表分区与分区索引几种方式的实验操作08.IBM DB2表空间 管理】db2表空间管理一实例讲解之精华09.IBM DB2补丁升级】从升级到DB210.中间件资料下载汇总】WebSphere,MQ,Portal,WebLogic 资料下载汇总PDF 格式-共 51 类】只看该作者t金mfkqw #2yc86使用道具发表于 2010-11-4 12:22飞鹰工作室跟贴说明:自己遇到过的错误问题,及解决方法!精华贴第三

23、类、故障定位、故障排除,请大家在贴个人空间400见故障及其定位方式和解决方法。硬件故障硬件故障有很技术积多种,对系统产生的影响也不一样,这里按其故障对系统的影响程度分826分:致命影响的硬件故障和只影响功能的硬件故障两类进行硬件分(3079)类: 其损坏对系统产生致命影响(将使机器宕机或无法启动)的社区积硬件包括: 主板、CPU、I/O柜(包含本地盘、光驱、PCI插槽等分28的柜子)或CEC柜(包含CPU/MEMORY等的柜子)、I/O柜与CEC柜的(9086)接线、电源模块、风扇、本地硬盘、内存损坏等等注:I/O柜和注册日CEC柜一般在比较高端的小型机才有,如M80,低端的是合一的。这些设备

24、的损坏等将使系统无法完成自检、引导和启动,液晶显示屏2007-4-上都将有错误信息,可根据液晶显示屏上的错误码对照Service Guide28查的错误原因,如果是工作状态下出现这些硬件损坏,则系统将被挂论坛徽起或宕机。其损坏对仅对系统产生功能影响(机器不会宕机根据我们在实际商用系统中碰到问题,我们总结出了以下几种常章:1并能正常启动)的硬件包括:网卡、本地硬盘有坏块、显卡、SSA卡和其他外围设备这些设备的损坏只影响特定功能,如网络功 能、显示功能、访问磁阵的功能等,对于本地硬盘有坏块的情况,则要看坏块中是否包含了重要的系统文件,如果不是重要系统文件,则系统功能不受影响,但也建议立即更换该硬盘

25、。故障定位和排除:以上硬件故障信息都可以使用:液晶屏上的错误码或:errpt -dH查看到根据错误码确定是什么硬件出了故障,对商用系统来讲,由于是双机系统,如果损坏机器是主机可以将 此服务器切换成备机,然后修复故障机器,恢复系统。磁阵故障磁阵引起的故障是目前碰到的最频繁、危害最大的故障,据不 完全统计,其故障覆盖到总故障的70%以上,具体来讲,可能引起磁 阵故障的环节包括:磁阵硬盘、7133柜子、主机上的SSA卡、连接7133与主机的SSA线、硬盘的位置和ssa线的接线方式、以及盘 柜使用的电压及周围磁场、磁阵/硬盘/ssa卡的微码等都可能造成7133的异常。 7133磁阵的问题是最复杂的,一

26、般有物理损坏 的原因也有环境原因,这是主因,如接线、插盘位置不符合要求、未 及时查看系统告警等造成系统中断等辅因。按照我们的经验,不管 是什么硬件故障导致7133故障,系统都会产生告警,如果能及时发 现问题并采取措施,一般都能防止故障的发生。故障定位:7133硬件故障也可以使用:errpt -dH查看到 伴随的错误码有: B4C0061804 P H ssa0RESOURCEUNAVAILABLE FE9E935704 P H ssa0DISKOPERATION ERROR FE9E935703 P H pdisk3 DISKOPERATION ERROR 03913B9403 U H LVD

27、DHARDWAREDISK BLOCK RELOCATION ACHIEVED 613E5F3803 P HLVDDI/O ERROR DETECTED BY LVM 625E6B9A04 PH ssa0ADAPTER DETECTED OPEN SERIALLINK 26CA120B04 P H ssa0CACHE STORAGECARD所有的错误码都预示着7133有异常,红色部分则表示肯定出现了硬件故障,需要立即进行检查并采取措施,否则磁阵将很快不 能访问。对于蓝色部分:625E6B9A04 P Hssa0ADAPTER DETECTED OPEN SERIAL LINK 表示 ssa出现

28、了开环,出现开环不仅影响IO性能,也增加了风险,即如果另 一个环路也出现问题,将不能访问磁阵。开环一般有两种情况:1)如果625E6B9A报错比较频繁,如每天几次,则表示系统很有可能 出了硬件故障,虽然不会导致访问磁阵失败,但需要立即查出原因 并解决。查错方法可以参考下面的描述。2)如果625E6B9A错误偶尔 报一次,则要具体情况具体对待,有可能是读写忙出现的误报,也按 下面方法进行排查,如果没有查出具体的原因,则可以继续观察。26CA120B04 PH ssa0CACHE STORAGE CARD该错误一般是在:SSA卡带write cache并打开FastWrite,而ssa卡 上用于w

29、rite cache供电的可充电镍镉电池达到或接近安全寿命的情 况下产生的。这类错误产生将影响IO写性能,并且由于在FastWrite 打开的情况下,主备机需要同步ssa卡上的write cache,所以甚至 会影响到主备机同步。具体解决方法可参考下文。故障排除:对于红色部分错误的问题排除,一般可以使用diag命令进行进 一步诊断:#diag - Task Selection - SSA Service Aids -Link Verification检查环路中是否出现了的盘符或状态不是good 的硬盘 或使用: #smitty ssaraid - List All Defined SSA RA

30、ID Arrays 查看磁盘阵列RAID盘的状态是否是Good。如果 是degrade或其他状态表示RAID盘出现问题了这时候不建议再进行单独硬盘的Certify,而是赶紧通知IBM准备好相同型号和 大小的硬盘(至少两块)到现场进行进一步的诊断和坏盘更换。625E6B9A04 P H ssa0ADAPTER DETECTEDOPEN SERIAL LINK 的排查方法:1、要求将7133中未插硬盘的槽位全部插上dummy盘。(dummy盘:哑元盘,就是那个空壳子,相 当于代替SSA硬盘装在磁盘阵列的塑料模型,当磁盘阵列的16个槽位 没有被SSA硬盘插满时才用到.)2、看看Loop状态:diag

31、Task Selection-SSA Service Aids-LinkVerification.正常Adapter Port下的两列数字是连续不间断的排 列,且Status都为good,如果Physical列有符号.或Status不是 good,则说明已经存在硬盘或链路故障,这种情况则要立即采取行 动,做进一步检查以确定是否要更换硬盘。检查单盘是否有问题的方 法如下:diagTask Selection-SSA ServiceAids-Certify Disk选择认为存在故障的硬盘进行检查3、如果7133存在硬件故障时,可从状态灯上观察到:当单块硬盘出现故障或未被使用时,其面板上的硬盘状态

32、灯会不亮阵列的状态灯黄灯会亮或接SSA线的端口的指示灯也会熄灭如果通过以上三种方法都未发现问题,而系统仍报Open Serial Link错误,建议继续跟踪。26CA120B04 P H ssa0CACHE STORAGECARD的处理方法:背景介绍:IBM小型机上连接7133磁阵所配置的SSA卡一般都带有一块充电电池,该电池用于在突 然停电的情况下保护ssa卡上的fast write cache中的信息不丢失, 这块电池的安全寿命一般是22000小时,差不多两年半的时间,也就 是说,当fast write模式启动的情况下,一般两年半以后需要更换 这块电池。问题表现:对ssa卡上的电池保护是通

33、过卡上的一个计数器实现的,每运行一小时该计数器会增加一,当 该计数接近或超过22000时,系统会有26CA120B硬件报警:26CA120B04 P H ssa1CACHE STORAGECARD可以用如下命令检查ssa卡上的状态:(-a后带上卡的逻辑设备名,这里假设是ssa0)ssa_fw_status -assa0 -p(检查电池已经工作的时间,小时为单位)ssa_fw_status -a ssa0 -l(检查电池安全工作寿命,小时为单位)ssa_fw_status -assa0 -c(检查s sa卡上的fast write功能是否被激活) 处理步骤:(按优选方式列出,从中选择一种即可)

34、1)更换电池选择系统闲时,更换主备机ssa卡电池,可以采用:停备机一更换备机ssa卡电池一起备机(双机服务)一主备倒换一停原主机一更换原主机ssa卡电池一起原主机(双机服务)2)如果系统出现26CA120B电池告警,使用ssa_fw_status -a ssa0 -c检查主用ssa卡(一般 是ssa0)的Fast Write是否处于inactive (未被激活)状态,如果 是,则以root执行如下命令:ssa_format -l ssa0 -berrclear 0/usr/lib/errstop/usr/lib/errdemon可以暂缓更换电池时间,等有电池后再更换,但这段时间对磁阵读写性能会

35、有所影响。 3)如果短期内不能更换电池,同时主机主用卡的Fast Write 仍然处于Active状态,建议手工屏蔽fast write功能1)先停止双机2)在1号机修改hdisk该属性:smitty dev-ssa disks-ssa logical disks-change /show characters of . - choose hdisk2 - fast write no3)在1号机激活卷组varyonvg zxinvg4)在1号机去激活卷组varyoffvg zxinvg5)在2号机上执行smitty dev-ssa disks-ssa logical disks-change

36、/show characters of . - choose hdisk2 - fast write no检查fast write是否已经改为no只要1号机做了 2好机就不用再修改了)6)在2号机上执行rmdev -dl hdisk2cfgmgr-V7)在2号机上执行lspv (查看hdisk2是否已找到)8)然后执行varyonvg zxinvgvaryoffvgzxinvg9)重新启动双机 B4C0061804 P Hssa0RESOURCE UNAVAILABLE而不伴随其他红色标出错误的情况,则通过以下方式排查:可能是hdisk中将enableuser of hot spare5打开了

37、,而实际并没有配置hot spare盘, 可以通过如下方式解决:检查RAID的状态:#smittyssaraidlist alldefined SSA RAID arrays : all are in status good (ssa0 )检查是否配置了 hotspare:list/identify SSA Physical disks-List hotspares : none修改每个ssa卡所配置的hdisk的属性:setenable use of hot spare to no 然后再执行: # /usr/lib/errstop # cp/var/adm/ras/errlog /var/

38、adm/ras/ #/usr/lib/errdemon#errclear 0对于物理硬盘的接法可参考如下说明:(有可能老局未配置hot spare,则连线方法按未配置hot spare盘的个 数计算)分以下几种情况讲述:1)数据盘小于等于6块,建议配置一块hotspare 2)数据盘大于等于8块小于等于10块,建议配置两块hotspare 3)数据盘大于等于12块小于等于14块,建议配置两块hotsparel 数据盘小于等于6块,配置一块hotspare的接线和配置规则:a) 主机A1、A2接磁阵1、8位置;备机A1、A2接磁阵4、5位置 b) 保 证磁阵前排1458硬盘位置一定要插盘,其余的

39、盘可以挑空位插,注意1-4、5-8两侧的数据盘保持轴对称关系插入(如1和8是轴对 称的、4和5是轴对称的)c)没有插硬盘的位置一定要插上dummy盘 d) 做RAID0+1时,考虑到性能问题,请将1-4、 5-8以轴对称方式对应做硬盘镜像,举例如下:ibm对pdisk的排序与实际的物理位置是不同的,所以必须先通过Isdev -C |grep pdisk的方式找出其对应关系并记录下来,如:pdiskOAvailable -P SSA160 Physical DiskDrivepdisk1Available -P SSA160 PhysicalDisk Drivepdisk2Available -

40、P SSA160Physical Disk Drivepdisk3Available -PSSA160 Physical Disk Drive看第三列中间字符中有-01-的字样,表示其物理硬盘位置,以上对应关系表示pdisk0-pdisk3对应的物理槽位分别是前排1548的位置,所以在使用smitty ssaraid做RAID0+1时,需将1 8位置的硬盘(pdisk0/pdisk3)做成 镜像、45位置的硬盘(pdisk2/pdisk1)做成 镜像,所以选择Primary Disks/Secondary Disks 时如下:smitty ssaraid- Add anSSA RAID Arr

41、ay - . .Primary Disks需要选择:pdisk0 pdisk2 - 14槽位的硬盘作为主盘Secondary Disks需要选择:pdisk3pdisk1 - 85槽位的硬盘作为从盘该要求只是从性能考虑,并不增加其他特性。e)hot spare盘插入位置可以找前排8个位置中的空位插入即可。无特殊位置要求,制作方法 如下:使用lsdev -C |grep pdisk方式找出其pdisk号,如pdisk5然 后使用如下方式将其做成hot spare盘。smitty ssaraid-ChangeUse of Multiple SSA Physical Disks-选择 ssa 卡(连

42、接磁阵的 ssa 卡,缺省为 ssa0)-选择作为 hotspare 的 pdisk,如 pdisk6 -NewUse-选择hot spare按回车创建即可l 数据盘大于等于8块小于等于10块,配置两块hotspare的接线和配置规则:a) 主机A1、A2接磁阵1、12位置;备机A1、A2接磁阵8、 9位置 b) 保证磁阵前排18位置插满数据盘,9-12位置 的数据盘和hot spare盘位置可任意。c) 没有插硬盘的位置一定要插上dummy盘 d) 做RAID0 +1时,考虑到性能问 题,请将1-4、5-8以轴对称方式一一对应做硬盘镜像,9-12位置中有数据盘的,将其对应做镜像,其余两块做h

43、ot spare,举例如 下:ibm对pdisk的排序与实际的物理位置是不同的,所以必须先 通过lsdev -C |grep pdisk的方式找出其对应关系并记录下来,如:pdisk0Available -P SSA160 Physical DiskDrivepdisk1Available -P SSA160 PhysicalDisk Drivepdisk2Available -P SSA160Physical Disk Drivepdisk3Available -PSSA160 Physical Disk Drivepdisk4Available-P SSA160 Physical Disk

44、Drivepdisk5Available -P SSA160 PhysicalDisk Drivepdisk6Available -P SSA160Physical Disk Drivepdisk7Available -PSSA160 Physical Disk Drivepdisk8Available-P SSA160 Physical DiskDrivepdisk9Available -P SSA160 PhysicalDisk Drivepdisk10Available -P SSA160Physical Disk Drivepdisk11Available -PSSA160 Physi

45、cal Disk Drive看第三列中间字符中有-01-的字样,表示其物理硬盘位置,以上对应关系表示pdisk0-pdisk11对应的物理槽位分别是 154823769111012 的位置,所以在使用 smitty ssaraid 做RAID0+1时,前面八块盘按1-4、5-8轴对称方式对应做mirror,9-12 中如选择9(pdisk8)/12(pdisk11)位置做mirror 所以选择 Primary Disks/Secondary Disks 时如下:smitty ssaraid-Add an SSA RAID Array - . . Primary Disks选择:pdisk0 pdisk4 pdisk5 pdisk2 pdisk8物理 1 -4,9 槽位Secondary Disks 选择:pdisk3 pdisk6 pdisk7 pdisk1 pdisk11物理8-5,12槽位该要求只是从性能考虑,并不增加其他特性。e)剩余物理位置10(pdisk10)/11(pdisk9)盘做成 hot spare,方法同上 e)步骤 l数据盘大于等于12块小于等于14块,配置两块hots

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号