链路抖动问题的排查与处理.docx

上传人:李司机 文档编号:7212054 上传时间:2024-06-29 格式:DOCX 页数:4 大小:23.94KB
返回 下载 相关 举报
链路抖动问题的排查与处理.docx_第1页
第1页 / 共4页
链路抖动问题的排查与处理.docx_第2页
第2页 / 共4页
链路抖动问题的排查与处理.docx_第3页
第3页 / 共4页
链路抖动问题的排查与处理.docx_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《链路抖动问题的排查与处理.docx》由会员分享,可在线阅读,更多相关《链路抖动问题的排查与处理.docx(4页珍藏版)》请在三一办公上搜索。

1、链路抖动是指物理接口在至少10秒的时间内持续上升和下降,每秒三次或更多次。常见原因通常与电缆损坏、不受支持或非标准电缆或小型封装热插拔(SFP)或其他链路同步问题有关.链路抖动的原因可能是间歇性或永久性的。链路抖动通常是物理干扰,因此要采取相应的方式和步骤来诊断和防止以及解决.问题现象以数据库主机为例,在出现链路抖动时数据库磁盘链路有异常,IO延迟大,影响数据库的访问,生产业务受到影响.出现此问题需要按照架构层次进行排Si,先排查上层操作系统出现的现象,再根据现象进行排直存储、光纤交换机、光纤线缆收发光、光纤模块是否存在问题.问题处理过程操作系统排查在系统中,如使用存储链路抖动或远程数据传输到

2、本地未及时交互完成都可能会出现磁盘busy增高情况,磁盘IO延时会增大,正常情况下磁盘的响应时间应在10身秒以下,操作系统直看到的只是问题的表象,根因需要检查后端的光纤链路、光纤交换机等.以AIX操作系统为例(如图2所示).-copasMnnon-adi8k-Ah2ec-11:31.09-IDlek-Adapter-XZO1INaAebuye*dwritexfexaDlskaJkUpter-TypeIfcs21128.00105.62047.9KB/82175.855VirtualFibreChannelfc01128.08105.62047.9KB/s2047.955VirtualFibre

3、Channel!TOTA1.S2adapters180211.34095.7KB/,4229.7SSTOTA1.(MB/8)-180.0IDisk-ServicetinesandQueuesIDiskServiceReadServiceWriteServiceWaltServQNaltQServQINaneBllll-SecondsBllll-Seconds!ill-secondsHill-secondsSlxeSizerunhdi9c90010.00.50.00.00.00.0bdllr9011111.00.01111.00.00.00.00.0bd*C02150,00.01S06.00.0

4、0.00.00.0图2磁盘响应存储排直排直存储上对应端口的误码情况,排查方法:根据告警信息确认存储端口,如华为存储告警信息是Thelinkbetweentheinitiator(typeFC,identifier010000000c995bl00)ofthehost(namehostname)andthehostport(EngineOzinterfacemoduleA2,portnumberPO)isUnStabIe.表示弓擎。的A2扣卡上PO和FC端口与主机连接不稳定。登录DeViCeManager主界面苜页管理硬件设备“监控控制器管理FC接口模块的操作提示,清除所有FC端口误码统计.如下

5、图3所示:KIfMftD:39RtE失,冷生息一OAA2POEN84X0000.OAA2PlENGoaAH0000OAA2P2EN8M2000OA7P3ENGO&P30000C6BlPOEN861M000006BlPlENGOJ110000CS81P2EN8W20000oeBlP3ENGOJ13000008B2POENGOCg0000OeIABZPloi2.aw三soENGOS210000出Mr图3存储设备管理界面系统运行一段时间(如1小时)后,电新查看告警内容中的端口的线路误码统计”增长情况.若误码增长速度较快,可通过尝试更换该端口对应的线缆.模块单元,甚至改用其他端口来确认误码消除情况。光

6、纤交换机排直排有交换机上的误码增长情况.以博科和SNS系列交换机进行说明,登陆交换机的C1.I命令行,通过C1.I命令StatSdear和porterrshow清除和直看当前误码情况.图4SAN交换机误码统计运行一段时同如1小时诟亚新使用C1.I命令Porterrshow查看端口统计情况.若encin和encout增长速度较快,可通过尝试更换该端口对应的线缆、模块单元,甚至改用其他端口来消除误码.总结在操作系统出现磁盘性能问题后,根据现象检查光纤交换机和存储的误码情况,更换线缆、光纤模块等操作后检查问题是否解决.如检直各项都在正常范围且无硬件告警,说明底层硬件没有问题,可以检查端口流量是否跑满;如端口已经跑满说明业务系统流IR较大,如数据库在跑大的面询,建议可以优化SQ1.和检查索引是否添加等。在底层架构无法进行优化的情况下考虑对上层业务层面进行优化.缓解压力.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号