H3C监控故障信息收集指导手册.doc

上传人:laozhun 文档编号:2400291 上传时间:2023-02-17 格式:DOC 页数:52 大小:1.74MB
返回 下载 相关 举报
H3C监控故障信息收集指导手册.doc_第1页
第1页 / 共52页
H3C监控故障信息收集指导手册.doc_第2页
第2页 / 共52页
H3C监控故障信息收集指导手册.doc_第3页
第3页 / 共52页
H3C监控故障信息收集指导手册.doc_第4页
第4页 / 共52页
H3C监控故障信息收集指导手册.doc_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《H3C监控故障信息收集指导手册.doc》由会员分享,可在线阅读,更多相关《H3C监控故障信息收集指导手册.doc(52页珍藏版)》请在三一办公上搜索。

1、监控故障信息收集指导手册Hangzhou H3C Technologies Co., Ltd. 杭州华三通信技术技术有限公司All rights reserved版权所有 侵权必究目录1信息收集注意事项162监控产品信息收集要点162.1VM定位信息收集要点162.1.1收集asvm、ccvm配置文件和日志162.1.2收集与其他组件交互的信令报文182.1.3获取VM数据库备份文件192.1.4获取操作系统运行状态信息202.1.5收集VM控制块信息222.1.6收集AS、CC服务器内存使用信息232.1.7收集VM程序运行信息(gmon.out文件)242.2VC定位信息收集要点252.2

2、.1收集VC、VM的版本信息252.2.2收集VC的日志和配置文件262.2.3收集VC主机系统信息262.2.4VC上抓取媒体流和信令报文312.2.5VC故障现象抓屏312.3DM定位信息收集要点322.3.1利用脚本收集DM信息322.3.2收集配置和日志信息332.3.3收集DM版本号352.3.4对DMWeb的显示结果进行抓屏352.3.5获取DM程序运行状态352.3.6获取DM配置文件362.3.7使用dmesg命令获取系统启动时的信息362.3.8收集与其他组件交互的信令报文372.3.9收集iscsi信息372.3.10获取IPSAN挂载信息382.3.11获取NAS或ECR

3、挂载MOUNT状态392.3.12获取操作系统运行状态信息402.4IPSAN定位信息收集要点402.4.1收集X-Ray信息402.4.2收集IPSAN管理台各RAID状态的抓图412.5MS定位信息收集要点422.5.1利用脚本收集MS信息422.5.2获取MS配置文件432.5.3收集MS日志信息432.5.4收集iscsi信息452.5.5收集实况、录像转发表信息452.5.6收集与其他组件交互的信令报文和媒体流报文462.5.7获取操作系统运行状态信息472.6ISC、ECR、EC、DC定位信息收集要点482.6.1收集设备的版本信息482.6.2获取快照信息482.6.3获取索引信

4、息492.6.4收集与其他组件交互的信令报文512.6.5DC1001-FF接受报文丢包统计522.6.6ISC、ECR、EC2016、EC3016debug信息。522.7ISC3000系统WEB客户端信息收集要点542.7.1IE版本信息542.7.2控件版本信息542.7.3PC所在操作系统信息552.7.4控件日志信息552.7.5PC上抓取媒体流和信令报文552.8网络设备定位信息收集要点562.8.1交换机配置562.8.2网络拓扑图563监控业务信息收集要点563.1实况业务定位信息收集要点563.1.1现场信息563.1.2信令报文573.1.3媒体流信息573.1.4日志信息

5、573.2回放业务定位信息收集要点573.2.1现场信息573.2.2信令报文573.2.3媒体流信息583.2.4日志信息583.2.5索引信息583.3告警/告警联动业务定位信息收集要点593.3.1告警/告警联动报文流程图593.3.2现场信息593.3.3信令报文593.3.4媒体流报文603.3.5日志信息603.3.6问题定位步骤606.云台控制业务定位信息收集要点617.现场信息6114.信令报文6117.媒体流信息6118.日志信息6122.问题定位步骤6129.设备注册、保活、登录业务定位信息收集要点6230.现场信息6238.信令报文6341.媒体流信息6342.日志信息6

6、348.问题定位步骤631 信息收集注意事项1. 尽可能提供故障设备类型、故障时间、当时操作过程及结果,结果请用抓屏保存成图片。2. 请准确提供各产品的版本号。3. 除端口隔离的编码器之间,需确保系统中各组件的网络互相可达。4. 如能复现故障现象,请在尽量单纯的环境中进行信息收集,例如某摄像头无法正常实况,此时请将其他摄像头的实况、回放等业务关闭,只开启故障摄像头实况,进行抓包等信息收集。5. 所有的抓包操作完成后请停止抓包程序,以免占用空间满后造成设备故障。 6. 与图象质量有关的问题请提供编码格式、码率、帧率、帧间隔、码流类型,可通过管理员版编码器通道煤体流配置界面抓图保存。7. 请提供故

7、障设备在VM管理员版上配置的ID。2 监控产品信息收集要点2.1 VM定位信息收集要点2.1.1 利用脚本收集VM信息rootms8000 home# chmod 777 vmsystemreport.sh rootms8000 home# ./vmsystemreport.sh System report collect completely!Report file: vmsystemreport.tgz2.1.2 收集asvm、ccvm配置文件和日志配置文件保存在/root目录下的asvmcfg.ini cccfg.ini:rootvmserver # cd /rootrootvm2 lo

8、g# ls -l *.ini-rw-rw-rw- 1 root root 79326 Sep 25 16:57 asvmcfg.ini-rw-rw-rw- 1 root root 275028 Sep 17 14:14 cccfg.ini日志保存在/var/log目录下,进入此目录的命令如下:rootvmserver # cd /var/log查看呼叫控制服务器(cc)日志的命令如下(其中cc0XX.log文件数量最多10个):rootvm2 log# ls -l cc*-rw-rw-rw- 1 root root 79326 Sep 25 16:57 cc000.log-rw-rw-rw-

9、1 root root 275028 Sep 17 14:14 ccvmsd.log查看视频监控应用服务器(as)日志的命令如下(其中asvm0XX.log文件最多10个):rootlocalhost log# ls -l asvm*-rw-rw-rw- 1 root root 11431524 Sep 25 16:56 asvm000.log-rw-rw-rw- 1 root root 18874474 Sep 21 11:01 asvm001.log-rw-rw-rw- 1 root root 18874496 Sep 19 09:07 asvm002.log-rw-rw-rw- 1 ro

10、ot root 21268 Sep 8 15:09 asvmsd.log通过SSH工具获取以上AS、CC配置文件和日志文件至本地点击下图红框内快捷键,系统弹出VM服务器文件传输窗口。选择文件所在目录,找到需要保存的文件,直接拖动文件到本地PC的保存目录中即可。2.1.3 收集与其他组件交互的信令报文通过抓取报文并判读,可以迅速准确地完成问题的初步定位,排查设备注册、保活、实况、轮切等基本业务的问题,在VM服务器上,可以通过tcpdump命令完成抓包。抓取除SIP协议报文外所有其他报文的命令如下:tcpdump s 5000 w vm1.cap单域域内Sip报文命令:tcpdump s 5000

11、 i lo port 5060 w sip.cap上下级域间SIP报文命令:tcpdump s 5000 port 5060 w sip.capVMP报文命令:tcpdump s 5000 port 6060 w vmp.captcpdump s 5000 host 192.168.0.1 and port 6060 w vmp.cap命令说明-s:指定每个数据包的大小。默认为68字节。不指定时无法通过vmp的ethereal插件解包。-i:指定监听网口。抓取Sip报文时,需要监听lo即127.0.0.1的回环网口。port:指定监听端口。Sip消息为5060端口,Vmp消息为6060端口。h

12、ost:指定监听主机IP。当确定需要只抓取某个设备信息时,可以通过host字段来过滤。这样的话,抓取的报文文件会精简很多。-w:指定保存文件名称。 注意:抓报文结束后按组合键停止抓包,否则长时间抓包后,报文文件可能太大,导致磁盘存储空间不够,对系统造成不良影响。对于VM5000 由于VM和DM是同一IP,所以抓取VM和DM之间的VMP报文时,命令应为:tcpdump -s 5000 port 6060 -i lo -w DM_vmp.cap2.1.4 获取VM数据库备份文件通过SSH客户端登录VM服务器,进入VM服务器软件安装目录,以VM8000-E1216版本为例):并增加rootlocal

13、host root#cd /home/ VM5000V100R001B01D018”rootlocalhost VM5000V100R001B01D018# tar xzvf mppdbbr.tgz mppdbbr/mppdbbr/introduction to mppdbbr.tgz.docmppdbbr/mppdbbr.shmppdbbr/.change.sedrootlocalhost VM5000V100R001B01D018# cd mppdbbrrootlocalhost mppdbbr# lsintroduction to mppdbbr.tgz.doc mppdbbr.shro

14、otlocalhost mppdbbr# ./mppdbbr.sh What do you want to do? 1.backup2.recovery3.vacuum4.convert(EUC_CN to UTF8)c.cancelPlease have a choice :1Please enter DB address :192.168.18.60 注释:IP需要和现场的实际环境匹配Password: passwdbackup success!备份文件保存在/var/dbbr目录,文件名称为dbbackup.sqlrootlocalhost home# cd /var/dbbrdbbr/

15、 dbbro/ rootlocalhost home# cd /var/dbbrrootlocalhost dbbr# ls dbbackup.sql dbbackup.sqlrootlocalhost dbbr#每日2点系统会自动备份数据库,如发生故障时间不在现场,定位故障时,可将/var/dbbr目录下故障发生时间前和后最近生成的数据库备份文件导出。2.1.5 获取操作系统运行状态信息使用VM脚本定期收集信息通过SSH客户端登录VM服务器,将下面的脚本文件通过SSH工具复制到/var/log目录下。执行命令 crontab -e,会打开vi编辑软件,追加下面一行10 */6 * * * /

16、var/log/getsystem.sh然后保存退出,以上操作可以保证在每天的6:10、12:10、18:10、24:10时获取系统信息,生成文件mpp_system.txt,需要时把/var/log/mpp_system.txt文件取出注意:完成信息收集后执行如下操作关闭定期收集。执行命令 crontab -e,打开vi编辑软件,删除下面一行。10 */6 * * * /var/log/getsystem.sh收集操作系统运行状态信息。通过SSH客户端登录VM服务器,手工输入下文显示命令收集操作系统运行状态信息。l 获取操作系统版本cat /proc/version cat /etc/red

17、hat-releasecat /etc/issuerootlocalhost # cat /proc/version Linux version 2.6.9-42.ELsmp (buildcentosbuild-i386) (gcc version 3.4.6 20060404 (Red Hat 3.4.6-3) #1 SMP Sat Aug 12 09:39:11 CDT 2006rootlocalhost # cat /etc/redhat-release CentOS release 4.4 (Final)rootlocalhost # cat /etc/issueCentOS rele

18、ase 4.4 (Final)Kernel r on an ml 获取操作系统的硬盘使用情况rootlocalhost /# df -hFilesystem Size Used Avail Use% Mounted on/dev/mapper/VolGroup00-LogVol00 66G 7.8G 55G 13% /dev/sda1 99M 3M 82M 14% /bootnone 1014M 0 1014M 0% /dev/shml 获取操作系统的内存使用情况rootlocalhost log# free total used free shared buffers cachedMem:

19、2074864 2033004 41860 0 60524 635752-/+ buffers/cache: 1336728 738136Swap: 2048276 12 2048264l 查看网络信息rootms8000 # ifconfigrootms8000 # routerootms8000 # ethtool eth0l 获取各socket(应用端口号)使用情况rootlocalhost log# netstat lActive Internet connections (only servers)Proto Recv-Q Send-Q Local Address Foreign A

20、ddress State tcp 0 0 192.168.18.60:12000 *:* LISTEN tcp 0 0 192.168.18.61:4000 *:* LISTEN tcp 0 0 192.168.18.60:4000 *:* LISTEN tcp 0 0 *:netbios-ssn *:* LISTEN tcp 0 0 *:sunrpc *:* LISTEN l 获取进程CPU占用率rootlocalhost log# ps aux将显示结果复制到文本文件中。2.1.6 收集VM控制块信息 TELNET登陆AS服务器(端口号为4000),密码为superuser,收集AS服务控

21、制块信息。C:telnet 192.168.18.60 4000display asvm stat cm ccbdisplay asvm stat rm ccbTELNET登陆CC服务器(端口号为4000),密码为superuser,收集CC服务控制块信息。C:telnet 192.168.18.61 4000 display ccb-busy vrm display ccb-busy cm将上述命令的输出结果复制到文本文件中。2.1.7 收集AS、CC服务器内存使用信息 以CC服务为例,AS服务收集过程与CC一致。登陆CC :telnet CC地址 4000 sysSystem View:

22、return to User View with Ctrl+Z.ccserver_hNow you enter a hidden command view for developers testing, some commands mayaffect operation by wrong use, please carefully use it with our engineersdirection.ccserver-hidecmddis memorySlice Memory Usage:Block Size 32 Free 563 Used 9869 Total 10432Block Siz

23、e 64 Free 214 Used 4645 Total 4859Block Size 128 Free 16 Used 1275 Total 1291Block Size 256 Free 3 Used 574 Total 577Block Size 512 Free 86 Used 49 Total 135Block Size 1024 Free 21 Used 49 Total 70Block Size 2048 Free 96 Used 170 Total 266Block Size 4096 Free 86 Used 58 Total 144-Summary-Used(Byte)

24、1584224 Free 1085 Used 16689 Total 17774Total Slice Allocated Size: 2911104 bytes Used Ratio: 54Total Slice Memory(Include Control Data and Free Slice): 2911104 bytesRaw Slice Memory Usage: Total Used Size: 317585432 bytes Num: 142 Total Raw Slice Size (Include Control Data and Free Slice): 31783716

25、8 bytes Used Ratio: 99System Total Memory(bytes): 536856096将上述命令的输出结果复制到文本文件中。2.1.8 收集VM程序运行信息(gmon.out文件)注意:收集该信息会导致MPP进程重启,请选择使用l 生成AS进程的程序运行信息使用telnet AS服务器IP 4000端口的方式登录至as服务器。例如:telnet 192.168.112.195 4000需要输入密码:superuser登录后,输入 sys 命令进入系统视图。输入 _h命令进入隐藏视图。输入命令 dis mem m 200 200 。该命令会导致 AS服务在1分钟之

26、内重启,重启之后在服务器上的/root目录下生成一个名字为gmon.out的文件。请确认一下该文件的生成时间,应该和当前时间相差不大,该文件改名为as_gmon.out。l 生成CC进程的程序运行信息使用telnet CC服务器IP 4000端口的方式登录至CC服务器;例如:telnet 192.168.112.196 4000需要输入密码:superuser。登录后,输入 sys 命令进入系统视图。输入 _h命令进入隐藏视图。输入命令 dis mem m 200 200 该命令会导致 CC服务在1分钟之内重启,重启之后在服务器上的/root目录下生成一个名字为gmon.out的文件。请确认一

27、下该文件的生成时间,应该和当前时间相差不大,将该文件改名为cc_gmon.out;2.2 VC定位信息收集要点2.2.1 收集VC、VM的版本信息点击VC管理员版或用户版菜单项帮助关于,在弹出显示窗口后按组合键可显示内部版本号,可截屏后保存为JPG文件。2.2.2 收集VC的日志和配置文件故障发生后,进入VC安装目录,将log目录压缩后保存。安装目录下VC.exe.config文件为用户版配置文件,请保存。如果无法压缩拷贝,请退出VC后再进行如上操作。2.2.3 收集VC主机系统信息l VC的机器配置点击开始运行,在弹出窗口中输入dxdiag,开启DirectX诊断工具,在DirectX诊断工

28、具中点击按钮,然后赋予要保存的文件名并保存。l 使用IPSAN备份工具下载故障问题时录像使用录像备份工具下载一段故障发生时段的录像。1. 运行MPTools工具。2. 点击按钮,进入IPSAN备份界面。3.进入无法下载的录像所对应编码器的WEB页面,将三行IP SAN参数填入IP SAN备份工具配置界面。EC1001页面:EC2004-HF页面:4.点击按钮,选择VC无法下载录像的时间段主索引时间。5. 点击按钮,输入文件名,确定后开始下载录像,直至下载结束,文件下载完后发回。6. 如果MPTools无法正常使用,请收集MPTools程序的LOG目录下的日志。l VC主机的CPU、内存、进程信

29、息右键点任务拦选择任务管理器,在进程、性能页面收集CPU、内存、进程信息,其中进程信息可以点击红框处按照CPU或内存使用率排列。右键点击Windows任务管理器,选择性能选项,抓屏保存为图片。选择进程选项,抓屏保存为图片。2.2.4 VC上抓取媒体流和信令报文VC主机安装Wndows版本Ehreal软件,一旦VC上的操作结果异常,可在VC上抓包,并保存成文件。2.2.5 VC故障现象抓屏故障现象发生时,通过按PC键盘键抓屏保存故障现象和各种提示信息,有时提示信息显示在右下方,请双击弹出提示信息后再抓图,示例见下图。2.3 DM定位信息收集要点2.3.1 利用脚本收集DM信息使用脚本收集DM主机

30、信息后,然后在DMWebUI上导出日志和配置,基本上能满足问题定位的需求。采用SSH工具上传以上脚本到DM的home目录。修改dmsystemreport.sh的可执行权限,命令为:chmod 777 dmsystemreport.sh执行脚本,命令如下:rootms8000 home# ./dmsystemreport.sh System report collect completely!Report file: dmsystemreport.tgz通过SSH工具将home目录中的dmsystemreport.tgz文件导出。2.3.2 收集配置和日志信息登录DM的WEB页面,在日志管理/

31、日志导出页面导出故障期间的日志。录DM的WEB页面,在系统管理/配置管理页面导出配置文件。也可以通过登陆SSH导出日志文件,日志保存在/var/log目录下,包含debug日志、系统日志、操作日志等多种日志:查看DM的debug日志: rootlocalhost # cd /var/logrootlocalhost log# ls -l debug*-rw-r-r- 1 root root 2638368 Oct 10 13:54 debug000.log-rw-r-r- 1 root root 0 Oct 10 09:35 debug001.log-rw-r-r- 1 root root 0

32、 Oct 10 09:35 debug002.log查看DM的系统日志、操作日志、告警日志:rootlocalhost log# ls -l syslog000.log oper000.log alarm000.log-rw-r-r- 1 root root 21060 Oct 10 14:02 alarm000.log-rw-r-r- 1 root root 627 Oct 10 13:58 oper000.log-rw-r-r- 1 root root 24473 Oct 10 14:10 syslog000.log查看操作系统日志、数据库日志、安装日志、数据库清理日志:收集message

33、s文件,一般将几个messages文件都收集下来:messages.1、messages.2,操作系统记录messages文件,一般最多一周会换一个文件。rootlocalhost log# ls messages*messages messages.1 messages.2 messages.3 messages.4 messages.bakrootlocalhost log# ls l pgsql.log install.log vac0.log-rw-r-r- 1 root root 43711 Oct 10 09:35 install.log-rw-rw-rw- 1 root root

34、 1408201 Oct 10 10:25 pgsql.log-rw-r-r- 1 root root 226842 Oct 10 03:01 vac0.log可以通过SSH工具获取以上日志文件至本地。2.3.3 收集DM版本号rootlocalhost home# rpm -qa |grep DMDM-2.17.3-1复制以上内容到文本文件中保存。2.3.4 对DMWeb的显示结果进行抓屏DM故障时对WebUI显示结果进行抓屏,比如:制定计划失败、摄像机显示故障等。2.3.5 获取DM程序运行状态执行dmserver.sh status获取DM各进程运行状态rootlocalhost hom

35、e# dmserver.sh statusiscsid is runningpgsql is runninghttpd is runningsnmptrapd is runningdmserv is runningdmsnmp is runningdmlogd is runningdmd is runningdmbackup is runningdmdevman is runningdmautobak is runningVM5000也可以执行vm5000server.sh status获取DM和VM各进程运行状态rootlocalhost home# vm5000server.sh stat

36、usiscsid is runningpgsql is runninghttpd is runningsnmptrapd is runningassd is runningccsd is runningdmserv is runningdmsnmp is runningdmlogd is runningdmd is runningdmbackup is runningdmdevman is runningdmautobak is running将显示信息保存到文件中。2.3.6 获取DM配置文件用浏览器登录DM的WEB页面,在系统管理 配置管理页面导出DM的配置文件2.3.7 使用dmesg命

37、令获取系统启动时的信息rootlocalhost log# dmesg /home/dmesg.txtSSH获取/home/dmesg.txt2.3.8 收集与其他组件交互的信令报文通过抓取报文并判读,可以迅速准确地完成问题的初步定位。在DM服务器上,可以通过tcpdump命令完成抓包。抓取所有报文命令:tcpdump s 5000 w dm.cap分类报文抓包,抓VMP报文:tcpdump s 5000 port 6063 w vmp.cap命令说明:-s:指定每个数据包的大小。默认为68字节。不指定时无法通过vmp的ethereal插件解包。-i:指定监听网口。抓取Sip报文时,需要监听l

38、o即127.0.0.1的回环网口。port:指定监听端口。Sip消息为5060端口,Vmp消息为6063端口。host:指定监听主机IP。当确定需要只抓取某个设备信息时,可以通过host字段来过滤。这样的话,抓取的报文文件会精简很多。-w:指定保存文件名称。 注意:抓报文结束后要停止抓包,否则长时间抓包后,报文文件可能太大,导致磁盘存储空间不够,对系统造成不良影响。2.3.9 收集iscsi信息rootlocalhost # cd homerootlocalhost home# iscsi-ls iscsi.txt通过SSH工具获取/home/iscsi.txt文件至本地。执行以下命令获取sc

39、si进程运行状态rootlocalhost home# ps aux|grep scsiroot 319 0.0 0.0 0 0 ? S Nov06 0:00 scsi_eh_0root 328 0.0 0.0 0 0 ? S Nov06 0:00 scsi_eh_1root 8511 0.0 0.0 3444 420 ? Ss Nov12 0:00 /sbin/iscsidroot 8514 0.0 0.0 3452 444 ? S Nov12 0:00 /sbin/iscsidroot 8516 0.0 0.0 0 0 ? S Nov12 0:00 scsi_eh_19root 8517

40、0.0 0.0 0 0 ? S Nov12 0:00 iscsi-txroot 8518 0.0 0.0 0 0 ? S Nov12 0:03 iscsi-rxroot 13094 0.0 0.0 4124 664 pts/2 S+ 11:13 0:00 grep scsi将上述命令的输出结果复制到文本文件中。2.3.10 获取IPSAN挂载信息rootlocalhost proc# cd /procrootlocalhost proc# more partitions major minor #blocks name 8 0 71687372 sda 8 1 69633711 sda1 8 2 2048287 sda2 8 16 317715456 sdb 8 32 679474176 sdc 8 48 1358951424 sdd 8 64 23065600 sde

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号