《NMC监控工具使用指南及应用案例.doc》由会员分享,可在线阅读,更多相关《NMC监控工具使用指南及应用案例.doc(76页珍藏版)》请在三一办公上搜索。
1、 NMC监控工具使用指南及应用案例概述2系统要求3架构4部署5部署环境(以NCWAS垂直集群为例)6部署步骤6进程监控13功能概述13MW-XX的监控13DB-XX的监控16线程监控19功能概述19线程信息说明21监控设置22汇总显示24显示过虑25联查操作员26联查数据库27数据库27功能概述27监控客户端功能27CPU监控31功能概述31监控客户端功能31内存监控31功能概述31监控客户端功能32日志抽取32功能概述32NC客户端日志级别设置32日志数据库33NCLOG日志抽取35抽取JVM日志40抽取CPU42抽取内存日志44监控消息和快照信息日志46操作员信息47消息中心48功能概述4
2、8监控客户端功能50安全设置52功能概述52监控客户端功能52参数设置53功能概述53监控客户端功能53应用案例一54OVERVIEW54进程监控54线程监控56日志抽取58DB-监控62消息中心62应用案例二 某项目时常出现有几分钟登录不了NC67问题描述:67问题分析:67问题解决方案:75概述对于NC这样一个复杂庞大的系统而言,监控体系非常重要而且富于挑战性。主要表现如下几点:1.NC是多层架构的系统,涉到到客户端,网络,操作系统,中间件,数据库.系统可能出现在任何一点出现异常。2.缺乏离线分析定位的能力。大量的问题只能通过问题再现等方式在线定位。这就要求客户配合,可能还要反复的搭建环境
3、。效率低下,限制多多。3.有很多问题只有专家级的人才能定位。对于不非常了解系统的管理员不知如何下手。4.日志作为分析问题很重要的部件,但其数量庞大,分析起来费时费力,不得要领。5.系统缺乏自我纠正的能力。某个服务器一旦出现问题,比如长时间不响应,只有客户报告后,逐个端口检查一遍才能确定那个服务器有问题, 而且只能管理员手工解决。6.缺乏系统评估的客观数据。对于系统的吞吐量,cpu,内存,并发量,每次远程调用的性能指标等缺乏必要的客观数据。7.监控目标繁多,缺乏统一集成的监控平台。 . 其重要性表现为:1.好的监控系统可以快速发现,定位问题,大幅度降低维护成本,提高管理效率,提高客户满意度。2.
4、在测试阶段,可以快速的发现并定位问题,提高产品质量。3.提供系统自我恢复能力。提高系统可靠性.对于上述问题,nmc智能监控系统主要提供如下特性:1.提供一种集成的监控界面。涵盖了作为问题关注者需要关注的各个方面。使用者可以从多个角度对系统监控和分析。2.提供一种端到端的监控体系。监控可以从客户端到应用服务器到数据库都可以无缝监控。3.各个层次可以相互穿透.追踪整个操作流程.进程可以穿透到线程,线程可以穿透到数据库,数据库可穿透到线程。各个层次的部件可以相互穿透。客户端端可以主动录制自己的操作日志。操作日志本身就提供了多层次的数据。以远程调用为核心,提供服务器端的性能统计,可以联查到客户端的远程
5、调用堆栈,可联查数据库的操作及性能统计。4.支持插件的可扩展架构,基于服务中心模型集群架构只要满足客户端或者服务器端的规范的插件就可以很容易地集成进来。监控服务可以部署到任何一个服务器上,一个监控域可以同时监控多个服务器。在一个监控域内,所有的服务和配置都统一管理,统一发布。大大提供系统的可监控性和可管理性。5.主动监控系统提供了一种消息机制。任何监控插件都可以在系统异常情况下可向服务中心发送消息。消息中心根据每个服务的配置对消息进行报警或者生成快照。这些报警信息或者快照可以通过短信或者邮件通知管理员。管理员利用这些消息可快速采取措施。6.主动管理,自我纠正系统提供了一种机制,监控到系统处于不
6、健康的状况对系统进行管理。管理的动作是可以配置的。比如,自动重启,或者生成dump.系统还提供了n+1standby的支持。即有一个standbyserver,在某个server重启时,替换此server继续工作。7.强大的日志抽取和分析能力可用非常灵活的条件对多个服务器上的日志抽取。包括nc日志,jvm,cpu,memory等日志。并且提供了大量的日志分析脚本来分析日志。操作员也可主动录制自己的操作日志。可将日志打包后发给相关人员进行分析。8.同时支持实时监控和事后分析。9.采用监控服务提供的安全机制,不用泄漏目标系统的安全信息。系统要求1数据库监控的脚本包括客户端的一些性能监控脚本目前只是
7、支持oracle9i及以上版本。架构 名词解释:监控域:指向同一个服务中心的一组监控进程,这些监控进程可以分布在多个物理服务器上。服务中心(Service Center) :用于注册监控域内所有的服务和资源,同时提供服务启动控制、访问日志、服务请求路由、安全检查、动态参数刷新功能。一个监控域内有且只有一个服务中心,所有的监控进程必须指定到一个已经启动的服务中心。插件说明:后台服务以服务插件的形式提供,配置文件conf/service.xml定义了服务中心地址,服务的属性。包括服务名、是否启动、是否需要安全检查、是否域内唯一、消息处理方式、快照项目。新开发的服务可以直接在service.xml注
8、册。服务启动引擎根据服务配置启动服务,每个服务启动后会向服务中心注册。客户端通过访问服务中心可以把可以访问的服务资源下载到本地。客户端同样采用了插件式的架构,通过配置文件conf/resource/resource-client.xml配置每个服务对应的客户端UI。每个监控域的信息都保存在conf/resource/domain.xml文件中,每次启动客户端会自动连接domai.xml文件中的监控域。 服务中心提供了一种简单的安全机制。管理员可以配置一个用户名和密码。需要安全保护的服务需要通过这个认证才可以被访问。比如数据库,只有通过了安全检查服务的认证才能对数据库操作。部署典型部署图(推荐)
9、: 典型模式是 监控服务中心部署在NC的服务器上,监控服务也同时部署在NC的服务器上。独立部署模式:Monitorserver可以部署到一个独立服务器上,但这样不能监控NC Server的NCLOGS、CPU和内存,同样也不能抽取NC Server的NCLOGS,CUP和内存的日志。部署环境(以NCWAS垂直集群为例)ServerHost10.10.71.156服务节点master、ncMem01、ncMem02应用代码目录D:ufsoftnc56APACHE目录D:IBMHTTPServer中间件was6.1.0.11.DM server启动在10.10.71.156,管理端口为8879数据
10、库ORACLE10G部署步骤1:配置服务中心:在server上启动D:ufsoftnc56nmc serverconfigure.bat,设置service center,。这里将服务中心设置为10.10.71.156,管理员默认为admin,密码为admin,端口9999为系统默认,尽量不要改,如果改为其他端口,需要同时改D:ufsoftnc56nm6serverconfserver.xml文件修改对应的端口。 同时修改%nchome%/resources/monitor.properites对应的端口。Local Server中的host可以设置为127.0.0.1或本机的IP地址10.1
11、0.71.156。D:ufsoftnc56nmcserverconfigure.bat命令的运行界面如下:说明:运行configure.bat命令需要设置JAVA_HOME: set JAVA_HOME=JDK存放的目录, 如:set JAVA_HOME=././ufjdk 或set JAVA_HOME=D:ufida502nchomeufjdk同样,其它命令,如startmonitor.bat, MonitorConsole.bat等也需要同样的设置。 如果是水平集群,则在从服务器上运行.nmcserverconfigure.bat命令,需要将Server Center中 Host项的值,设
12、置为主服务器的IP地址如:10.10.71.156. Local Server中的host项的值是从服务器的IP地址 如 10.10.71.157 或127.0.0.1注意:Unix如果服务器操作系统无法启动图形界面,可以直接修改配置文件nmcserverconfservices.xml。配置监控安全管理员,可以通过命令securityset.sh修改。2:设置WAS DM服务器,在D:ufsoftnc56nmcserverconfigure.bat的运行界面上的属性配置(monitor.properites)的tab页中修改属性nodeagenthost,nodeagentport。如果不是
13、WAS中间件,则将nodeagenthost设置为空。 如果monitor server监控工具安装在单独的一台机器,则同样需要nodeagenthost设置成集群中WAS DM服务器的IP地址。如果是单个server,没有dm,nodeagent,则查看这个server对应的serverindex.xml或者通过管理控制台,得到SOAP_CONNECTOR_ADDRESS。将nodeagentport设置为这个端口。默认应该是8880。 3:确保D:ufsoftnc56ierpbinprop.xml文件的配置和实际环境的配置相同.特别是中间件为websphere的情况下,prop.xml可能
14、会存在和实际环境不同的情况,因为监控工具通过读这个文件来获取中间件和数据库的信息,所以,必须要确保这个文件的配置和真实环境的配置相符(包括中间件,数据库,web server ).可以通过ncsysconfig.bat对环境配置。 另外,如果上图中的propfile的值不是相对路径././ierp/bin/prop.xml,是指定的绝对路径,则需要用作为分隔符 如 d:monitornc56okierpbinprop.xml,否则启动时会提示找不到文件。特别说明:(1)如果在WAS管理控制台中更改了单个Server或者集群中某个成员Server的端口,一定要在NC的prop.xml文件中修改该
15、对应的端口。否则在NC5.5监控工具的客户端,将会检测不到该端口对应的Server信息。 WEB服务器的地址也要配置,不能为空。如下图(2)如果是数据库是RAC环境,需要prop.xml文件中将数据源拆分成两个针对单个实例的数据源.这样可以保证做快照和数据库检查的性能. 但是,部署时需要用原来的数据源。比如: jdbc:oracle:thin:(DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=10.12.167.11)(PORT=1521)(ADDRESS=(PROTOCOL=TCP)(HOST=10.12.167.12)(PORT=1521)(LOAD_BA
16、LANCE=yes)(CONNECT_DATA=(SERVER=DEDICATED)(SERVICE_NAME=ncdata)改成:dbsource11. jdbc:oracle:thin:10.12.167.11:1521:ncdata. dbsource12jdbc:oracle:thin:10.12.167.11:1521:ncdata.4:消息自动发送邮件的功能邮件配置:邮件服务器(SMTP)可以是任何有效的邮件服务器,如但是,帐号和密码填写针对“发送邮件服务器”有效的帐号和密码。 邮件发送的地址: 在下面属性配置页签,配置消息自动发送到的邮件地址。说明: 邮件发送的地址是填写 任何有
17、效的邮件地址。如: xxx或 xxx 5:在server上启动D:ufsoftnc56nmcserverstartmonitor.bat如果是水平集群,则主服务器启动后,再在从服务器上对应目录运行startmonitor.bat6:启动客户端.可以直接访问http:/10.01.71.156:9999/nmc/client.exe下载客户端。也可以将D:ufsoftnc56nmcclient拷贝到任意一个客户端机器.执行D:ufsoftnc56nmcclientmonitorconsole.bat, 第一次执行在没有监控域的情况下,需要添加监控域, 监控域名称任意,服务中心地址为:10.10.
18、71.156,端口9999,用户名admin,密码xxxxx,(都是在步骤2中配置的)。说明:启动monitorconsole.bat需要设置JAVA_HOME, 如set JAVA_HOME=D:ufida502nchomeufjdk7. 如需要通过代理(192.168.8.108:8080)访问远程的监控服务:monitorconsole.bat增加参数:-DproxySet=true -DproxyHost=192.168.8.108 -DproxyPort=8080 启动后提示如下:需要增加监控域域名可以随意写入NC某项目或10.10.71.156,服务中心地址必须写服务中心(Serv
19、ice Center)的IP地址:如 10.10.71.156 启动后的客户端如 注:进入上图方式:选择一个监控域,工具-overview,或者第一次登陆到监控系统的第一个页面,提供一种整个监控系统的概要信息。主要功能: 1.展现整个系统的部署方式.包括apache,中间件,数据库.2.动态显示中间件的和数据库的性能指标.中间件动态柱状图显示jvmheap信息,和web线程信息,数据库柱状图显示数据库活动会话的个数.如: 鼠标点中上图的ncMem02图标,会自动显示该成员的信息如下: 3.报警.如果某个server有报警信息,则相应的服务器会变红,鼠标点上去会显示报警信息.4.服务器端主要的配
20、置文件: (1)安全设置:Monitor/server/conf/security.properties,用于设置对需要安全验证的服务访问的权限用户(2)服务配置:monitor/server/conf/services.xml: (3)各种监控参数配置:monitor/server/conf/monitor.properties 进程监控功能概述进程监控服务主要实现如下功能:1:定时对中间件状态检查,包括端口响应的时间和内存使用的情况,如:当发现中间件不能正常工作,则可以对其自动重启。2:定时将jvm heap的使用情况和中间件webthread,serivcethread信息写入日志,通过
21、日志抽取和分析的功能可以对系统进行性能评估和性能诊断。3:定时更新数据库连接池的信息和数据库活动会话的信息。4:如果是WAS中间件,提供对中间件的管理功能,比如重启,生成javacore,heapdump,设置定时重启等。通过上面的进程监控功能,可以获取NC服务的运行状态、Webcontainer线程池的大小、当前远程调用线程数、当前后台服务的线程数、Jvm heap的max值 、Jvm heap当前的free值、Jvm heap used值、数据库连接池的大小、数据库的活动会话数等,同时根据需要直接在监控工具中定时、关闭和启动NC服务等。MW-XX的监控客户端功能: 定时获得某个中间件的概要
22、信息,包括部署信息和性能信息等。自动刷新设置:设置自动获取服务器信息的频率.可以及时获取最新信息。自动刷新设置后,会有对应于每个中间件的折线图.可以直观的看到每个中间件的内存使用情况.如果使用自动刷新功能,需要先设置,如:点击”自动刷新设置”,弹出对话框,然后设置自动刷新的时间如5秒等,确定后即可。设置自动刷新的秒数间隔: 在进程监控中,可以对NC服务进行启动、停止、重启、定时等。启动:启动选择中间件。停止:停止选择的中间件。重启:重启选择的中间件。定时:为选择的中间件设置定时重起。必须先重起master。打补丁如果需要重启中间件, 可以利用这个功能轮循启动中间件.Dumpthread:对选择
23、中的中间件手工生成Dumpthread。DumpHeap: 对选择中的中间件手工生成DumpHeap。选中上面的任何一行,如ncMem02所在的行,然后双击,则弹出下面的对话框:上图中的字段解释如下:字段说明服务名中间件名称状态有三种状态:Running/down/starting主机中间件服务器地址端口中间件端口重启定时定时重启,可以通过右键或者管理-定时设置Web线程池Webcontainer线程池的大小Web线程当前远程调用线程数服务线程当前后台服务的线程数Jvmmax(m)Jvm heap的设置(max)Jvmtotal(m)Jvm heap当前的total值Jvmfree(m)Jvm
24、 heap当前的free值Jvmused(m)Jvm heap used上次端口检查耗时最近一次端口探测的响应时间可管理如果启动was dm,则为true,否则为false.可管理意味着可以远程对中间件进行启动,关闭,生成HEAPDUMP、THREADDUMP.当监控服务发现中间件不响应时,可以根据监控服务配置的管理策略对其自动重启.如果不能管理,则意味着只能做监控.DB-XX的监控客户端功能: DB-XX的监控包括数据库连接池的信息和数据库活动会话的信息等信息。选中上面的任何一行,如ncv55所在的行,然后双击,则弹出下面的对话框,上图字段说明:字段说明数据源数据源名称数据库类型数据库类型连
25、接字符串数据库的jdbc 连接串连接池大小显示为default-max.连接池已用在对应的中间件连接池中有多少连接为使用状态.dbActiveSessions数据库的活动会话数最近检查时间最近进行数据库健康检查的时间同样选中上面的任何一行,如nc56所在的行,然后在工具栏中点击“查询”可以切换到对数据信息进行跟踪的界面. 如下图监控下拉列表中可以看到: 可以查看的数据库信息。可以在nmcclientconfsqlfixsql.cfg,中看到每个查询对应的SQL。 如 选择 监控 下拉列表中的“数据库文件的使用情况“ ,下图中就是查询的结果. 另外,也可以在DB-ncv55中直接写SQL语句,点
26、击工具栏中的“执行”按钮,即可执行自己写的SQL. 如下面是查询NC产品版本信息的SQL。 线程监控功能概述 线程监控包括调试模式的设置,实时线程信息的跟踪,穿透到数据库,联查操作员信息,每个线程的性能统计信息等。 通过这些信息,可以知道线程中SQL的执行时间、从数据库中读取数据到应用服务器的时间、数据从应用服务器传到客户端的时间、发起远程调用的操作员及IP、线程的堆栈、SQL的堆栈等. 这样就可以判断出是个哪个SQL运行耗时,时间是耗在网络上还是数据库读取上,是哪个操作员正在执行的业务,从而可以从业务、网络或SQL上进行优化。线程监控ALL是查看所有中间件的线程。 线程监控某个具体的服务,如
27、ncMem02是只查看ncMem02上的线程. 线程监控图选中上面的任何一行,如ncMem02所在的行,然后双击,则弹出下面的对话框,可以看到详细的线程信息。 在下面的线程信息说明中对每个字段有详细描述。线程信息说明线程信息说明:字段说明服务全局模式下中间件的名称线程名称线程名称线程状态当前线程状态当前事件当前线程正在做的事件性能统计当前线程到当前的性能统计.耗时当前线程运行到目前的执行时间远程调用方法远程调用方法客户端地址发起远程调用的客户端地址操作员发起远程调用的操作员主键操作员编码发起远程调用的操作员名称操作员名称发起远程调用的操作员名称.性能统计说明:字段说明sqlcosttime当前
28、线程所有SQL的执行时间(不包括fetch 结果集)readresulttime当前线程fetch 结果集的总时间readrownum当前线程共fetch了多少条记录.writetoclienttime当前线程写数据到客户端的时间(网络耗时)writetoclientbytes当前线程写到客户端的总字节数notclosedconnectioncount当前线程没有关闭的数据库连接数线程SQL堆栈说明:字段说明Sql第一条为统计信息,包括sql执行数量总计sql执行时间总计(不包括fetch结果集);占用数据库连接数总计.执行状态有两种状态,running|finished耗时Sql执行时间数据
29、库连接执行sql的数据库连接ID.数据源执行SQL的数据源名称.线程Thead堆栈说明:目前的线程事件:1.获取数据库连接2.sql翻译3.执行sql.4.调用EJB5.序列化6.往客户端写数据7.调用master8.线程到数据库的映射9回滚,提交监控设置1:全局调试开:除服务线程外的所有的线程默认都是调试模式.2:全局调试关:所有的线程默认都不是调试模式.3:选择调试用户:将选择的用户的远程调用设置为调试模式. 此时全局模式自动为关闭状态.4: 取消用户调试:取消用户调试模式.5:服务线程调试开:在全局模式为开的情况下,服务线程处于调试状态.6:服务线程调试关:服务线程设置为非调试状态.*监
30、控时,一般不需要Debug模式。只有在的确需要数据库和线程关联起来分析时才用。关于调试模式的说明:一个线程如果是调试状态,则:1:这个线程的所有的数据库操作都会将线程信息映射到数据库.打开全局调试开的方法: 监控设置全局调试开如,设置全局调试开后,线程监控界面的“调试模式”显示为是。下图红色部分。将用户设置成调试模式方法如下:监控设置选择调试用户: 弹出如下对话框“选择用户对话框”。选中y1用户,确定后,下图中蓝色行对应的调试模式为“是”。汇总显示将客户端显示的所有服务器的所有的线程信息,包括SQL堆栈和线程堆栈显示在汇总显示.如下图中WebContainer:5 ,拖动右边滚动条可以看到We
31、bContainer:6等。SQL堆栈和线程堆栈的说明,在线程信息说明中有详细的介绍。显示过虑设置当前客户端显示的线程信息的条件.目前有如下过虑条件:线程耗时,操作员编码,操作员名称,客户端地址,服务.默认情况下不显示服务.联查操作员联查当前操作员更加相信的信息(来自于bd_psnbasdoc).点击工具栏中的”联查操作员”,在下图中选择对应的数据库然后就可以看到该操作员的如下信息:联查数据库a)如果当前的线程事件是执行一个SQL,则联查数据库,直接可以看到当线程在数据库端的状态.包括其执行计划。b)在数据库端,可以直接将对应的会话kill掉,从而将中间件的线程kill掉.连查询数据库方法同连
32、查操作员方法.连查到数据库后的界面,同 DB-XX中的“查询”按钮功能. 数据库功能概述1.提供一组数据库健康检查的服务.当发现数据库有性能问题时,发送快照或者报警消息.2.提供客户端可以调用的数据库操作方法.监控客户端功能监控服务根据配置好的监控脚本对数据库进行实时监控.同时客户端预制了大量的性能监控脚本.对数据库的监控变得非常简单.1.预制了一些常用的用于性能监控的脚本.如果要增加其他性能监控脚本,直接修改client/conf/sql/fixsql.cfg即可.2.执行SQL: 在SQL文本区选择要执行SQL的SQL,在工具栏中点执行按钮。3.根据sql执行的结果集,可能穿透到其他结果集
33、.比如,根据会话信息,可以联查对应的SQL,通过SQL结果集,可以联查到对应得执行计划.4.对于结果集可以导出到sql/xml/文本.在左边树型结构中,选中 数据库 下对应的数据源,如 ncv55,双击后会在右侧弹出对话框,然后在工具栏中:监控下拉列表中可以看到可以查看的数据库信息. 如 选择 监控 下拉列表中的“数据库文件的使用情况“ ,下图中就是查询的结果. 也可以在DB-ncv55中直接写SQL语句,点击工具栏中的“执行”按钮,即可执行自己写的SQL. 如下面是查询NC产品版本信息的SQL。 查看SQL执行计划的方法:工具栏中“监控-长时sql”, 如下图查询出比较耗时的SQL,然后选中
34、,右键即可显示出该SQL的执行计划。看某执行SQL的执行计划CPU监控功能概述1.实现了对各种平台的cpu的监控.定时将cpu的运行状态写入日志,便于日后性能分析。2.当发现某CPU持续高于某阀值,则发送报警消息。监控客户端功能 对服务器端CPU的监控。自动刷新设置:设置CPU性能数据的自动刷新频率.内存监控功能概述日志监控服务对服务器内存进行定时监控.并将内存信息写入日志,便于日后对性能进行分析。监控客户端功能 服务器端内存监控.日志抽取功能概述将NC的日志和监控服务产生的日志(比如:NCLOG,CPU,JVM,内存日志)抽取到本地数据库.同时提供一个客户端的工具,对本地的日志进行分析.NC
35、客户端日志级别设置服务器端的日志输出级别可以根据特定的用户来绑定.如用户A可以把自己的日志输出级别设置为DEBUG, 这样用户A的所有后台操作的日志输出级别都是DEBUG.无论后台的日志默认级别是什么.客户端设置后台日志级别的方法:登陆到NC桌面后,点击右上角的日志,弹出一个日志对话框,设置remote log level.注意: 调试完毕后将它设置成为后台默认的日志级别模式!日志数据库日志数据库一个嵌入式数据库,是存储从NC日志、CPU、内存等抽取的日志信息。数据可以通过抽取的方式获得,也可以通过导入的方式获得。如 工具栏中: 工具日志数据库 即转换到日志数据库界面。此工具可以对日志数据库进
36、行分析,可以写各种SQL来分析,默认提供了一些常用的脚本。其他脚本可以根据需要通过修改配置文件monitor/client/conf/sql/logsql.cfg来完成。双击上面查询出的结果的任何一行,可以看到相应的信息,如下:日志客户端的一些配置文件:Monitor/client/conf/sql/logsql.cfg:默认的日志分析的sql.Monitor/client/resource/logdb.xml,日志数据库的配置文件,包括日志数据库的信息,和一些默认的表DDL.Monitor/client/logdb/logdb.mdb:默认的日志数据库.NCLOG日志抽取 NCLOG日志抽取
37、是从NC的日志目录nclogs目录中抽取的,抽取的内容包括NC的报错信息,远程调用信息,statement信息,执行方法信息等。抽取的详细信息见表日志表logdetail和日志表summary表。抽取的数据保存在监控工具客户端日志数据库(clientlogdblogdb.mdb)中,NCLOGS日志抽取后保存的表是logdetail和summary, 字段信息保存在nmcclientconfresourcelogdb.xml文件中.日志表logdetail表的信息字段含义id记录IDcallid远程调用的IDuserid操作员IDthread线程名称hostNC服务器的IPportNC 服务器
38、的端口.ts时间戳remotecall远程调用的服务名debuglevelNC的日志级别:如ERROR/INFO/WARNING等msgNC的日志信息:如错误信息,警告信息等costtime耗时flowsize流量serverNC服务器:如:mastr/ncMem01/ncMem0Nfile抽取的NC服务器端日志文件的位置,如:.nclogsncMem01anony-log0.log日志表summary表的信息字段含义id记录IDcallid远程调用的IDremoteCallMethod远程调用方法remoteAddr发起远程调用的客户端地址userid操作员IDthread线程名称begin
39、time线程开始时间costtime线程运行时间sqlcosttime当前线程所有SQL的执行时间(不包括fetch 结果)readrownum当前线程总共fetch了多少条记录.readresulttime当前线程fetch 结果集的时间writetoclienttime当前线程写数据到客户端的时间(网络耗时)writetoclientbytes当前线程写到客户端的字节数notclosedconnectioncount当前线程没有关闭的数据库连接数抽取方法: 选中日志抽取项后,工具栏中:抽取NCLOG下图是抽取的过程:查看NCLOG日志信息方法:如下图,工具日志数据,就切换到日志数据界面,然
40、后常用脚本下拉框中预制了:执行方法统计、 statements、 报错信息统计、远程调用统计直接选择 常用脚本报错信息统计 就会查询出NC的报错信息。也可以在日志数据界面,直接写SQL,如下图,然后点工具栏中的”执行”查询。下面是抽取NCLOG的条件说明:抽取条件说明服务器: 指安装NC的应用服务器,可以使多台服务器。如集群时为多台。时间范围:按照图示的格式输入。操作员:点击“选择操作员”按钮,弹出如下对话框,然后选择对应的操作员即可。 日志文件全名包括(like): 如 输入 master,则抽取的日志信息是master目录下的所有日志信息. 如果输入 summary,则表示抽取日志文件名包
41、含summary的日志。 自定义条件:可以把以下字段作为自定义条件:Id,callid,userid,thread,host,port,ts,remotecall,debuglevel,msg比如以下条件是可以的:Debuglevel=ERROR AND userid=#UAP# and remotecall=nc.ui.test.ITest以下抽取条件只抽取报错信息。抽取JVM日志 JVM的抽取信息为: JVM的最大值、JVM的空闲值及JVM的信息等。通通过这些信息,我们就可以知道NC的某个服务的内存历史使用情况及JVM出现问题的信息等。 JVM的日志抽取是从监控服务器目录nmcserver
42、logsmw目录中抽取的。抽取的数据保存在监控工具客户端日志数据库中,保存的表是jvmlog。JVM表jvmlog表的信息字段含义server服务器名servernameNC服务名:如:mastr/ncMem01/ncMem0NmaxJVM最大值totaltotalfreeJVM的空闲值ratiofree/totalmsg进程监控输出的信息 如master is not started,wait until it started!wcthreadnum当前web线程数servicethreadnum当前服务线程数wcrange连接池大小file抽取的NC服务器端日志文件的位置,如:.nclog
43、sncMem01anony-log0.log抽取及查看JVM日志方法如下: 抽取JVM设置好抽取的条件后,点“确定”,下图显示抽取日志的过程。然后,工具日志数据库 切换到下面的界面。在常用脚本的下拉框中可以通过选择对应的选项查看对应的日志信息。也可以根据需要自己写脚本。表结构信息在nmcclientconfresourcelogdb.xml。抽取CPUCPU的抽取信息为: 服务器cpu的user、sys、wait、idle等。通过这些信息,我们就可以知道CPU的历史使用状况。 CPU的日志抽取是从监控服务器目录nmcserverlogscpu目录中抽取的。抽取的数据保存在监控工具客户端日志数据库中,保存的表是cpulog。CPU表cpulog表的信息字段含义server服务器host机器名cpuidCPU ID号user用户使用百分比sys系