《网络性能管理方案建议书(doc 35页).docx》由会员分享,可在线阅读,更多相关《网络性能管理方案建议书(doc 35页).docx(34页珍藏版)》请在三一办公上搜索。
1、网络性能管理方案建议书 目录一、nGenius 性能管理系统结构简介21、数据源2(1)RMON简介2(2)内置型RMON Agent3(3)NetScout硬件RMON探针32、nGenius软件33、nGenius体系结构示意图4二、nGenius 产品介绍51.nGenius Probe(nGenius探针)52.nGenius Performance Manager5Traffic Monitor功能介绍6Packet Analyzer包捕获解码分析功能12VoIP功能介绍14nGenius Performance Manager安装系统要求26三、方案设计和解说27四、实现功能描述3
2、1五、nGenius与其它网管系统的整合33六、国内成功案例34一、 nGenius 性能管理系统结构简介nGenius性能管理系统包含两个组成部分:数据源及管理软件。nGenius的数据结构采用标准化的RMON格式,具有很高的互通性,因为此数据源包括网络设备例如Cisco Catalyst交换机的内置型探针,也包括专用的硬件探针。nGenius管理软件从这些数据源收集数据,然后进行显示、管理以及生成报表,从而让网络管理员了解网络的详细使用状况。同时nGenius硬件探针也可以侦测到各种网络异常现象,例如流量的突变,而主动向网络平台发出告警。1、 数据源 (1) RMON简介RMON包含两个版
3、本:RMON (RFC1757)及其扩展RMON2 (RFC2021),RMON具有以下9组计量:组别名称描述1Statistics当前统计,包括带宽利用率、包种类、包大小分布、错误包等统计2History历史统计,内容同Statistics,但每个数值含有时间戳3Event预定条件的反应,包括制造事件记录项、发送一个SNMP Trap4Host跟踪个别主机的统计,包括包输入/输出、Multicast/Broadcast、错误、字节输入/输出。由于RMON的信息只能到达数据链路层,因此主机的排列只能显示DLC地址。5HostTopN前“N”个主机名单,可基于不同数值排列6Matrix通信对排列
4、7Filter数据包捕捉用的过滤设定8Capture数据包捕捉功能9Alarm告警功能表格 1:RMON (RFC1757,2819)的组别组别名称描述1ProtocolDir协议列表:表中所列的协议为探针所能够解码和计量2ProtocolDist协议类型分布:信息可达应用层,如HTTP, FTP等3AddressMap主机网络层地址与MAC地址的对应列表4NlHost基于网络层地址排列的主机输入/输出流量统计5NlMatrix基于网络层地址排列的通信对流量统计6AlHost基于应用层地址排列的主机输入/输出流量统计7AlMatrix基于应用层地址排列的通信对流量统计8UsrHistory允许
5、在探针中任何计数器的历史记录研究9ProbeConfig标准化的探针配置参数,包括容量、软件修正级别、硬件修正级别、当前数据和计时设置、控制复位(运转、热启动、冷启动)、下载文件名、TFTP下载服务器的IP地址、到PROM或RAM的下载动作表格 2 RMON2(RFC2021)的组别(2) 内置型RMON Agent大部分交换机,如Cisco Catalyst4003,都具有内置型RMON Agent,这些Agent可以采集所处交换机的RMON信息。内置型RMON的优点是可以采集到每个端口的信息,但缺点是内置型RMON只能支持RMON中的四组计量,分别是:Statistics,History,
6、Event及Alarm,所提供的信息内容十分有限,被称为“迷你型RMON”(Mini-RMON)。(3) NetScout硬件RMON探针对网络端到端的可视性是性能管理的重要环节。数据源则是网络可视性的基础。NetScout硬件探针(Probes) 为用户提供丰富可靠的数据源。NetScout硬件探针(Probes) 获取有关应用系统和网络基础设施性能的关键重要的信息。这些有关网络性能的信息包括网流和应用的使用率,会话,错误情况,资源利用率,响应时间,数据捕捉。NetScout Probes支持多种多样的网络类型,协议和应用系统。这些硬件探针独特的可扩容的系统结构能够满足当今复杂的企业网络的多
7、种需求。NetScout硬件探针以“非侵入式”的工作方式采集网络的流量统计信息,统计内容包含RMON及RMON2的所有组别并覆盖OSI的全部七层,即从物理层到应用层,在网络信息流经过时不间断地对其监控(不是定时抽查)。硬件探针透视网络的复杂性。同NetScout 的nGenius性能管理系统一起使用硬件探针能提供最精确最强有力的网络性能统计数据来达到对网络任何时间任何地点的可视性和控制。硬件探针的优点还包括: 以透明方式工作,不影响网络性能 支持多种网络拓扑,包括GE、ATM及WAN等 能够透视网络,取得任何时间任何地点的可视性 对虚拟网络提供广泛的支持 同时监测多个VLANs,DLCIs和P
8、VCs 为联网的应用信息流提供端到端的可视性2、 nGenius软件nGenius软件的主体为nGenius Performance Manager(简称PM):PM是一个单一、扩展性高、基于WEB的平台。这个平台通过实时性和历史性的监控、预防性的故障排除、VoIP电话监控、容量计划及自动化报表生成等功能来帮助优化网络性能。PM从各种RMON数据源收集统计数据,提供对网络和应用系统性能全面的可视性。PM将各种管理工具整合在一起组成一个全面的解决方案从而提高网络运作和IT工作人员效率。PM有以下主要功能:实时监控和故障排除PM同安置在网络中的NetScout硬件探针一起持续不断地监测网络性能并主
9、动地提供告警从而使网管员能及时迅速解决问题,避免对业务产生影响。PM实时地显示哪些应用和哪些用户在影响网络性能。对于比较复杂的问题,您可以进行基于WEB的数据报捕捉和解码。PM使您能同时监测整个网络,单个的网段或一组网段为您减少花在诊断上的时间。容量计划和报告PM提供有数量依据的信息来支持容量计划方面的决定。PM帮助您把握什么是您网络的的“正常” 网流来优化网络资源。它同时帮助您预防性地管理和规划网络增长,防止瓶颈,减少费用。通过提供对消耗宝贵的网络资源的应用系统的可视性,对增长趋势和使用模式的细致分析,您可以调整活动时间,重新将信息流分配给不同的网段,或者制定新的使用规章制度,并为制定增长的
10、方针提供依据。PM提供从为高层领导提供的总结到网段的具体细节情况的各种类型的报表。VoIP电话监控PM监控VoIP的性能来保证优化高质量的IP电话服务。利用NetScout探针中的VoIP MIB, PM监测服务质量 (QoS) 相关的包括变异度和数据包丢失等的指标,同时=提供具体细节来确认VoIP的配置。这些信息帮助优化在聚合网络中语音和数据的性能,保护您在VoIP技术上的投资。nGenius Performance Manager实时监控容量计划和报告VoIP 监控nGenius Server管理和配置数据采集和储存nGenius ProbesLAN Switches 3、 nGenius
11、体系结构示意图二、 nGenius 产品介绍1. nGenius Probe(nGenius探针)NetScout拥有市场上种类最齐全、信息最丰富的专用探针。探针以“被动侦听”形式,在线上捕获数据包,并提供包解码和网络7层的RMON MIB信息。“被动侦听” 形式确保探针跟网络100%隔离,永远不会造成网络干扰,避免成为网络上一个新的瓶颈或失误点,是业界最推崇的流量管理方法。NetScout探针支持多种拓朴:从10/100兆以太网,千兆以太网到 Gigabit EtherChannel,从T1/E1 WAN到OC3/12 ATM,还有监控OC12/3 Packet over SONET/SDH
12、网和Storage Area Network (SAN) 。能支持不同的接口,型号超过75种。每部探针最多能监控8个同拓朴的链路,并能监控负载均衡、冗余备份链路,是业界首创。图表 1:千兆网探针NetScout的探针均能放置机架上,有1U和3U的规格,并符合国际电器Class A安全标准,能安全的安装于机房作24小时操作。2. nGenius Performance ManagernGenius Performance Manager包含实时监控和故障排除(Real-Time Monitoring and Trouble-shooting) ,历史数据处理、容量计划和趋势分析(Historic
13、al Analysis,Capacity Planning and Trend Reporting),应用响应时间分析(Application Response Time) ,和网站流量分析(Web Analysis) 。网管员通过通用浏览器,例如Internet Explorer或Netscape,连接到PM服务器中进行各种网管工作: 侦测各种网络异常现象 监控网络及网站的性能 实行数据包捕捉及解码 储存及调用各种历史性的流量或性能数据 配置探针 用户管理实时监控和故障排除 支持多媒体H.323,RTP,MGCP,SCCP (Skinny Cisco Client Protocol)的RMO
14、N2内容统计 支持:RTP and RTCP based VoIP;FRF.11(VoFR);FRF.12(Fram Relay Fragmentation); Auto Applications Discovery (根据TCP和UDP端口号) 显示全双工信息 (inbound, outbound and total),内容包括:Link Usage, Protocol Usage and Application Usage views. 提供简单易用的协议解码功能,加快故障排除时间 内含的nGenius Server 具备以下功能:o 用户自定义各种协议组,例如Voice 或 VPN 协议
15、组,定义之后,RTM可以累计同组的协议统计做统一显示o 支持Cat5000/6000 NAMo 支持SMON / HCRMON / ATMRMONo 用户自定义应用组,例如可以将各种数据库,如Oracle、Sybase,的流量累计到“数据库流量 Database” 组中o 支持RMON1 和 RMON2 Trapso 探针参数设定o 用户管理,包括用户建立、用户权限设定等 实时监控由三个组件提供o Traffic Monitoro Packet Analyzero VoIPTraffic Monitor功能介绍1. 支持虚拟私人网络(VPN) o GRE (generic routing pr
16、otocol) o New RMON2 domain - GREo Stats group only supported; Phase Io Ability to monitor inner payload traffico *IPSec protocols AH and ESPo New RMON2 domain - IPseco Stats group supported(请注意: NetScout 产品不能对加密信息进行解密。)2. 全双工界面上的入站、出站和全部的统计数据显示。 PM在链接层、协议层和应用层使用图中都显示进站、出站和整体值的信息。(请注意: 对于进站、出站和整值,都能显
17、示 utilization%, bit rate, byte rate, packet rate 和 average packet size.)3. 支持交换机的内置RMON。用一个图显示同一交换机或不同交换机所有端口的总流量、误码、广播风暴、包大小、包类型等链路层资料。4. 自定监控协议,过滤需要监控的协议和应用,并可随意增加非标准TCP/UDP端口号(或端口号群) 马上作监控。5. 实时告警定制,得到预先告警,预防网络问题。Protocol Usage ViewThe figure shows inbound, outbound and total for IP %utilization
18、in the Protocol Usage view. 表格 1:整个IP协议族的历史性利用率Application Usage ViewThe figure shows Application Usage in terms of Packets per second for the “WEB” application group. The Link Usage views will be similarly modified to show all three values.表格 2:针对个别应用组的历史性统计Protocol Discovery View表格 3:自动侦查网段中所有协议类型
19、Application Distribution Chart表格 4:应用层占用带宽比例Top Conversations Chart表格 5:个别应用的 TopN 通信对内置RMON表格 6:端口利用率的连续记录:不同于传统SNMP的实时性显示,RMON可以将数据做历史性的记录,网管人员可以根据这些记录进行趋势分析,从而能够采取预防性的措施以避免拥塞的出现。NetScout nGenius PM可以从所有内置RMON提取这些信息。表格 7:误码记录:包含误码种类与数量,这些记录不止显示误码的多少而且还有发生的时间记录,使网管员可以很快地找出其它同时发生的网络运行情况,例如利用率,从而判断误码
20、产生的原因。表格 8:多端口误码显示:此图表将多个端口的误码发生情况做实时性的显示,这主要是作为故障分析之用,网管人员可以了解哪些端口的误码率较高,也了解误码的种类,例如在本图中显示了第四槽的第七端口具有较高的冲突率,如果情况持续,则此端口的有效利用率将受到影响,解决的办法包括将此端口所接的主机网卡升级成全双工。表格 9: 包大小分布图:包大小将直接影响信息传输的效率。网管员透过此图表可以分析本网的通信方是否使用合理的包大小。自定监控协议和应用的资料资料分Statistics (包含利用率、误码、包大小、Packet/sec、Bytes/sec、Bits/sec、包种类等) ,Hosts (主
21、机列) 和 Convs (通信对) 。并可随意增加非标准TCP/UDP端口号(或端口号群) 马上作监控。表格 10:监控协议和应用配置 实时告警告警门限可根据总流量、广播包占用量、包CRC Errors、Multicast包占用量设置,甚至可根据不同的协议和应用的利用率作告警。探针默认每60秒查看一次,一旦发现达到所设定的门限,探针就马上发出告警到nGenius PM 和指定的IP地址上 (例如 HPOV 的IP地址)。表格 11:告警定制表格 12:告警显示和汇总Packet Analyzer包捕获解码分析功能1. 提供简单易用的协议解码功能,加快故障排除时间。2. 支持告警触发、定制时间触
22、发和手动三种方式的数据包捕获触发方式。表格 13:协议解码介面:每个包最高层汇总、各层规程分析、原码(Hex和ASCII显示)表格 14:过滤器:包括地址过滤(MAC或IP,最多4对) 、协议过滤、Pattern过滤VoIP功能介绍1. 支持基于RTP/RTCP VoIP网流 RTP (Real-Time Protocol), RTCP (Real-Time Control Protocol) New multimedia screens and RMON2 drill-downs for RTP Audio and Video Tracking H.323 signaling protoco
23、ls (H.225, H.245, Q.931) Support for FRF.11 (VoFR) and FRF.12 (Frame Relay Fragmentation)2. 并列显示多媒体和数据应用系统的实时和历史的情况3. 为不良通话质量的指标 (如抖动、数据包丢失率、未完成的通话、通话设置时间等)设立告警 4. 设置细节确认DSCP和压缩/还原(codec) 配置5. 认定电话使用者,通话,以及发送vs接受者统计数据以便迅速发现问题Multimedia Top Level表格 15:Traffic Monitor里显示Multimedia应用的利用率 Multimedia Bre
24、akdown View表格 16:Traffic Monitor里显示Multimedia应用包含的Audio(语音)和Video(视频)各自的利用率。从图上还可以点击语音和视频各自的主机列和通信对。Phone Users Table (phone number vs. IP addreses)表格 17:显示了Phone number和IP地址配对,每一对的累计通话时间(Talk Time)、平均通话时间(Avg. Duration)、打出和接听次数(Valid calls)、电话无法接通次数(Incomplete calls)等。VoIP质量监控和告警定制表格 18:显示正在通话的丢包、抖
25、动(Jitter) 情况,并以每30秒记录通话双方各自抖动的情况。历史数据处理、容量计划和趋势分析PM通过长期收集有关应用、网络及设备的使用情况信息而预测未来的资源需求,使网管员可以作出预防性的网络优化和扩容,因而避免瓶颈的出现。PM采集数据的对象包括探针和局域网交换机,这些数据均储存在内嵌的数据库中,这些历史性的数据除了用于报表的生成外,也用于统计性的分析工作。综合特性如下: 用于容量规划 自动或on-demand报表生成 具有针对行政主管的报告 (行政主管报告) 自动估算预测功能,生产预测性报表 自动基准分析:Traffic Signature 配置简易 可以为不同用户制定独特报表格式 报
26、表文件格式可选PDF或HTML,适合email或在线浏览 可直接连接到Traffic Monitor上作实时分析下表列出nGenius Performance Manager 1.4提供的报表种类:行政主管报告m Resource Summary. Executive Summary of Application and Network Volumes and Usage. An aggregated calculation for all elements Enterprise-Wide or for a Selected Group Application Summary. Pie cha
27、rt of Application traffic by percent of traffic volume (applications are categorized by application type, i.e., “E-mail,” “Web,” “Client-Server,” “Multimedia”) Application Summary Breakdown. Table of total volume (by application type) over the current period, Total Volume over the last period, and c
28、hange in ranking since the last period. Network Volume Summary. Bar chart of traffic volume (bytes/day) Network Volume Breakdown. Table of total volume (by interface) over the current period, total volume over the last period, and change in ranking since the last period. Peak Usage Summary. Bar char
29、t of highest daily utilization (of all interfaces) over the current time period Peak Usage Breakdown. Table sorted by highest utilization (by interface) over the current period, utilization over the last period, and change in ranking since the last period. Utilization Distribution. Pie chart showing
30、 what percent of interface utilization falls within the various distribution categories (i.e., between 0-20%, between 21-40%, between 41-60%)容量计划报告m Most-Utilized Segments. Shows the TopN utilized segments. Graphical or Tabular formats. Drill down on any interface to see application utilization and
31、volumes details as listed below: Application Breakdown Inbound. Stacked bar graph showing percent utilization by hour broken out by application. Application Breakdown Outbound. Stacked bar graph showing percent utilization by hour broken out by application. Most Active Applications (All applications
32、). Table showing the most active applications on this interface. Drill down to see the following statistics on each individual application: In vs. Out Utilization (percent) In vs. Out Volume (bytes/hour) In vs. Out Throughput (packets/second) Top Conversations Top Hosts Top AL Conversations. Shows T
33、op Conversations on this interface. Graphical or tabular. Top AL Hosts. Shows Tops Hosts on this interface. Graphical or tabular. Drill-down to see the following statistics by host and application: In vs. Out Utilization (percent) In vs. Out Volume (bytes/hour) In vs. Out Throughput (packets/second)
34、 Top Conversations In vs. Out Utilization In vs. Out Volume In vs. Out Throughput In vs. Out Errors Total Broadcasts Total Multicasts Packet Distribution Summarized Table For Individual Statistics. Table showing In Utilization, Out Utilization, and Errors/sec on a hour-by-hour basism Most-Utilized C
35、ircuits. Shows Most Utilized Circuits. Drill-downs are the same as Most-Utilized Segments, listed above.m Most-Utilized VLANs. Shows Most Utilized VLANs. Drill-downs are the same as Most-Utilized Segments, listed above.m Most Utilized Switch Ports. Drill-downs include: Total Utilization Total Errors
36、 Summarized Table For Individual Statisticsm Least-Utilized Segments. Shows the TopN least utilized segments. Drill-downs are the same as Most-Utilized Segments, listed above.m Least-Utilized Circuits. Shows TopN least utilized circuits. Drill-downs are the same as Most-Utilized Segments, listed abo
37、ve.m Least-Utilized VLANs. Shows Most Utilized VLANs. Drill-downs are the same as Most-Utilized Segments, listed above.m Most-Congested Circuits (Frame Relay) (FECNs/BECNs). Drill-downs are the same as Most-Utilized Segments, listed above.m Most-Congested Circuits (ATM) CLPs Congestion (packets/sec)
38、. Drill-downs include In vs. Out Errors, CLP Congestion, and Summarized Table For Individual Statistics m Most Active Applications (volume)m Most Active Network Protocols (volume)m ATM Circuits Detailed Listingm Frame Relay Circuits Detailed Listingm Segments Detailed Listingm Top AL Conversationsm
39、Top AL Hostsm Top NL Conversationsm Top NL Hosts需要关注信息m Segment Utilization Forecast. Drill-downs are the same as Most-Utilized Segments, listed above.m Circuit Utilization Forecast. Drill-downs are the same as Most-Utilized Segments, listed above.m Application Utilization Forecast. Drill-downs are
40、the same as Most-Utilized Segments, listed above.m Circuit Congestion Forecast. Drill-downs are the same as Most-Utilized Segments, listed above.m Segments With Unusually High Utilization. Drill-downs are the same as Most-Utilized Segments, listed above.m Thresholds That Have Been Exceeded. Drill-do
41、wns are the same as Most-Utilized Segments, listed above.资产管理m Device Detailed Listingm Interface Detailed Listing用户自定版面编排 (Custom)行政主管报告应用流量历史统计应用层排行榜应用层Client-Server传输量最大统计一天传输量最大IP主机历史统计应用层响应时间分析 应用层响应时间监控 同时放映应用层响应与网络效率的关系 数据具体到每种应用、每个服务器与用户 同时具有实时与历史数据 区分网络传输时间与服务器响应时间 确定网络是否性能问题所在表格 19:显示Top5最
42、大输出量Server、Top5响应最慢Server、和HTTPS利用率跟链路总流量的比较。表格 20:一旦发觉响应时间太长,可以分析Server Processing Time vs. Flight Time vs. Client round-trip,知道响应时间长是网络造成还是Server/Application本身造成。网站流量分析 实时性URL响应时间监控 网站访问次数(Hit Rate) 针对具有信息承载的流量进行监控 HTTP状态码报告(譬如 404 Not Found,Access Violation) 简易的、基于URL的信息导航 实时告警表格 21:显示一个网站() 的内容响
43、应时间记录、内容响应时间分布、HTTP状态码(历史) 。nGenius Performance Manager安装系统要求安装在 PC上的系统要求OS: Windows NT/Workstation 4.0 SP6a, Windows 2000 Professional/Server SP2 或以上CPU最低要求: Pentium III 1GHz 或 Pentium 4 1GHz 一颗Memory最低要求: 1GB RAM硬盘最低要求: 30GB硬盘(EIDE要7200RPM,SCSI要10000RPM) ,不能跟OS安装同一硬盘上。Paging size: 每硬盘起码预留2GB作Pagin
44、g。客户端支持的浏览器版本OSBrowserSolaris 2.6, 2.7,2.8Netscape v 4.78, v6.0HP-UX 11.0Netscape v 4.78, v6.0IBM-AIX 4.3.3Netscape v 4.78, v6.0Windows NT 4.0 sp6aWindows 2000 sp2Netscape v 4.78, v6.0 andInternet Explorer v5.0, v5.5Windows XPInternet Explorer v6.0三、 方案设计和解说广域网nGenius PM Workgroup (Windows) 四套 产品号: 9595NetScout probe 总行RTM module in Ciscoworks2000 (Windows)NetScout probe 35省分行RTM module in Ciscoworks2000 (Windows)NetScout probe RTM module in Ciscoworks2000 (Windows)NetScout probe RTM module in Ciscoworks2000 (Windows)NetScou