《动环监控应急方案.docx》由会员分享,可在线阅读,更多相关《动环监控应急方案.docx(21页珍藏版)》请在三一办公上搜索。
1、机房动力环境监控系统应急方案书目 录一概 述11必要性随着电子商务和企业信息化的发展,计算机机房建设的数量及规模不断扩大。机房作为各单位信息交换及存储的枢纽,科学管理尤为重要。以往用户对于机房管理的重点都集中在防黑客或非法入侵、电脑病毒、网络故障、数据备份等方面,往往忽略了机房的环境变化,可能致使产生不可预见的后果,如机房的温度、湿度过高、电力系统不稳定、机房安全措施不完善致使非核心工作人员进出机房操作,造成的隐患/故障而引发的机房事故,导致不必要的经济损失。科学的管理计算机机房,才能保证机房内的网络和计算机等高级设备长期、可靠、稳定地运行。机房集中监控系统,是相关人员管理机房的不可缺少的重要
2、工具。12建设目标为机房建立包括机房动力、环境及安防的监控系统,主要监控对象包括:精密空调、UPS、蓄电池监测、电量检测、温湿度监测、漏水检测、门禁、闭路监控、消防监测等,实现724365的全面集中监控和管理,保障机房环境及设备安全高效运行,以实现最高的机房可用率,并不断提高运营管理水平。机房监控管理平台将实现四个目标:n 为机房内各系统及设备运行提供高度稳定可靠的监控信息资源;n 节省机房运行管理费用,达到短期投资长期受益的目的;n 确保提高机房管理工作效率并提供安全舒适的工作环境;n 系统软/硬件均采用模块化结构设计,适应发展需要,做到具有可扩展性、可变性,适应环境的变化和工作性质的多样化
3、。14监控需求机房集中监控内容包含以下部分: UPS监测系统; 蓄电池监测系统; 供配电监测系统; 精密空调监控系统; 服务器监测系统 漏水监测系统; 温湿度监测系统; H2浓度监测及机房洁净度监测系统; 闭路监视及数字录像系统; 防盗报警系统; 门禁监控系统;23系统组成整个系统主要由以下三个部分组成:监控主机、现场设备采集层、远程IE浏览。监控主机:实时采集设备的各种信息,进行本地数据处理及存储。现场设备采集层: 实时采集供配电、UPS、空调、漏水、温湿度、消防、照明、门禁、视频、防盗报警以及服务器和网络设备等现场信号,将采集的信号经过分析、处理以后,直接传送到现场监控工作站。 远程IE浏
4、览站:远程IE浏览站的主要功能是在通过网络在远程主机上以IE的方式进行浏览的功能。在本系统中监控中心的管理服务器和现场的嵌入式服务器均支持IE浏览功能。从而便于管理人员随时随地了解机房的实际工作状况,实现管控一体化,在远程的管理人员可以通过浏览器,直接观看监控画面,并且该监控画面与监控中心管理服务器和各现场嵌入式服务器保持一致,通过该界面远程监控设备的运行状况,远程浏览站还可浏览各机房的视频图像。支持手机监控浏览:支持所有型号智能手机浏览,手机浏览支持查看设备通讯状态,告警状态,所有测点当前值,当前状态.支持查看系统当前所有告警事件,并可从手机上确认事件.支持查看历史事件及历史数据。 下图为常
5、见机房监控系统结构图:如上图所示,监控主机设置可放置在值班室/保安室或机房内,值班人员可查看各个环境运行状况、获取报警信息,通过监控主机实现。管理人员亦可通过对监控主机的Web浏览监控到自己环境的实时情况。24报警方式本系统可以提供多种报警方式,见示意图:一旦发现异常事件,系统即自动执行预定的控制策略,同时启动报警,报警可以有几种方式,如报警窗口、语音提示、电话语音、电子邮件、短信等。如图所示。使用时,可以选择其中一种或多种报警;当有多个报警同时发生时,系统通过事件等级,排队报警事件,并逐一报警,其中的电话号码、手机号码、电子邮件等由用户设置。报警具备灵活定义功能,可以分别设置设备的报警方式以
6、及相关管理人员,比如可以设定以下报警方式:精密空调故障通过电话语音方式通知精密空调管理人员并发送电子邮件给主管人员,而消防报警可通过手机短信方式通知消防管理人员并发送电子邮件给主管人员。这种方式大大增加管理的灵活度。另外,我们根据行业经验,专门定制了网络报警功能,方便实用,具体说明如下:当设备发生报警事件时,环境监控系统可通过局域网及时向环境管理人员的电脑发送报警信息,便于管理人员及时处理报警信息,如下图所示。此时管理人员可打开IE浏览器查看报警设备的具体参数和状态,从而做出相应的决定。网络报警方式与短信报警、电话报警的方式比较而言,其特点是实时性好,无须象电话、短信报警需要支付额外的费用,缺
7、点是管理人员离开电脑就接收不到报警信息。作为辅助报警功能,还是很实用的。在报警时,系统同时提供专家处理意见,如果发生故障,而维护人员又不能及时赶到处理故障,则为了最大程度的减少客户的损失,在发生报警的同时提供专家处理意见,将用户的损失减小到最少。备注:报警功能可选组合使用,依据实际情况选用即可。25动力环境监控系统的应急预案251UPS监测系统UPS是机房中提供稳定电源的关键设备,机房中许多设备如服务器、小型机、路由器等设备,都需要使用稳定的不间断电源,以防止数据丢失。因此监管好UPS系统非常必要。 监控对象对机房内UPS主机的运行状态进行实时监测管理,UPS电源的各部件工作状态、运行参数等进
8、行监测,一旦有部件发生故障,系统会自动报警。 通讯方式通过UPS设备提供的通讯接口RS485或RS232,将UPS的监控信号直接接入监控服务器或串口服务器(如果是RS232接口,需通过通讯转换模块将RS232转换成RS485信号),或者直接通过TCP/IP网络接口接入交换机/监控主机,由监控软件进行UPS的实时监测。 应急功能对UPS内部整流器、逆变器、电池、旁路、负载等各部件的运行状态进行实时监视(监测内容由厂家的协议决定,不同品牌、型号的空调可能所监控到的内容不同),一旦有部件发生故障,系统会自动报警。并且实时监视UPS的各种电压、电流、频率、功率等参数,并有直观的图形界面显示。系统可全面
9、诊断UPS状况,监视UPS的各种参数。一旦UPS报警,将自动切换到相关画面,并在现场伴随有报警声音。可根据用户需要设置短信通知。对于重要的参数,可作曲线记录,可查询一年内的曲线,使管理人员对UPS的状况有全面的了解。及时地发现并解决UPS运行中出现的各种问题。252蓄电池监测系统随着社会的进步和信息化、自动化程度的不断提高,人们对电力行业的依赖程度进一步加深,也就对供电系统的可靠性提出了更高的要求。无论在电力变电站、通信机房还是UPS系统中,蓄电池作为备用电源在系统中起着极其重要的作用。平时蓄电池处于浮充电备用状态,由交流市电经整流设备变换成直流向负荷供电,而在交流电失电或其它事故状态下,蓄电
10、池是负荷的唯一能源供给者,一旦出现问题,供电系统将面临瘫痪,造成设备停运及重大运行事故。 监控对象机房配置的12V 蓄电池。 通讯方式通过加装蓄电池检测仪与每节或每组电池进行连线监测,电池检测仪通过RS485或RS232(可设置)根据需要接入,并准确设置,直接接入监控服务器或串口服务器(如果是RS232接口,需通过通讯转换模块将RS232转换成RS485信号),由监控平台软件进行蓄电池的实时监测。 应急功能利用电池监测仪,采集每节电池的电压、内阻及电池总电压;在电池总进线及输出端安装直流电流传感器,实时监测电池组的总输入和输出电流;通过安装电池表面温度传感器,实时监测电池组的温度。系统可对监测
11、到的各项参数设定越限阀值(包括上下限、恢复上下限),一旦蓄电池发生故障,系统将自动切换到相应的监控界面,且发生报警的该项状态或参数会变红色并闪烁显示,同时产生报警事件进行记录存储并有相应的处理提示,并第一时间发出多媒体语音、电话/手机短信、声光等对外报警。提供曲线记录,直观显示实时及历史曲线,可查询一年内相应参数的历史曲线及具体时间的参数值(包括最大值、最小值),并可将历史曲线导出为EXCEL格式,方便管理员全面了解蓄电池的状况。253供配电监测系统机房区所有供电电源的质量好坏将直接影响机房设备的安全,因此采用智能电量监测仪对机房市电进线的供电参数实行监测非常重要。 监控对象对机房配电柜进行监
12、控,设计在配电柜上安装电量仪对市电进线进行各项供电参数监测。 通讯方式可通过电量仪的RS485通讯接口将信号接入监控服务器或串口服务器,由监控平台软件进行市电的实时监测。 应急功能实时监测市电进线三相电的电压、相电流、线电压、线电流、有功、无功、视在功率、频率、功率因数、电度等参数。系统可对监测到的各项参数设定越限阀值(包括上下限、恢复上下限),一旦市电发生越限报警,系统将自动切换到相应的监控界面,且发生报警的该项状态或参数会变红色并闪烁显示,同时产生报警事件进行记录存储并有相应的处理提示,并第一时间发出多媒体语音、电话/手机短信、声光等对外报警。提供曲线记录,直观显示实时及历史曲线,可查询一
13、年内相应参数的历史曲线及具体时间的参数值(包括最大值、最小值),并可将历史曲线导出为EXCEL格式,方便管理员全面了解市电的供电状况。254精密空调监控系统机房温度出现异常时,将导致机房其他设备运行所需的环境失去保障,因此设计对机房内精密空调的运行状态和参数进行实时监测,同时可对精密空调进行远程的开关机控制。 监控对象对机房精密空调运行状态进行监控。 通讯方式通过UPS设备提供的通讯接口RS485或RS232,将UPS的监控信号直接接入监控服务器或串口服务器(如果是RS232接口,需通过通讯转换模块将RS232转换成RS485信号),或者直接通过TCP/IP网络接口接入交换机/监控主机,由监控
14、平台软件进行UPS的实时监测。 应急功能实时监视精密空调压缩机、风机、水泵、加热器、加湿器、去湿器、滤网、回风温度和湿度等的运行状态与参数,并可对精密空调实现远程开关机的控制(能监测到的具体内容由厂家的协议决定,不同品牌、型号的精密空调所监控到的内容不同)。同时支持与其它子系统的联动控制,如当温度过高时自动联动启动空调进行制冷。系统可对监测到的各项参数设定越限阀值(包括上下限、恢复上下限),一旦精密空调发生故障,系统将自动切换到相应的监控界面,且发生报警的该项状态或参数会变红色并闪烁显示,同时产生报警事件进行记录存储并有相应的处理提示,并第一时间发出多媒体语音、电话/手机短信、声光等对外报警。
15、提供曲线记录,直观显示实时及历史曲线,可查询一年内相应参数的历史曲线及具体时间的参数值(包括最大值、最小值),并可将历史曲线导出为EXCEL格式,方便管理员全面了解精密空调的运行状况。255服务器监控管理(1) 服务器单点综合监控在一个界面中,综合展现某台具体服务器的配置、性能、历史数据和故障信息。服务器性能重点显示包括实时和最近24小时 CPU平均利用率、MEM利用率、文件系统利用率。(2) 服务器性能管理实现对主机性能、故障、进程、磁盘、文件系统、日志的监控,并生成报表和告警信息,主要的性能管理内容包括:服务器CPU性能 (5分钟、小时、日、周)服务器内存性能 (5分钟、小时、日、周)服务
16、器磁盘性能 (日、周)服务器流量性能 (5分钟、小时、日、周)服务器CPU峰值分析CPU峰值分析(小时/日)磁盘I/O繁忙分析服务器I/O性能统计(小时/日)(3) 服务器接口流量管理提供服务器小时、日、周、月流量趋势分析,并提供流量阀值告警,当服务器接口流量达到阀值时,产生相应阀值级别的告警事件。(4) 服务器进程管理包括对服务器各进程性能的TOPN排名和进程性能趋势分析。包括进程占用cpu利用率、占用cpu的时间、驻留内存和虚拟内存的大小。(5) 服务器监控管理主要指标服务器监控管理的主要指标包括:1) 基本信息:主机名称、操作系统名称、操作系统版本、操作系统位数、机器开机运行时间等基本信
17、息;2) 性能:CPU利用率,内存利用率,文件系统利用率, 磁盘IO,硬盘读写速率、虚拟内存使用率、网卡使用率、内存页交互速率等;3) 进程:可对指定进程资源占用情况进行采集。可按应用监控多个进程的汇总的CPU、内存利用率。默认可对每个主机top10进程进行记录。可监控进程、服务是否正常运行,进程数量是否发生变化;异常将产生告警信息;4) 日志:实现日志关键字、日志文件大小、日志文件是否丢失等指标的监控,异常将产生告警信息;5) 配置变更:当主机的硬盘、CPU、内存等信息发生变化时,系统会产生告警,发给指定的管理员;6) 特定文件:监控系统中文件和目录的相关属性,包括名称、文件大小、拥有者、访
18、问权限以及链接等。如发现文件被修改或其他异常时(包括非法访问、大小异常等)产生报警;7) 用户:监测与用户有特定关联的信息,主要包括用户名、用户ID、登录时间、登录终端IP信息等;8) 服务器网络接口监控:监控服务器网络端口的输入、输出、错包及各种可用统计参数,端口是否被停用或者删除等;9) 交换空间:交换空间的大小、交换空间使用率等;10) 热备系统:获得服务地址,获得接管地址、Cluster节点状态、Network端口状态;11) IPC:共享内存、信号灯、消息队列;12) 目录:指定目录的大小、修改时间及包含文件个数;13) 活动目录:对活动目录帐号(windows)进行模拟登陆、验证帐
19、户和密码是否有效;14) UNIX SCRIPT:监控指定的脚本的运行情况,支持结果匹配。256漏水监测系统机房内的地板底下有诸多的漏水水源,如空调机组的冲洗水回路、排水管等。由于机房区地板下强电、弱电、地线、电缆纵横交错,如不慎发生漏水,不及时发现并清除,后果将不堪设想。正因为机房漏水危害大,又不容易发现,对机房内的漏水状态进行实时的检测是十分必要的。分布式传感即用特种绳将水源包围,可以真正意义上做到防患于未然,把泄漏危害降低到最低程度。故我们推荐用户采用分布式传感检测系统。根据用户的要求及场地设备的布置情况,采用绳式测漏系统。系统本身包括:漏水控制器、漏水感应线及其他辅助设备,系统可检测感
20、应线上任何点的漏水位置。 监控对象对机房内精密空调周围的漏水实施监控,在机房有空调的地方安装漏水感应绳连接漏水控制器进行漏水检测,保证机房设备的稳定运行。 通讯方式通过测漏控制模块提供的RS485通讯接口,将漏水报警信号直接接入监控服务器或串口服务器(如果是开关式漏水控制器,另配开关转换模块),由监控平台软件进行漏水的实时监测。 应急功能实时监测机房的漏水情况,发生漏水时系统自动切换到漏水监控界面,并显示具体的漏水位置,可精确到米,同时产生报警事件进行记录存储及有相应的处理提示,并第一时间发出多媒体语音、电话/手机短信、声光等对外报警。257温湿度监测系统对于机房内精密的电子设备,其正常运行对
21、环境温湿度有比较高的要求。计算机机房环境条件的好坏,对充分发挥计算机系统的性能,延长机器使用寿命、确保数据安全性以及准确性是非常重要的问题。 监控对象对机房内各个区域的绝对温度和相对湿度进行监测。 通讯方式通过温湿度传感器的RS485通讯接口将信号接入监控服务器或串口服务器,由监控平台软件进行温湿度的实时监测。 应急功能实时监测机房区域内的温度和湿度值,同时支持与其它子系统的联动控制,如当温度过高时自动联动启动空调进行制冷。系统可对温度和湿度参数设定越限阀值(包括上下限、恢复上下限),一旦温湿度发生越限报警,系统将自动切换到相应的监控界面,且发生报警的参数会变红色并闪烁显示,同时产生报警事件进
22、行记录存储并有相应的处理提示,并第一时间发出多媒体语音、电话/手机短信、声光等对外报警。提供曲线记录,直观显示实时及历史曲线,可查询一年内相应参数的历史曲线及具体时间的参数值(包括最大值、最小值),并可将历史曲线导出为EXCEL格式,方便管理员全面了解机房内的温湿度状况。258H2浓度监测及机房洁净度监测系统机房环境相对密封,CO2浓度过高直接威胁进出机房工作人员,机房洁净度超标,则容易造成设备积灰,易导致设备老化或损坏,所以建议CO2浓度及机房洁净度进行检测,一旦检测内容超标,及时通知机房管理人员处理。备注:依据实际需要安装相应的传感器并集成监控。259闭路监视及数字录像系统为了了解数据中心
23、机房出入情况,保障机房的安全运行,很有必要对机房相关出入口、机房重要区域进行实时监控。根据需要,在机房区配置了若干套摄像机,以便管理人员实时监视机房情况,亦可根据需要设置录像。考虑到美观及与机房整体环境一致,我们推荐采用吸顶安装的半球式摄像机。摄像机采用高清晰度彩色摄像机。考虑到能有多种方式进行录像,各对应点分别设置双鉴探头进行检测。 监控对象在机房出入口、机柜间的通道、走廊等重要区域安装网络半球摄像机和硬盘录像机,进行全天候的视频图像监视。 通讯方式摄像机通过TCP/IP或AV方式直接接入到监控服务器的视频输入接口(硬盘录像机,同时将硬盘录像机接入与监控服务器相同的内部网络中),通过监控平台
24、软件进行图像监控。 应急功能实时监视各路视频图像,通过在电子地图上点击相应的图标即可查看该摄像机的当前画面。灵活设置录像方式,包括24小时录像、预设时间段录像、报警预录像、移动侦测录像以及联动触发录像等多种方式。支持历史视频检索回放功能,可根据录像的类型、通道、时间等条件进行检索,回放速度可调。支持与其它子系统的联动功能,如:门打开或发生防盗报警时联动摄像机进行录像,同时弹出相应的视频画面窗口等。2510防盗报警监控系统机房监控系统,将通过与前端红外探测器与采集模块的连接,实现对防盗报警系统的综合集成,可以实现的功能。 监控对象监测机房人或动物活动情况,天花板下安装红外探测器。 通讯方式红外探
25、测器的信号接入报警主机模块,通过报警主机模块的RS485通讯接口将信号接入监控服务器或串口服务器,由监控平台软件进行实时监测。 应急功能实时监测各防区的报警情况,并可通过监控平台软件实现远程布撤防(各点探测器的报警情况),一旦发生报警,系统将自动切换到相应的监控界面,且发生报警的探测器会变红色并闪烁显示,同时产生报警事件进行记录存储及有相应的处理提示,并第一时间发出多媒体语音、电话/手机短信、声光等对外报警。2511门禁监控系统为了防止闲杂人员随便进出数据中心机房,基于机房安全考虑,设计机房采用利用智能卡门禁管理系统进行出入口的管理,出入人员凭有效智能卡正常进出。根据需要,在各房间出入口安装若
26、干套道门禁系统,以便对出入进行有效监控管理。 监控对象对机房门进行门禁管理,采用进门指纹刷卡、出门按按钮的进出。 通讯方式通过门禁控制器设备提供的RS485通讯接口,将门禁信号接入串口服务器,由监控平台软件进行门禁的实时监测。 应急功能实时监控各道门人员进出的情况,并进行记录。可对人员的进出区域、有效日期、进出时段等进行授权,并可对人员进行权限组划分,可对门控器进行远程设置操作,支持集中发卡功能。支持与其它子系统的联动功能,如:发生火警时联动门禁控制器自动打开。2512消防监测系统机房消防系统安装了气体灭火装置。消防检测系统可以实时检测机房区域消防情况,正常时无报警信息,一旦有报警发生(如火警
27、信号、放气信号),由消防控制箱给出的干接点报警信号,通过开关量数据采集模块,将干接点变化信号经过处理后送到监控主机发出报警(如电话自动语音报警),即可达到实时监测机房内的火灾情况。这样,即便无人值守,可以确定消防工作状态。 监控对象机房智能消防主机。 通讯方式通过通讯转换模块把开关信号转换成RS485信号,将信号接入监控服务器或串口服务器,由监控平台软件进行消防的实时监测。 应急功能实时监测机房内的消防火警信号,一旦发生报警,系统自动切换到相应的监控界面,且火警状态图标变红闪烁显示,同时产生报警事件进行记录存储及有相应的处理提示,并第一时间发出多媒体语音、电话/手机短信、声光等对外报警。为了全面检测机房区消防状态,也另外辅助性加了烟感传感器(安装在机房天花顶下),一旦有异常,能检测到,现在发出声光报警,并可通过监控系统向外发出报警系统。