《监控报警策略.docx》由会员分享,可在线阅读,更多相关《监控报警策略.docx(5页珍藏版)》请在三一办公上搜索。
1、监控报警策略1报警策略 主要对监控系统报警进行统一设定与管理,具有多地点、多事件的并发告警功能,不丢失告警信息,告警及时性。其内容包括:报警方式选择、报警分组、时间组、报警格式定义、报警事件等级分类、报警信息查询、报警及时及报警日志管理等。 1.1 报警响应方式 通过可视化显示和声音提示来显示报警响应状况。系统支持以下几种报警响应方式: A. 屏幕响应:当出现任何报警响应时,不论监控主机在进行任何操作或任何工作,系统都会将报警信息画面自动弹出,并显示在最上方,同时伴随着画面闪烁,并具有文字说明,对报警情况做出准确的描述,内容包含报警响应地点、设备、类型、参数、时间,通知在线的操作人员。 B.
2、声音响应:出现报警响应时,监控主机多媒体音箱会播放报警声音,以通知在现场的值班人员。 C. 电话响应:当报警响应发生时,系统可通过电话拨号方式,自动拨打已设置好的多组值班电话,包括固定电话和移动电话,以便及时地通知值班人员。 D. 手机短信响应:具有不同的分组设置功能,可以按组别配置接收短信报警及配置发送人员名单;并可以灵活设置不同报警级别向不同人员或组别发送短信报警。当报警事件发生时,系统可以发送短信的方式,自动发送信息到值班人员手机,以便及时的通知值班人员。系统可设置报警信息限次播放,并支持TTS自动语音报读。 E. 邮件响应:当报警事件发生时,系统可通过预先设定的相应邮箱地址发送报警邮件
3、。 1.2 报警格式定义 机房监控系统中存在设备自身发出的各类预警/报警和监管系统定义的各类预警/报警等多种事件,首先需对报警的范围进行定义。 用户可以为不同报警报警条件设置不同的报警定义,可设置各种报警门限值参数、阈值。例如: 报警字段 报警对象 报警名称 报警位置 报警等级 报警时间 描述示例 空调、UPS、开关电源、温湿度、周界入侵、给排水等 空调漏水/温度高于门限值/UPS负载电压过低 XX机房4楼电力电池室UPS1 不指定、提示、一般、重要、紧急 yyyyMMDD HH:MM:SS;) 报警状态 报警内容描述 报警响应管理 当前报警、处理中报警、清除报警 XX机房的当前温度为29.5
4、度,温度过高 温度过高的区域,首先查看此区域的空调制冷量是否够?如制冷不足可考虑启用备用空调 系统支持以上报警字段选择。如下图: 1.3 报警等级 系统的报警级别按重要性分为不指示、提示、一般、重要、紧急等不同级别,可设高达12级的报警级别。级别越高的报警,表示重要性和危害性越大。系统具有并行处理报警的能力,对报警事件按优先级的高低进行处理。当多个报警同时产生时,按照报警的优先级从高到低依次处理,首先处理优先级高的报警,再处理优先级低的报警。 系统支持用户自行设置报警级别,并可以灵活设置不同报警级别向不同人员或组别发送短信报警。 1.4 报警流程 A.报警启动:当报警发生时,系统界面应自动切换
5、到报警设备的运行状态界面,并具有文字说明,对报警情况作出准确的描述,内容包含报警地点、设备、类型、参数、时间。当报警级别足够高时,系统应第一时间 向短信服务器发出报警信息,并对发送成功与否进行记录; B.报警确认:事件报警发生时,每条报警事件都需要经过确认,以确保报警事件的有效处理。确认时具有确认信息的自由输入能力,具有已确认、已消缺、已通知厂家、已通知应急人员的确认选项。确认人的相关信息可以在系统日志内自动记录。事件经确认后,系统自动解除该事件的报警; C.报警升级:当一条报警信息在规定时间内没有得到确认,便会以升级的方式向上一层用户报警。主要有人员升级与设备升级两种方式。人员升级是指第一级
6、报警接收人员在规定时间内没有确定报警信息,报警信息便发送给系统中设定好的上一级用户,以使报警信息能够得到及时处理。设备升级是指当使用第一种报警方式发出的报警信息在规定时间内没有得到确认,系统便自动使用设定好的新一级报警方式发送报警信息,以使报警信息能够得到及时处理; D.报警清除:告警发生后,操作人员可在任何画面按下确认键,关闭可闻告警声响,停止灯光闪烁(不关闭),故障排除后,恢复原色; l 智能报警: A.定时巡检:通过系统预设的安全时间组,将预先设定好的监控设备的测点参数或状态通过短信/电话/邮件的方式发送给指定的人员。 B.告警过滤:系统可对所有报警事件进行判断,分析各报警事件的因果关系
7、,通过预先设定的逻辑关系,屏蔽部分报警事件,减少突发性事件潮带来的误报警和容量冲击,实现准确定位事件根源,从而提高了管理人员的工作效率,设置过滤组可对过滤时间,过滤条件,以及过滤报警的描述进行设置,其中过滤条件可以根据时间、区域、机房、监控对象、监控点、告警数值等由用户进行设置。 C事件屏蔽规则:可选择不同的管理对象类型、对象、屏蔽的起始时间、结束时间、是否结束等方式进行事件屏蔽。 D.防误报警:系统具有盲时和区间跳跃判断防误报警功能,可对报警值设定连续报警时间和恢复稳定时间,避免空调冷凝水、温度临界浮动等特殊情况出现时频繁、大量的出现告警,盲时值和区间跳跃判断范围可由管理员自行设定,如:当出
8、现冷凝水时,系统应利用设定盲时做连续判断,监测水是否有蔓延,如消失无蔓延,则认为是无危害的冷凝水,只记录事件,不发出报警。在某个参数报警后,恢复时使用恢复盲时功能连续判断恢复后参数是否稳定,如稳定才发出恢复信息给管理员,避免数据跳变时不断发出恢复与报警信息造成骚扰。如有无用告警时间发生,管理员也可实行手动强制结束掉。 l 报警信息的查询 系统会自动记录每一条报警的详细信息。信息的具体内容包括:事件的报警时间、解除时间、机房名称、设备名称及位置、事件内容及报警发生时设备运行的数值等。事件日志具有查询功能,可按照日志的每个字段进行精确或模糊查询,具有导出excel电子表格后保存及打印的功能,任何操作权限的人不能对其进行任何修改。 l 报警及时 一般告警情况下,系统自动判别告警等级,即时完成相应处理。当出现比较严重的告警事件,系统可锁定当前事件页面,这时新增的事件将不再显示,重点关注和解决严重告警事件,第一时间向短信服务器发出报警信息,并对发送成功与否进行记录。