当前位置:文档之家› 中科同舟数据中心集中监控系统设计方案

中科同舟数据中心集中监控系统设计方案

**数据中心机房集中联网监控系统设计方案北京中科同舟科技有限公司2016年01月05日目录1.1方案优势 (5)1.2系统概述 (6)1.3建设目标 (6)1.4需求分析 (7)1.4.1 监控中心管理系统要求 (7)1.4.1.1 总体要求 (7)1.4.1.2 支持电子地图导航 (8)1.4.1.3 支持3D多画面 (9)1.4.1.4 告警事件综合管理 (9)1.4.1.5 支持报表查询功能 (10)1.4.1.6 权限分组管理 (10)1.4.2 分机房监控系统需求 (10)1.4.2.1 总体要求 (10)1.4.2.2 动力监控部分 (12)1.4.2.3 环境监控部分 (12)1.4.2.4 报警管理功能 (13)1.4.2.5 支持3D画面 (13)1.4.2.6 智能联动功能 (13)1.4.2.7 报表查询功能 (14)1.4.2.8 权限管理功能 (14)1.4.2.9 日志管理功能 (14)1.5系统设计 (15)1.5.1 设计原则 (15)1.5.2 设计依据 (15)1.5.3 系统结构 (16)1.6系统性能 (17)1.6.1 可靠性 (17)1.6.2 稳定性 (17)1.6.3 实时性 (17)1.6.4 安全性 (17)1.6.5 维护性 (17)1.6.6 扩充性 (17)1.7分机房监控系统功能 (18)1.7.1 功能概述 (18)1.7.2 产品六大特点: (19)1.7.3 产品三大优势: (20)1.7.4 3D动画特色功能 (22)1.7.5 UPS监控 (25)1.7.6 蓄电池监测 (27)1.7.7 配电参数监测 (28)1.7.8 精密配电柜监测 (29)1.7.9 直流/交流配电屏监测 (29)1.7.10 精密(列间)空调监控 (31)1.7.12 漏水检测 (33)1.7.13 天窗监控 (34)1.7.14 告警和事件管理功能 (34)1.7.15 报表功能 (35)1.8中心集中监控管理平台 (36)1.8.1 平台特点与优势 (36)1.8.2 3D动画特色功能 (37)1.8.3 电子地图导航 (41)1.8.4 报表功能 (45)1.8.5 告警事件综合管理 (46)1.8.6 系统维护 (46)1.8.7 权限管理 (47)1.8.8 日志管理功能 (47)1.8.9 告警事件分派通知 (47)1.8.10 报表定制 (48)1.8.11 双机热备 (48)1.9主要硬件设备介绍 (49)1.9.1 嵌入式一体化监控主机 (49)1.9.1.1 概述 (49)1.9.1.2 特点 (49)1.9.1.3 规格 (50)1.9.2.1 概述 (51)1.9.2.2 特点 (51)1.9.2.3 功能规格 (52)1.9.3 RT-800报警通知服务器 (53)1.9.3.1 概述 (53)1.9.3.2 规格 (53)1.9.3.3 特点 (54)1.1方案优势1、分布式管理分机房不依赖中心监控系统能完全独立管理和维护,相对独立、自成系统,同时支持接入监控中心。

监控中心也能同时管理和维护所有分机房;各自关注各自的业务,互不影响,方便管理和维护。

现场监控关注设备运行状况,告警处理和联动控制,中心关注数据展现、报表,统计分析等管理业务。

2、大大降低监控中心服务器处理负荷,响应速度快。

由于采用了分布式监控模式,现场分机房监控主机处理了大部分数据与告警处理业务,数据中心监控平台只负责数据存储、数据展现和业务管理,对CPU,内存的压力大大降低,响应速度快,对以后的管理业务可扩展性大大增强。

3、系统稳定性,可靠性强,升级维护方便。

由于各机房分布式处理监控数据,某一个监控节点出现故障,不影响其他机房和中心系统的正常工作,影响范围很小。

即使中心网络出现故障,也不影响各机房监控的正常工作,可靠性较高。

系统功能升级时,只需要在监控中心远程升级各个机房监控配置,升级维护也很方便。

若采用串口服务器联网集中监控方案,一旦某个设备接口或功能模块出现异常,将导致整个监控系统奔溃,影响很严重。

4、大大降低网络负荷使用传统方案,监控中心集中监控需要实时对各分机房的所有设备发送查询指令和接收数据,将对公司总部中心网络造成严重负荷;而分布式方案则不会,各机房设备数据是由监控单元现场处理后主动上报的,只传输变化的数据和告警,有人IE浏览设备时才传输实时数据,大大降低网络负荷。

5、不会漏告警。

不会漏告警。

若中心或分机房网络有故障或维护期间,其他分机房仍能正常独立运行,网络恢复后,系统自动同步历史数据和告警到中心。

而传统监控方案,升级维护期间,各网点的都处于真空状态,可能出现漏告警。

1.2系统概述在政府、银行、证券、教育、医疗等行业中广泛分布着各种业务机房(数据机房),由于各种类型的业务数据直接由这些机房汇聚到数据中心,任何一个机房断电、系统故障、人为操作不当都有可能造成各种业务的中断或数据丢失,继而影响企业业务的停滞和运转。

因此,企业对机房连续性要求极高,对关键业务数据安全性要求也非常之高。

但是新建和维护这些机房成本越来越高,随着机房数量的增加,管理也变得愈加庞大和复杂。

如何维护好这些机房,及时发现隐患和排除故障,降低管理成本,提高运维效率,延长使用寿命,成为管理者关注的重点。

中科同舟大型数据中心监控系统为企业分布式机房的管理与维护的提供专业解决方案,通过采用TCP/IP方式,在Internet中,在有线或无线LAN网中,在VPN虚拟网中等等,分机房可以很容易与管理中心建立起联系,用较低的成本,在管理中心对广泛分布的机房动力设备、环境、消防、门禁、视频等实现统一监控管理,实现安全管理,故障预警定位,紧急事件响应,节能降耗等智能化管理业务和能耗统计、故障统计、数据分析,设备质量评估等增值业务,提高企业运维效率,降低管理成本。

1.3建设目标为××数据中心建立联网的监控运维系统,各机房主要监控对象是UPS、配电屏、精密配电柜、高压直流、精密空调、列间空调、加湿器、温湿度、天窗控制、漏水、机柜温度检测等,实现24×365的全面集中监控和管理,保障空调安全高效运行,以实现最高的机房可用率,并不断提高运营维护管理水平。

机房监控运维平台要能实现四个目标:⏹为机房内各系统及设备运行提供高度稳定可靠的监控信息资源;⏹节省机房运行管理费用,达到短期投资长期受益的目的;⏹确保提高机房管理工作效率并提供安全舒适的工作环境;⏹系统软/硬件均采用模块化结构设计,适应发展需要,做到具有可扩展性、可变性,适应环境的变化和工作性质的多样化。

1.4需求分析机房联网监控具体需求如下:××数据中心有9个电力机房、22个模块化机房,需要监控UPS、配电屏、精密配电柜、高压直流、精密空调、列间空调、加湿器、温湿度、天窗控制、漏水、机柜温度等;并分布式组网建立集中监控中心,集中管理各个分机房的动力与环境参数,提高机房维护效率,降低维护成本。

1.4.1监控中心管理系统要求1.4.1.1总体要求1)安全可靠中心监控管理平台采用Linux操作系统,有效杜绝Windows系统不隐定和不安全、以及各种病毒的干扰,最大程度保证机房网络安全。

2)稳定可靠所有联网机房均采用嵌入式监控主机分布式独立运行,不会因为网络中断或某个环节故障而造成系统瘫痪,中心监控系统关注数据管理和展现等业务功能,架构优良,整个系统稳定可靠。

3)分布式多级联网监控管理支持三级以上结构机房联网监控,分布式组网,支持至少1000个分机房监控系统接入能力,满足未来其他分机房并网接入,各级管理员只能查看和操作权限范围内的机房,监控中心管理员可管理和查看所有机房。

4)实时性高支持集中监控各机房的UPS、配电屏、精密配电柜、高压直流、精密空调、列间空调、温湿度、天窗控制、漏水、机柜温度状态参数等情况,数据采集准确,实时速度快,告警反应迅速,可在异常发生的10秒内反应故障报警。

5)IE管理与浏览,使用简单B/S结构,无需安装客户端软件,用户通过IE即可随时随地远程管理与浏览,支持持电子地图、3D动画、报表查询、权限分组、配置管理等业务功能,支持通过WEB浏览器修改机房设备参数的名称和告警阀值等信息。

6)完善的告警机制具有自动巡检、告警过滤、故障定位、语音提示、告警联动、告警统计等告警管理功能;支持现场语音、声光、邮件、短信、电话语音等多种告警通知方式。

7)3D多画面浏览监控中心可通过WEB浏览查看和管理监控系统,支持WEB 3D动画方式浏览,支持1/4/9/16宫格方式多画面浏览,直观浏览各机房布局,设备参数和告警信息。

8)灵活多样的组网方式可利用ADSL、TCP/IP、无线路由、3G等传输资源组网,也可单一和混合组网。

分布式多级联网监控管理。

1.4.1.2支持电子地图导航监控中心可通过WEB浏览查看和管理监控系统,具有电子地图导航功能,用户登录系统后,首先进入电子地图导航,在该页面内置电子地图引擎,在地图上可以看到每一个机房分布情况,单击分机房节点可进入到该分机房的设备实时监控界面,查看各机房的监控参数,层次分明,逻辑清晰,结构简单。

当有告警发生时,可自动弹出告警提示窗口。

1.4.1.3支持3D多画面监控中心可通过WEB浏览查看和管理监控系统,支持WEB 3D动画浏览、3D报警和3D组态,直观浏览机房布局,设备参数和告警信息。

1)支持机房3D模型现场建模,支持总览整个机房3D视图,支持3D视图动画旋转,以不同角度浏览机房布局,方便自定义快速维护。

2)可以通过鼠标的滚轮来放大缩小3D视图,通过双击或鼠标移到场景内的设备模型,可查看机房内被监控设备的设备参数和运行状态。

3)支持3D动画告警展示,当机房内有设备发生告警,设备红色闪烁方式告警提示,直观展现机房报警设备。

4)支持1/4/9/16宫格多画面方式浏览,同时监控多机房,可全屏浏览。

1.4.1.4告警事件综合管理用系统的报警级别按重要性设为1-4级,按严重程度分别定义为通知,一般告警,严重告警、紧急告警。

报警通知方式:系统提供界面报警、声光报警、E-Mail报警等,同时告警信息可以限次播放,且两次告警间的停顿时间可以灵活设置。

报警缓冲:系统可设置报警缓冲的时间,当多次采集到该报警持续一定时间后才真正将报警在事件栏上显示出来,有效减少误报警的发生,提高监控系统的准确性。

报警分发管理:可以通过界面设置哪些告警以什么方式发送给哪些人报警确认:用户通过事件栏可以看到设备报警和恢复的情况,同时可在事件栏里对该事件进行确认处理。

确认处理后,该事件在待确认事件栏消失,转入未结束事件栏,直至事件结束或用户确认时消失。

相关主题