网络运维管理平台设计方案2017年7月目录1前言 ............................................................................................................................ 错误!未定义书签。
2项目综述 (4)2.1建设背景 (4)2.2建设目标 (5)2.3建设原则 (5)3解决方案 (6)3.1监控系统简介 (6)3.2架构 (7)3.3建议方案 (9)3.4产品选型 (10)4功能说明 (13)4.1通信线路监控 (13)4.2网络设备监控 (14)4.3网络拓扑 (16)4.4服务器监控 (18)4.5存储设备监控 (20)4.6虚拟化系统监控 (21)4.7应用及业务系统监控 (21)4.8数据库监控 (23)4.9IP/MAC功能(高级模块) (25)4.10SYSLOG日志分析(高级模块) (26)4.11SNMPtrap功能(高级模块) (27)4.12流量分析(高级模块) (27)4.13报表功能 (29)4.14定时巡检和联动告警 (30)4.15资产管理 (31)4.16网络设备配置自动备份与恢复 (32)4.17基于角色的分级权限管理 (32)4.18分布式管理集中监控 (33)4.19多个物理隔离网络统一监控预警(高级模块) (33)4.20机房环境监控 (34)4.21预警和运维服务管理 (41)4.22手机APP (41)4.23自定义首页和大屏显示 (44)5产品特点 (46)5.1领先的全硬件产品方案 (46)5.2网管动环监控一体化 (46)5.3更高效和安全 (47)5.4对网络和目标影响极低 (48)5.5易于定制扩展 (48)6案例及应用说明 ........................................................................................................ 错误!未定义书签。
7部分用户列表 ............................................................................................................ 错误!未定义书签。
8公司介绍 .................................................................................................................... 错误!未定义书签。
1 系统概述本建议书旨在给用户的IT系统管理者一个详尽和综合机房立体监控方案,以解决针对机房、网络基础设施和信息化系统日益增长的IT管理工作,提高生产力。
保障的范围涵盖:1.线路。
包括内部专网、互联网等线路的通断和质量、流量的监控。
2.网络设备。
包括各机房路由、交换和防火墙、负载均衡等网络设备的运行状态、性能、流量的监控。
3.服务器。
包括服务器硬件状态、linux、windows、AIX、HPUX、Solaris以及Vmware虚拟化操作系统运行状态(cpu、内存、磁盘空间、网口流量等)的监控,以及所运行的进程和服务的监控。
4.存储。
对IBM、NetAPP、HP StorageWorks等存储系统进行运行状态监控。
5.数据库和应用系统。
包括Oracle、Sqlserver、mysql、DB2、sybase、postgreSQL等常用数据库,WebSphere、Weblogic、Tomcat等中间件系统的监控。
IIS、nginx等应用和服务器上运行的用户各种通用和专用业务系统的监控。
6.机房动力环境。
可分阶段实施对机房的动力环境进行监控,包括温湿度监控、烟雾监控、漏水监控、市电监控、空气开关监控以及UPS、精密空调或民用空调监控,门禁、红外、门磁等安防监控,以及机房其他设施的监控管理。
2 系统综述2.1建设背景集团经过多年的信息化及信息安全建设,集团有大量的服务器,安装各样的操作系统,从事各种信息应用服务。
对于这些服务器及应用系统服务,管理员在运维中只有通过登录服务器检查系统,才能发现服务器、应用系统的故障并进行处理。
在网络建设方面,建设了为数不少的防火墙,还有IPS、负载均衡等网络设备。
这些设备产生大量的工作、访问日志基本上以孤岛的形式存在各自的系统中,有网管平台管理一般的网络交换机、路由器等设备,但网管平台功能平平,设备覆盖面窄。
目前系统运维监控的效率比较低,不能及时发现系统的异常以迅速解决隐患,若系统故障出现的出报高峰期,可能导致比较大的影响。
2.2建设目标通过部署整体运维解决方案,对网内基础设施、服务器、数据库、中间件以及业务应用系统等进行有效管理,为达到100%正常运行率以及网络使用的畅通、机房安全提供可靠保证,降低业务故障风险,提高IT部门事故处理质量、效率,由被动管理转化为主动管理,增加业务使用者的满意度,提升部门价值。
2.3建设原则1、安全生产的原则:由于网络系统的重要性,各种技术方案、产品、客户化工作的实际实施必须经过充分的测试和验证,并需精心设计实施方案,以保证不会对用户现有网络的正常运行和业务系统的正常使用造成任何影响;同时,应充分考虑工程实施过程中的回退和应急方案,以保证在最短时间内恢复由于新系统的实施对网络造成的影响。
2、开放性原则:网络系统管理平台需要基于开放的管理平台,遵循业界标准,并提供开放、灵活的信息交互及管理接口,能提供开发接口,方便扩展管理功能,并且支持第三方厂商的应用集成,为产品的选型提供更高的灵活性。
3、可用性原则:网络系统管理平台的部署不需对原有的网络系统结构、安全策略等方面做较大修改和调整,对原有网络系统性能影响最小化,尽量少的占用网络资源、被监控服务器资源不得超过现有资源的百分之五,可定期自动清除“垃圾”文件和“垃圾”数据。
4、健壮性原则。
网络系统管理平台具有较强的免维护能力,能够长时间稳定运行,自身维护要求简单,具有快速恢复功能。
5、扩展性原则:网络系统管理平台具有较强的扩展性,能够在包括管理范围、管理功能、管理数量等方面提供灵活、多样的扩展能力。
6、展示形式多样性原则:网络系统管理平台能够对收集的数据进行分析处理,生成技术、运维管理等层面的相关报表、视图等,根据不同级别用户的实际需求,提供灵活、多样的展示形式,能提供中文界面。
7、可定制原则:提供灵活的部署方式,在客户化、管理策略、事件关联、报警方式、报表生成、信息展示、管理流程等方面可以按实际需求进行定制,并支持用户的二次开发。
8、成熟优先、适度超前原则:系统整体设计应该统一规范,模块设计清晰合理,通信接口明确透明,能够有效地实现后台一体化管理。
在此基础上,该网络管理系统应具有适度的先进性。
3 解决方案3.1监控系统简介“网络管理平台”是创新和领先的综合IT运维管理产品。
“极简”的设计,提供机房IP网络全面监控预警解决方案。
监控内容包括DDN专线和VPN隧道等通信线路、服务器的硬件及各种操作系统、数据库、中间件和应用系统、网络设备的运行状态和性能,IP和应用流量分析,机房动力环境等。
3.2架构“网络管理平台”专用系统基于高效安全Linux内核,全web配置管理,运行更稳定可靠,监控预警更快速准确。
优化的核心程序,对网络带宽占用极低,同时对目标网络设备和服务器性能影响极低。
系统主要由数据采集、数据储存和分析处理、B/S可视化人机界面、报警等模块组成,并提供多种扩展组件。
系统架构3.2.1 数据采集模块数据采集模块通过SNMP、WMI、SYSLOG、SnmpTrap、IPMI、各种应用层协议(ICMP、HTTP、FTP、SSH、TELNET、SMTP、POP3等)及私有协议,对网络专线(DDN、VPN)、网络设备、服务器、各种应用和数据库系统、机房环境等进行各种数据采集,提交到数据储存和分析模块处理。
3.2.2 数据储存和分析模块数据储存和分析处理模块对采集模块提交的的数据进行分析,确定监控目标的状态(正常、一级和二级告警、错误等),向B/S可视化人机界面模块提交状态信息。
同时,将数据储存到数据库中,提供接口供人机界面模块进行历史数据查询。
3.2.3 B/S可视化人机界面模块B/S可视化人机界面模块通过web对用户提供配置、管理和告警接口。
用户通过web进行系统配置、监控目标配置,查看网络拓扑图和监控目标的状态,查询历史数据生成详尽的性能曲线图、故障和告警历史记录,生成报表。
人机界面也提供完整的管理员操作日志查询、配置备份和恢复、系统手动和自动升级等多种管理功能。
3.2.4 预警模块预警模块通过人机界面的弹出窗口和声音进行声光预警,同时支持通过发送电子邮件、手机短信、微信、手机APP等多种手段进行预警。
3.2.5 扩展组件系统提供流量分析、机房动力环境、设备日志储存管理、IPMAC管理、网络设备配置管理等多种组件,根据需要可灵活扩展。
●流量分析组件通过netflow/sflow/抓包分析等收集网络设备数据流信息。
并能进行分析、汇总,图形化输出制定时间范围和流向的汇总表、用户IP流量TOPN饼图、TCP/UDP/ICMP等协议流量TOPN 饼图,输出各类应用的流量详细情况和TOPN列表等。
通过上述手段进行流量相关的故障分析和定位。
●机房动力环境组件结合动力和环境探测设备,可支持温湿度、普通漏水、定位漏水、烟雾、电量、空开状态、UPS、电池组、精密空调、普通家用空调、红外、消防、防雷、新风机、加湿机和门禁等机房动力环境参数的监控。
●日志储存服务组件通过SYSLOG协议接收和储存被监控的网络设备、服务器的日志。
提供查询、管理功能。
支持设置日志告警通知策略,将包含指定关键字的日志信息发送给指定管理员。
支持设置报表策略,将包含不同关键字(如error,warning,failed等)的日志进行分类,形成日志分类库,并根据分类库对日志进行分析汇总,形成分类日志报表。
●IPMAC管理组件可实时显示网内计算机、服务器、其他IP设备与交换机关系的详细信息表,包括IP、MAC、设备名称、所连交换机的IP、名称、端口、VLANID和VLAN名称等。
并能动态实时更新。
可设置动态更新的时间间隔,最低为秒级。
能快速查询IP地址、MAC地址等所连交换机的端口。
能通过实时表添加或者手动加入的方式建立基准表信息表、合法的IP、MAC信息表。
系统能自动比较实时表、基准表、合法MAC表信息,通过IP变更表、新增MAC表、端口变更表等实时记录异常信息。