智能运维管理系统V2.0 需求规格说明书修订目 录文档介绍文档目的 文档范围 读者对象 参考文档 术语与缩写解释 系统概述系统建设目标 系统总体结构 用户的特点 设计和实现上的限制 系统功能性需求双活中心工作运行状态监控模块 场景描述用例分析 参与者列表 专用监控功能模块 场景描述 用例分析 参与者列表 故障告警模块 场景描述 用例分析 参与者列表 用例描述 数据配置管理模块 场景描述 用例分析 参与者列表故障切换管理模块场景描述 用例分析 参与者列表 数据接口 场景描述 用例分析 参与者列表 故障处理 场景描述 用例分析 参与者列表 系统非功能性需求易用性需求 方便增加监测设备方便删除监测设备 方便定位故障或者异常设备 监测设备在启动与停止监测之间方便转换 性能、并发性需求 对性能及并发性的特殊要求 扩展性需求 采集和监控服务器的集群支持 支持公司 平台的整合 支持公司单点登录系统的整合 支持对物联网智能设备的直接监测 安全及保密性需求 敏感数据加密 敏感操作进行确认 可靠性需求运行可靠性数据可靠性 可维护性需求 监测设备配置优化 软硬件环境约束 系统备份与恢复要求系统日志 其它需求外部接口说明短信发送接口 应用软件服务监测接口文档介绍文档目的在《智能运维管理系统 立项建议书》的基础上对各个功能模块做出详细的需求分析,为项目后续的设计和开发提供依据。
文档范围本文档包括服务器监测、数据库监测、交换机监测、 平台监测、物联网智能设备监测、应用软件服务监测、个性化主题展现、配置管理的需求规格说明,同时也包括整个系统平台的建设目标、总体结构、网络结构、系统接口描述、用户界面需求和软硬件环境方面的需求规格说明。
读者对象项目的系统设计人员、系统开发人员、系统测试人员以及配置管理人员;公司内部 项目的其干系人、领导、专家等。
参考文档智能运维管理系统 立项建议书,,物联网智能数据采集和控制平台需求规格说明书,, 监控系统 用户指南,术语与缩写解释系统概述系统建设目标公司目前在监控系统方向有两个产品,都是基于 结构,一个是监控系统,另外一个是物联网智能设备监控系统。
监控系统是公司提出的系统集成监控解决方案,其主要目标是监控 系统中的各种信息节点 服务器、数据库、交换机、 平台 的运行状态,提供故障的显示、告知,以及故障恢复功能。
物联网智能设备监控系统是上海市的科研课题,由硬件(数据采集与控制终端简称 )和软件(嵌入式软件和智能设备监控系统)两部分组成。
设备提供和有线或者无线终端设备的接口, 设备内的嵌入式系统负责终端设备的数据采集和控制、数据处理和封装以及对通信协议的转换,与上层软件统一采用 协议进行通信。
智能设备监控系统通过 协议收集终端设备测点的数据,监控 设备及终端设备的状态,个性化显示监测数据和状态,在监测数据和状态异常情况下通过声、光、短信告警,提供历史数据和历史事件查询,并可以通过配置的方式很方便的实现对各种不同类型、不同通信协议终端设备的监控。
监控系统搭配公司其它产品在湖北、江苏等几个省份部署,物联网智能设备监控系统通过课题组专家的验收,在监控系统使用的过程中以及物联网智能设备监控系统开发和验收的过程中,收到用户、领域专家、公司领导、公司专家和潜在用户的意见和建议,通过总结和分析这些意见和建议,得出本系统建设的目标如下:基于 架构实现运维管理系统的整体框架;实现对 操作系统的服务器进行监测;实现对 和 数据库进行监测;实现对公司内部交换机进行监测;实现对 平台进行监测 包括 服务器、通信服务器和坐席服务器 ;实现异常事件监测;实现短信告警规则;实现告警记录及查询;实现操作记录及查询;实现对物联网智能设备进行监测;实现对物联网智能设备的配置管理;实现主题的个性化配置;封装个性化展现控件;实现对公司三台合一接处警系统服务的监测; 对公司内部的关键设备进行监控。
系统总体结构图中, 基础业务平台框架是整个智能运维管理系统的基础架构。
平台、三台合一、警情分析、预案系统、 系统和其他系统是本系统需要监测的应用软件,本系统提供应用软件服务监测接口,各需要监测的应用软件实现此应用软件服务监测接口。
短信服务平台为本系统提供短信发布服务,本系统提供发送短信所需要的发送人、接收人、发送内容等信息。
服务器监测、数据库监测、交换机监测、 平台监测、智能设备监测、应用软件服务监测、配置管理、监测数据管理、告警规则管理、异常规则管理、主题管理和操作日志管理是本系统提供的主要功能。
用户的特点本系统的用户主要有:公司内部的系统运维管理员;购买本公司产品的客户运维管理员;人防领域的潜在用户。
公司内部的系统运维管理员主要通过本系统了解本公司产品部署在全国各地客户方的运行状态,重点关注监测对象的危险和故障事件。
公司内部的系统运维管理员对计算机知识比较熟悉,通过简单的培训即可很好的使用本系统,使用本系统的频度一般也比较高。
购买本公司产品的客户一般是公安和消防,这类客户的运维管理员对系统维护和计算机相关知识一般不是很熟悉,通常仅使用本系统的故障告警功能,使用频度一般也不会很高。
人防领域的潜在用户和公安、消防的用户差不多,这类用户对系统维护和计算机相关知识一般不是很熟悉,因此通常也是仅使用故障告警功能,使用频度较低,一般情况是系统自动运行,等发现问题以后通过告警的方式通知用户来解决问题。
设计和实现上的限制约束于公司在 平台上开发的技术选型。
系统功能性需求双活中心工作运行状态监控模块场景描述市局、分局两级架构的系统监控。
双中心监控支持图形化结构、拓扑结构、列表结构等展示坐席当前登录区域,双中心话务量统计等信息。
权限管理,对市局及分局的不同使用者的账号进行集中管理。
用例分析支持两级架构的系统监控市局通过公安网与分局进行连接,获取分局监控数据。
使用浏览器作为最终展现界面,支持多种方式信息查看以图形方式、拓扑结构、列表结构等所有坐席当前登录区域,监控警情话务量统计数据、监控负荷分担情况等。
通过拓扑图方式,展现当前系统的节点及连接关系。
并通过不同的图示、颜色等方式,标注异常情况的节点和连接。
展示系统的软件系统结构图。
并通过不同的图示或颜色,标注其中的异常节点。
对于数值化的监控数据,通过图表的方式进行直观展示。
采集数据可以实时展现。
权限管理监控平台对市局及分局的不同使用者的账号进行集中管理,根据用户的不同管理权限,向不同用户开放的不同的控制权限。
让不同职能的管理人员做到各行其职,提高监控管理的规范性及安全性。
参与者列表信息系统负责人、信息系统管理员、运维工程师、研发工程师专用监控功能模块场景描述排队调度机、信令链路、 通信链路、通信服务软件、 服务、坐席服务、复用设备、手机定位、短信报警、录音系统、 服务、处警分配服务、二级接入服务、报警用户信息服务、数据库同步监控 各分局、直属单位、联动单位监控用例分析软件监控主要是通过监控服务器对双中心的各自运行软件的服务处理实时监控同步,提以及各类应用程序的检测。
能够检测当前程序的运行状态。
提供通用接口供应用程序上传自身详细信息。
可对上海应急联动双活中心的接入大屏系统、警情分析系统、录音系统、统一门户平台、值班排班系统、查询统计软件、科所队系统、分局二级接入服务器软件、二级分配服务器软件实时状态监控以及软件和应用程序的进程、服务、端口等的运行状况,对系统日志进行分类扫描查询。
排队调度机、信令链路、 通信链路、通信服务软件、 服务、坐席服务、复用设备、手机定位、短信报警、录音系统、 服务监控。
坐席服务监控对两个中心的坐席服务的运行状态进行监控;当坐席服务异常停止则进行告警,并监控切换状态。
监控双中心之间坐席服务消息同步状态。
对双中心坐席服务器的链路情况进行监控。
处警分配服务监控对双中心处警分配服务的运行状态进行监控,如任一个中心的处警分配服务发生异常停止则进行告警,并监控切换状态。
监控双中心分配服务器消息同步状态。
对双中心分配服务器链路进行监控。
二级接入服务监控对 个分局二级接入服务的运行状态进行监控,对 个分局二级接入服务的登入到双中心处警分配服务器的情况进行监控。
当双中心系统故障时,对 个分局的切换状态进行监控。
对 个分局的接入服务异常停用等情况进行监控对接入服务器链路进行监控。
手机定位服务监控对两个中心的手机定位服务的运行状态进行监控;当手机定位服务异常停止则进行告警,并监控切换状态。
监控双中心之间手机定位消息同步状态。
对双中心手机定位服务器的链路情况进行监控。
短信报警服务监控对两个中心的短信报警服务的运行状态进行监控;当短信报警服务异常停止则进行告警,并监控切换状态。
监控双中心之间短信报警消息同步状态。
对双中心手机短信报警服务器的链路情况进行监控。
报警用户信息服务监控对两个中心的报警用户信息服务的运行状态进行监控;当报警用户信息服务异常停止则进行告警,并监控切换状态。
监控双中心之间报警用户信息的消息同步状态。
对双中心手机报警用户信息服务器的链路情况进行监控。
数据库同步监控对双中心数据库同步进行监控;当主用数据库的软件、硬件发生故障时进行告警;当主备库切换时,对切换的全过程进行监控;当启用数据库离线模式时,对所有暂存服务进行监控;服务监控对查询统计系统等 应用服务的监控,监控服务运行状态。
通信链路状态监控通信链路状态监控主要是 中继线路、 传输线路、信令链路监控等专用链路的实时监测监控。
在拓扑上展现设备、机箱、远端以及链路,并通过子网进行划分。
所有的设备在拓扑上都有节点对应,所有的远端设备在拓扑上都有节点对应,默认情况下,局端板卡不在拓扑上显示。
拓扑实时显示资源的当前状态。
参与者列表信息系统负责人、信息系统管理员、运维工程师、研发工程师故障告警模块场景描述对异常事件及故障进行客户端告警以及短信告警(需要与短信平台对接)。
颜色告警和声音告警并提示负责人及联系方式信息。
用例分析监控模块应当具备故障告警功能能够自定义告警的条件和级别,并能够定义组合条件的告警提供防误报机制,提供防误报机制(缓冲机制),只有在故障时间超过限值后,才对其作为故障处理。
对于在缓冲时间内恢复的故障,不作为故障处理(但需要记录)。
提供故障告警的编辑界面,要求方便易用提供多种故障告警方式:声光告警:在客户端上通过声音和颜色的方式,提醒当前有故障需要处理短信告警:对于严重告警,需要通过短信模块,将故障短信及时发送到维护人员的手机上对接受理台和其他系统:由于监控模块是 结构,声光告警无法保证能及时得到处理。
监控模块应当对接受理台或大屏系统,在界面上显示严重的故障信息,从而保证故障能及时得到处理在用户修复故障之前,将反复进行故障告警,从而保证故障能得到及时的处理告警策略可以扩展,常用的告警策略有超过告警值即告警、一段时间内超过告警值几次即告警、一段时间内最多只告警一次。