当前位置:
文档之家› 中国电信上海公司动环监控情况汇报
中国电信上海公司动环监控情况汇报
实施上海公司动 环一级监控系统
2003
2009
2010.7
建设完成城市 中心级动环监 控系统
动环一级监控运维 管理体系建立,深 化和完善相关的管 控工作
上海公司动环系统建设历程
动环一级监控建设三个阶段
2012-2013 告警的压缩 重大告警监测和管控 故障自动派单的试点
2014年以后 告警的关联处理、 故障自动派单的应 用推进
上海公司动环一级监控实施情况
上海公司动环一级监控故障派单情况
历年派单量统计情况
上海公司动环一级监控历年故障单统计情况
年故障总量(单位:条)
25000 80
日均故障量(单位:条)
70
20493
20000
21875 18661
68
60
56
48
60
15000
10000 5000 0 2010年 (7-12月) 2011年 2012年 2013年 (1-9月)
市区局动环监控系统 郊县局动环监控系统 枢纽楼动环监控系统 产品部动环监控系统
数据库 服务器 应用/WEB 服务器 数据库 服务器 应用/WEB 服务器 数据库 服务器 应用/WEB 服务器 数据库 服务器 应用/WEB 服务器
注:上海公司事业部(信网部等)的动环监控系统,由于联网条件不具备等原因,目前暂未 接入到城市中心一级监控平台。对事业部的动环监控,城市中心目前只承担二级监控职责。
制度建设: 周期维护工作上报流程 受控设备故障处理流程 非受控设备故障处理流程 告警分级及处理时限 关键、重大故障处理流程 应急故障处理流程
上海公司动环一级监控实施情况
上海公司动环一级监控覆盖范围
局站数量
受控设备
监控通道
上海公司动环一级监控覆盖范围
全网受控局站统计(单位:个) 2745
实际进度
A、B、C类局站动环监控率100%(刘 行正在实施), D类局站动环监控率大于85% 14个区局已实现动环监控系统省集 中 省IDC四星级及以上机房的IDC设备 监控率达到100%。 支撑完成率达到50%
是否 达标
1
是
2
是
3
实现集中监控告警压缩率达到95%,根 告警自动转单率达到20%
按照2010年1020万告警到2013年180 万告警(按2013年1-9月告警预估), 已实现告警压缩82.4%,但离95%的 否 压缩率指标尚有差距。自动派单功 能已开发完毕,目前在梳理、规范 自动派单规则。
计划改进工作
动环基础数据命名规范化的实施
动环告警关联规则的实施
告警压缩及自动派单工作的推进
移动客户端的研发
计划改进工作
基础数据命名规范化工作: 建立统一的数据模板,规范基础数据 告警关联规则实施: 实现告警关联,展示告警的主从关系
告警压缩及自动派单工作推进: 频繁告警归并;告警发生延时
中国电信上海公司 动环一级监控实施情况汇报 及集约化管理工作对标
中国电信上海公司 网运部电源空调中心
2013年11月7日星期四
目 录
上海公司动环一级监控实施情况汇报 动环一级监控建设历程
动环一级监控覆盖范围
动环一级监控告警量统计情况及压缩措施 动环一级监控故障派单情况统计 上海公司动环监控集约化管理工作对标与举措
移动客户端的研发(实现功能): 故障单的接单、回单 源自源清点、核查、维护工作 周期工作填写
谢 谢!
设备情况
全网受控设备统计(单位:套) 全网监控通道统计(单位:万个)
18.5
28575
9.3
608 31
端局 模块局 POP点 其他
11172 4558
电源 空调 监控 5202
6.9 5.0
424
其他
电源
空调
监控
其他
对监控系统中受控设备统计结果说明如下: 1、全网受控各类局站共3808个,各类设备49507套,监控通道共397518个; 2、监控类设备总数最多,但通道数最少,主要因为监控设备多为单通道设备(如温 度、湿度、端局通讯等); 3、电源类设备通道数最多,主要由于智能设备通道多(如开关电源、UPS、油 机)。
集约化工作对标
针对集约化管理工作的重要改进 计划改进措施
上海公司动环一级监控实施情况
上海公司动环一级监控建设历程 动环系统建设历程 动环系统架构
一级监控制度建设
上海公司动环系统建设历程
1997年开始建设区域级动 环监控系统 2000年基本建设好8个市区 局、7个郊县局的动环监控 系统 1997 ~ 2000
上海公司一级监控制度建设
职责分配: 动力一级监控单位(城市中心):负责对全网(区局)通信电源、 空调设备的集中监控、告警受理和障碍派修工作。 动力一级维护单位(区域中心):承担所辖区域内的动力系统设备 基础维护工作,响应动力一级集中监控单位发起的故障修理需求, 调度本部门维护人员进行现场处理,及时反馈故障处理情况。
告警量压缩措施
频繁告警监测
告 警 量 压 缩
告警门限调整
告警恢复延时
告警量压缩措施
频繁告警监测
• 频繁告警定义:监控系统单个监控通道单日告警总数 达到50次,认定为此告警为频繁告警。 • 频繁告警特征:告警持续时间短,多数为通信告警及 模拟量跳变类告警,告警易自复,在监控界面停留时间 短不易被监控人员注意 • 针对措施:系统自动监测一天内的单个监控通道所产 生的告警总数,超出一定数量的告警则认为是频繁告警 ,立即通知到监控操作人员,进行相应的处理。
上海公司动环监控集约化管理工作对标与举措
针对集约化管理工作的重要改进
频繁告警检测
重大告警列表和自动派发
周期维护工作和工程割接管理
针对集约化管理工作的重要改进
频繁告警监测
频繁告警监测弹窗提示功能 频繁告警告警根据需求自动 派发功能
重大告警列表和自动派发
重大告警(直流电压和温度)发 生时加入观察列表 定期跟踪告警实时状态 达到设定门限自动派发
50
40
8835
30 20 10 0 2010年 (7-12月) 2011年 2012年 2013年 (1-9月)
上海公司动环监控集约化管理工作对标与举措
集约化管理工作对标
已完成项目
待完成项目
集约化管理工作对标
序 号 集团要求(2013年)
在A、B、C类局站动环监控率100 D类局站动环监控率大于85% 20%本地网实现动环监控系统省集中 试点 省IDC四星级及以上机房的IDC设备监 控率达到100% “集中监控、集中操作、综合分析、 现场维护、网络优化、装维服务、客 服支撑”七大场景支撑要求完成率达 到50%
告警量压缩措施
告警门限调整
• 调整依据:通过对频繁告警历史数据的分析,发现 很多情况下监控通道频繁发生告警是因为通道数值频 繁在门限附近跳动,此类一般不做抢修处理。 • 采取措施:在业务上或者实际情况允许的前提下, 有针对性的对部分告警门限进行了调整: MINI POP点的温度告警门限全部取消。 蓄电池单缸电压的下限告警门限取消。(通过电 子报表系统中的“蓄电池普测报表”和“落后电池报 表”中的异常数据判读来监测蓄电池异常的情况。) 机房温度告警上限提高
告警量压缩措施
告警恢复延时
• 通过对告警发生情况的分析,频繁告警主要由于告 警自复后短时翻转造成。
• 针对这种情况,采取了告警恢复延时的措施: 告警恢复时,并不马上上送告警恢复信息,而是等 待一段时间,如果又产生相同的告警,则认为是告警 状态的瞬跳,将前面的告警恢复信息和新产生的告警 信息均抛弃。反之则将告警恢复信息上送,告警恢复
1000 800 600 400 200 0
1009
348
138
10000 5000
9508 5055
0
2010年
2011年
2012年
2013年 (1-9月)
2010年
2011年
2012年
2013年 (1-9月)
2011年起对告警量采取相关措施进行压缩 2012年告警量同比2011年下降65.5% 2013年1-9月告警量同比2012年1-9月下降53.2% 日均告警量从2010年的27945条下降到2013年的5055条,为进一步实现告警关联和 自动派发打下了良好的基础
上海公司动环一级监控实施情况
上海公司动环一级监控告警量统计情况 及压缩告警量措施 历年告警量统计情况
告警压缩的措施和手段
上海公司动环一级监控历年告警量统计情况
年告警量(单位:万条)
1200 30000
日均告警量(单位:条)
27945 27644 25000 20000 15000
1020
M1
M2
基础数据命名规范化及 告警关联规则的研究
M4
M3
周期维护工作和 工程割接管控
研究出一套适应上海公司动环 监控现状的动环监控基础数据 统一命名规范 研究出一套告警关联规则
周期工作记录上送城市 中心;城市中心监控系统关联周 期工作与告警信息,并在告警信 息标注。避免对周期工作引起的 告警派单
上海公司动环监控集约化管理工作对标与举措
2010-2011 保证告警的准确性 、及时性
上海公司动环系统架构 两级架构
城市中心
C/S架构 实时监控 B/S架构 数据维护、报表
通讯网络
动力专业 2M传输专网 ENI网络
应用服务器 数据库 服务器 WEB 服务器
城市中心监控网管 系统(CSC)
C接口
区局级监控网管系 统(SC)
区域中心
C/S架构 实时监控 B/S架构 数据维护、报表