中国移动TD-LTE 集中维护白皮书目录目录 (2)1 概述 (5)2 适用范围 (5)3 集中维护架构和职责 (5)4 运维质量管控 (8)4.1 实时性维护问题管理 (8)4.1.1流程架构 (9)4.1.2工作职责 (9)4.1.3 集中分析性能事件告警库 (9)4.2 非实时性维护问题管理 (10)4.2.1流程架构 (11)4.2.2各环节的责任人及职责 (11)4.3 非实时性维护分析规则 (12)4.3.1基于可用性 (12)4.3.2基于告警 (13)4.3.3基于性能 (13)4.4 异常状态基站监控规则 (14)4.4.1小区可用性 (14)4.4.2零业务站址 (14)4.5 运维质量管控指标集 (14)4.6 专题维护 (15)4.6.1 基站健康度评估体系 (15)4.6.2 基站智能节电 (19)5 设备质量管理 (20)5.1 设备问题与需求管理 (20)5.1.1设备问题与需求管理原则 (20)5.1.2流程架构 (21)5.1.3各环节的主要职责 (22)5.1.4各环节的流转规则 (23)5.2 设备版本管理 (23)5.2.1设备版本管理原则 (23)5.2.2流程架构 (24)5.2.3各环节主要职责 (24)5.2.3各环节主要工作内容 (25)5.3 设备后评估管理 (27)5.3.1设备后评估管理原则 (27)5.3.2流程架构 (27)5.3.3各环节主要职责 (28)5.3.4各环节主要流转规则(更新较大,全部更新) (29)6 无线安全管控 (31)6.1 无线账号管理 (31)6.1.1流程架构 (31)6.1.2各环节的流转规则 (31)6.1.3各环节的责任人及职责 (32)6.2 无线数据操作管理 (33)6.3 网优大数据安全管理 (34)7 维保执行管控 (34)7.1 现场服务 (34)7.1.1流程架构 (35)7.1.2各环节流转规则 (35)7.1.3各环节责任人及职责 (36)7.1.4各环节的具体工作内容 (36)7.2 故障处理 (37)7.2.1流程架构 (37)7.2.2各环节流转规则 (37)7.2.3各环节责任人及职责 (38)7.2.4各环节的具体工作内容 (38)7.3 硬件返修 (39)7.3.1流程架构 (39)7.3.2各环节流转规则 (40)7.3.3各环节责任人及职责 (40)7.3.4各环节的具体工作内容 (41)7.4 技术咨询 (42)7.4.1流程架构 (42)7.4.2各环节流转规则 (43)7.4.3各环节责任人及职责 (43)7.4.4各环节的具体工作内容 (43)8 支撑手段建设 (44)8.1 维护分析平台的数据来源 (44)8.2 维护分析平台与OMC的接口指令功能 (45)8.3 综合资源管理平台与集中故障平台的流转规则 (45)8.4 网优平台与集中故障平台的流转规则 (45)8.5 集中故障平台与集中分析平台的流转规则 (46)8.6 网优平台与集中分析平台的流转规则 (46)9 附录:集中维护案例 (47)1、无线优维一体化体系执行案例【福建】 (47)2、基于大数据的无线维护根因定位分析案例【福建、安徽】 (47)3、无线板卡全流程管理支撑手段应用【江苏】 (47)4、微信机器人告警督办【四川】 (48)5、智慧“五环”构建集中维护管理体系【安徽】 (48)6、维护隐患智能挖掘工具应用【湖北】 (49)7、降本增效“流动基站”应用案例【福建】 (49)8、基站分级管控【河北、湖北】 (50)编制历史 (50)1概述根据集团公司运维体系改革总体原则,各省建立“集中化网络维护管理和属地化维护及服务支撑相结合”的运维新模式,积极开展无线网维护集中化,总结梳理集中维护相关工作经验,梳理制定本文档。
本文档对集中维护的各个工作进行了明确的规范要求。
从运维质量管理、设备质量管理、无线安全管控、维保执行管控四个方面制定了实施准则,主要内容包括流程完善、流程串接、流程规则梳理,完善支撑手段、固化专家经验、优化考核办法等方面,为各省公司落实常态化集中维护工作提供指导和建议。
2适用范围本手册依托网优平台、集中优化管理平台、集中故障平台、代维管理平台、自动化路测工具等信息化支撑手段,实施对全省无线网元的运维质量管理、设备质量管理、无线网安全管控和维保执行管控。
本流程规范适用于中国移动各省公司无线网元的日常软硬件维护管理的各个流程环节。
无线网元是指无线核心网元BSC/RNC、一体化小基站网关、无线基站BTS/NodeB/eNodeB/gNodeB、无线延伸覆盖设备以及各类相关操作维护网管系统(OMC)。
3集中维护架构和职责按照集中维护管理整体工作思路,将省、市公司的维护职责进行区分:省网优中心:全省无线网的维护质量管理、维护问题和需求的收集与分析,无线网后评估和维护执行情况分析,无线网安全管控以及其他维护情况分析。
与集中故障职责分别:集中监控以无线网实时维护问题监控为主,重点关注故障派发的及时性和闭环率,省网优中心以无线网运维质量分析为主,重点关注非实时性问题的分析和总结,为集中故障提供规则支撑和反向驱动,并对非实时维护问题进行全过程管理。
(1)维护质量管理:省网优中心通过对无线网元的配置、告警、性能、运行状态动态关联,来评估一个地区的宏观维护质量,,并建立相应的考核与评估机制。
●关注对地市、区县、维护网格等区域维护相关工作与各项指标,全面提升网络日常运维效率。
●通过相关宏观指标对一个地区的宏观维护质量进行效果评估,并根据相关管理办法进行后评估考核,促进网络整体质量持续提升。
(2)维护问题分析:以集中分析为牵引,以实时告警关联分析为主要抓手,关注无线网维护核心问题,建立由集中分析向集中故障管理推送问题的流程,并针对集中故障管理解决情况建立相应的考核和评估机制。
●通过对无线网元的告警、性能、运行状态,投诉热点等相关指标,对集中故障闭环工单问题解决率、解决准确率进行评估,推进集中化故障管理,实现端对端。
●关注重要区域、场景、高投诉热点异常状态基站,通过基站全生命周期状态对网元的配置、告警、性能、运行状态进行管控,提升现网基站网元可用度。
(3)关注全网性能指标短板分析,承接集中分析输出的问题清单,进行预处理及问题分类,并制定方案,推进落地执行,确保基础维护工作得到有效落实,提升工作效率。
(4)重点关注超长、超频基站退服情况,对全省超长、超频退服基站、小区、RRU发起督办任务工单;对于一线维护存在问题的,督促和指导一线维护现场解决;对于集中故障管理流程存在问题的,要求集中故障管理对流程进行调整与优化。
(5)无线网元全生命周期管理,对基站入网、调整和退网进行管理,对全省基站生命周期状态变更的统计分析和趋势预测。
(6)无线网元的后评估,全省无线网元故障问题统计,现网问题与需求收集汇总,与各设备厂家进行方案对接,根据现网需求,升级无线网元设备的版本及加载各类补丁。
(7)各维护作业计划制定,日常巡检、健康性检查和主备倒换方案制定,通过任务流程指导区县代维收集巡检数据,分析巡检数据,提前预警网络隐患,并制定解决方案。
(8)全省无线网维保执行情况管控,严格审定维保需求,核实全省无线网维护执行的次数和质量。
(9)无线网安全管控,做好账号管理,规范无线网数据操作,做好网优大数据安全管理,加固无线网安全。
市公司:由地市维护人员,主要负责基站现场操作及维护。
(1)实施现场操作,根据方案处理基站现场的各类故障,并反馈现场处理结构。
(2)现场数据收集,根据维护分析组制定的巡检方案对本地网无线网元进行巡检,收集现场数据并反馈。
(3)现场问题收集,并通过反向任务工单向省网优中心反馈现场问题,供维护分析组进行问题跟踪和对接。
4运维质量管控以集中分析为源头,形成集中分析-集中优化-维护处理的工作流,根据场景、投诉等端到端元素形成维护类问题的分层分级管理,通过无线网元告警、性能、配置、运行状态等多数据源关联分析,实现对地市、区县、优维网格的无线网元的运行维护质量评估,并实现对集中故障管理流程、集中代维管理流程的规则完善和支撑。
4.1实时性维护问题管理实时维护问题管理以实时告警关联分析为主要抓手,以集中故障管理流程为落地手段,重点关注重要区域、场景、高投诉热点等关键问题,在问题解决和评估过程中,及时发现流程的不足;梳理影响业务的告警,联合监控优化派单规则,加大影响业务告警覆盖面,通过规则完善对集中故障管理流程形成有效支撑。
4.1.1流程架构4.1.2工作职责1、建立由集中分析向集中故障管理推送问题的工作流程;2、关注并推送重要区域、场景、高投诉热点等关键问题,推动集中故障管理流程建立关键问题优先处理和督办机制;3、配合集中故障流程,及时发现流程不足,通过修订专业规则,完善集中故障管理流程。
4、梳理影响业务的告警,联合监控优化派单规则,加大影响业务告警覆盖面,提升影响用户感知的非退服类告警的派单级别。
4.1.3 集中分析性能事件告警库以有效解决问题为中心,以智能化集中分析为龙头,以集中故障管理流程为落地手段,从下行高误块小区、高驻留、疑似休眠小区、路测问题点等集中分析性能事件,梳理了集中分析性能事件告警,通过与集中故障管理流程进行关联,实现集中分析性能事件告警全流程管理。
集中分析性能事件告警规则由各省根据各省实际生产情况由集中分析自行制订,样例如附件。
LTE集中分析性能事件告警梳理汇总.xlsx4.2非实时性维护问题管理非实时性维护问题管理以减少小区退服发生、缩短小区退服时长为出发点,开展预防性维护,加强退服小区原因定位,加快退服小区处理进度。
集中维护管控对非实时维护问题进行全过程管理,承担“发现问题、预处理、制定方案、落地执行”的主体工作,其中省网优中心承担发现问题和预处理的职责,地市维护部门承担制定方案和落地执行职责,并执行省公司制定的相关维护作业计划,实现集中优化中最核心的工作并参与生产,对生产结果负责。
4.2.1流程架构4.2.2各环节的责任人及职责➢省公司职责(1)通过对无线网元的配置、告警、性能、运行状态动态关联输出问题站点清单,根据运维质量管控指标集,建立维护问题库,派发工单至分公司进行原因确认是否需要整改,跟踪问题小区处理进度;(2)负责黑名单(反复出现同站点、同故障原因)审核和分析,优化问题处理流程;(3)发起问题站点整治流程;(4)负责审核问题站点整治方案/问题处理报告;(5)通过指标评估、现场抽查等方面对问题站点整治结果进行审核、评估。
➢ 各地市公司职责(1)视工作需要对问题站点进行现场查勘,并输出整治方案/处理报告;(2)根据整改方案进行现场整改,提交整治完成报告(3)现场数据收集,根据省公司制定的巡检方案对本地网无线网元进行巡检,收集现场数据并反馈。