集团客户专线故障监控、处理及保障方案集团客户专线业务主要包含语音专线、数据专线、互联网专线、GPRS专线、集团短彩信等,全业务支撑班负责上述集团客户业务的开通数据制作及维护支撑工作,另外部分ICT 项目,例如千里眼、交管视频监控等业务的CT类维护及故障处理也由全业务支撑班牵头负责;
一、当前故障监控及调度体系
1、职责分工
对于集团客户专线类故障,全业务支撑班负责总体牵头故障处理,综合调度班负责故障监控和统一调度,自维或代维人员负责客户现场的故障处理工作;
2、集客业务监控及故障处理
目前集客业务监控主要通过以下两种方式发现故障:
网管监控主动发现省公司综合监控系统、双路由轮巡
客户报障包括10086-8、400、客户直接报障
1网管监控主动发现
省公司综合监控系统派出告警工单或综合调度班通过网管主动发现集团业务告警后,首先预判断告警引起的原因和影响的级别,并通过相关班组处理,对集团故障达到一定级别同时需发起故障调度;故障处理调度流程如下图所示;
监控标准和要求
综合调度班值班人员需实时发现网管告警,并按要求在15分钟之内快速初步定为故障
原因,受理客户电话的报障要详细记录相关信息,故障处理均应在系统派单留痕;
省市重点集团故障调度标准
如省市重点集团故障达到以下级别,应按网络部预警标准开展短信及电话调度;
故障级别调度标准
紧急1、报障中心点业务全阻数据专线、语音专线、互联网专线、GPRS、集团短信
2、10个以上重点集团或分支线路批量专线故障
3、网管监控重点集团中心点核心传输设备双路由均中断
一般1、重点集团中心网元单路由中断
2、同一时间3个以上及10个以下重点集团分支点专线不含PON开通同时发生中断
重要超时1、重点集团分支点报障超4小时未恢复2集客业务报障处理方式和流程
集团客户主要通过以下三种途径报障:
10086-8
400绿色通道
点对点直接报障客户或客户经理直接联系全业务支撑班相关人员具体报障流程如下:
10086-8:多数的集团客户在发现故障时会拨打10086-8进行故障申报,品质管理部专席受理客户故障申报,在CSP系统创建故障工单转派至网络部EOMS系统处理;流程图如下400绿色通道:网络部针对省、市重点集团等客户开通了724小时400绿色报障通道,重点集团客户或客户经理可直接拨打400申报故障,由综合调度班值班长接听受理,并在客响平台中创建报障工单派至代维或重点集团自维处理,并通知全业务支撑班相关负责人;
点对点直接报障:少部分客户或客户经理会直接联系全业务支撑班相关专线业务的负责人,点对点联系直接报障,负责人在接到电话后在同样在客响平台创建报障工单派至代维或自维处理;
400及点对点直接报障流程如下图所示;
3、目前通过省公司综合监控系统监控客户业务所存在问题
省公司综合监控系统是对所有集客业务进行监控,由于监控业务量巨大,因此,为提升监控效率并聚焦重点集团,目前省公司将大部分的告警信息都予以屏蔽,只针对省级及跨省业务进行实时监控,而对于南京市级重点集团和部分营销单元的重要集团,监控力度明显不足,缺乏主动监控的有效手段;因此,为更好的维护集客业务,全业务支撑班牵头开发了集客业务支撑监控系统,将省市重点集团、跨省业务以及营销单元的重要业务都纳入到该平台;
二、集客业务支撑监控系统
今年全业务支撑班通过招标方式将“集客业务支撑监控系统”由专业厂家进行开发;后期,所有跨省、省级、市级以及营销单元重要集客业务都将纳入该系统,由其进行主动监
控并派发故障工单,其中由于跨省、省级业务也在省公司综合监控系统的监控之中,因此对跨省、省级业务的监控形成“双保险”;
系统简介
该系统主动采集和监控相关EMS 网管、语音NGN 平台、语音拨测系统、ping 测系统的告警,自动匹配到相关的集团和业务,自动分析告警内容给出处理建议,通过语音提示、主动弹窗的方式实现告警大屏呈现,通过短信推送方式及时将故障信息发送到维护人员手机上,并根据创建的规则实现自动派单等功能;该系统主要架构如下: 目前除与客响工单平台对接接口正在开发外,该系统与其余网管的对接以及功能已基本完成,近期将对所有对接网管系统的告警监控有效性、准确性和及时性进行检测,预计8月下旬可将该系统正式交付综合调度班使用;
针对该系统具体的设计及规划可见附件“集客支撑告警监控系统规划”:
系统告警处理流程
通过告警监控大屏,综合调度班获取集团业务告警信息,首先确认告警,表示正式受理手工/自动派
推送/获推送/获推送/获推送/获推送/获集客支撑业务监控系统 传输网管
NGN 平台
IMS 平台 语音拨测平
PING 测系统
原始告警获取 告警匹告警业务呈客户响应平路由设备监
推送
该告警,根据系统自动产生的处理建议判断是否需要派发客响工单,并添加告警处理进展,跟踪工单处理,在完成告警处理后,如系统未实现告警的自动清除,手工清除该告警;系统告警处理流程图如下:
系统主动监控和调度流程
集客支撑告警监控系统主要用于监控省市重点集团中心点、跨省专线集团、区域重点业务的底端设备网元和业务告警,包括:
底端SDH设备、PTN设备、ONU设备上联光路通断、业务端口告警情况
语音、GPRS、互联网等业务平台的告警监控
在该系统上线后,其准确性、及时性和稳定性需不断进行验证,并与省公司综合监控平台共存使用,省公司综合监控平台主要用于监控省级、跨省集团,自有监控系统作为综合监控的补充,并重点监控市级和区域营销单元重要网元;
综合调度班需同时关注集客支撑告警监控系统和EOMS4中省公司综合监控派发的告警工单,两种监控手段互为补充;
在该系统和省公司综合监控系统共存情况下,针对集客故障的调度流程如下图所示:
综合调度班通过监控页面和告警工单发现故障告警,处理原则及步骤如下:
根据监控页面、告警工单的处理建议和告警内容,初步定位故障原因
如能定位,判断是否为网络故障,如是则通知到相应班组处理,如不是则通知到全业务支撑班处理
如不能定位,通知到全业务支撑班处理;
根据监控页面、告警
工单的处理建议和告
网页呈现及EOMS4工
省公司综综合调度班 是否能判
将故障通
报到相应
是否网络故
集客支撑
是 是
是否早全业务支撑否 否 将故障通报到全业
故障处理是
在客户未报障的情况下暂不打扰客户,由支撑班调
否
对非公司网络故障,需联系客户处理时,在早7:30-晚10:00,通知到全业务支
撑班处理;在其他时段,在客户未报障的情况下暂不打扰客户,由全业务支撑班调
度人员短信通知到相应客户经理,待早上7:30后联系客户;
三、重大活动期间集客专线保障方案
1、建立重大活动期间集客专线应急响应机制
由于南京地区肩负着绝大多数的省级集团以及上百家市级重点集团的网络维护重任;在重要节假日或重大活动之际,网络负荷急剧增加,各类业务频繁使用,这给集客专线稳定运行也带来巨大挑战;
为降低在重大活动期间的故障率,在发生故障时,将故障影响范围尽可能降到最小,网络部全业务支撑班建立了集客专线的应急响应机制,以此来做好防范,保障业务稳定;
重大活动集客专线保障方案见以下附件
2、2014南京青奥会应急演练方案
为确保集客专线业务在发生故障时能得到及时有效的修复如场馆附近的银行ATM机、青奥会重要合作伙伴如苏宁电器业务中断,全业务支撑班制定了应急演练预案,并将在青奥会召开前进行一场应急演练,已确保青奥会期间真正发生故障时能尽快修复;
应急方案见以下附件;。