当前位置:文档之家› 告警相关性分析模型的研究

告警相关性分析模型的研究

告警相关性分析模型在通信网故障
诊断中的应用
北京众和容智电子科技有限公司
目录
1 摘要 (3)
2 告警形式 (3)
3 通信网自身的特点 (3)
4告警相关性 (3)
5告警相关性分析模型介绍 (4)
5.1 告警提供者 (4)
5.2 告警消费者 (4)
5.3 告警相关性模块 (4)
5.4 知识库 (4)
5.5 告警相关性分析的层次结构 (5)
5.5.1 通信网关 (5)
5.5.2 与告警相关的上下文服务 (5)
5.5.3 告警相关性分析 (5)
5.5.4 高级应用 (5)
5.6 告警相关性语言和规则 (6)
5.7 告警相关性规则发现 (6)
6 告警相关性在通信网故障诊断中的应用 (7)
6.1 实现模型 (7)
7结论 (8)
1 摘要
告警相关性分析是指对告警进行合并和转化,将多个告警合并成1个或含有更多信息量的告警,目的是压缩冗余告警信息,有利于故障定位。

2 告警形式
①被管资源出现单个故障后产生不同且连续的告警,即告警的连续性。

②故障可能间隔性的发生,每出现一个故障则产生一个新的告警,即告警的间歇性。

③出现故障的被管资源产生多个相同的告警,即告警的重复性。

④同一个故障可能会被不同的网络管理资源监控到,即故障的重复性。

⑤一个故障的被管资源肯能会影响到其他的资源,即故障的传递性。

3 通信网自身的特点
①可以通过告警内容来定义网络中的故障。

②单个事件可以用多个告警来描述。

③单个事件产生多个通知消息,增加了网管人员定位根事故的负担。

④告警的语意务必保持一致性。

4告警相关性
①告警压缩[ A , A , ⋯, A ] →A :将多个同时发生的告警缩减到1 个告警中;
②告警过滤[ A , B , C , D ] →A :删除不符合告警相关性要求的告警;
③告警计数[ nA ] →B :用1 个新的告警替代特定数目的同时发生的告警;
④告警抑制[ A , B , priority( B) < priority( A) ] →A :当高优先级的告警发生后抑制其他低优先级的告警产生;
⑤告警布尔[ A , B , ⋯T , ∧, ∨, ┐] →C :用1 个新的告警替代1 组符合一定布尔模式的告警;
⑥告警泛化[ A , A ∈B ] →B :用告警的超类代替该告警;
⑦告警时序关系:不同告警按照一定的时间先后顺序上报.
5告警相关性分析模型介绍
告警相关性分析模型包括告警相关性模块、告警提供者、告警消费者和知识库
图1 告警相关性分析模型
5.1 告警提供者
告警提供者可以是不同类型、不同厂家的网络设备,也可以是网络管理系统,负责向告警相关性分析模块发送告警消息. 不同的告警提供者的告警消息格式可能不同.
5.2 告警消费者
告警消费者负责从告警分析模块中接收相关告警消息. 告警消费者在接受消息之前,也必须向告警分析模块注册,既可以定义自己“关心”的告警消息格式,也可以定义告警的相关性规则.
5.3 告警相关性模块
告警分析模块介于告警提供者和消费者之间,依据消费者提供的要求,过滤
大量不必要的告警和冗余告警消息,减少呈现在消费者的告警数量,提高告警的语义相关性.
5.4 知识库
用于存储与告警相关性分析的数据,如告警消息、网络配置信息、告警相关性规则,以及其他一些分析过程中的中间状态和数据.
5.5 告警相关性分析的层次结构
5.5.1 通信网关
最低层是通信网关层,负责在告警提供者与消费者之间传递告警消息. 例如,过滤不同消费者所不关心的告警,将告警消息转换成不同消费者所需要的格式,确保告警提供者所提供的消息以正确的格式和内容传递到不同消费者. 在通信网中,不同厂家不同设备共存于同一个网络当中.通信网关要解决将不同厂家、不同设备的告警消息的格式转换、过滤等问题.
5.5.2 与告警相关的上下文服务
提供告警提供者和消费者之间告警消息状态的交互. 当告警提供者产生一系列告警消息后,服务层对告警的内容进行分析,触发相应的事件通知消费者.
5.5.3 告警相关性分析
智能化告警相关性分析是根据知识库中的信息进行故障寻根、发送网络预警等. 告警相关性分析协助网管人员准确定位故障源,减少处理反应时间和业务中断时间.
5.5.4 高级应用
最高层是高级应用层,例如按时间对所发生的事件进行每日、每月、每年的总结,分析网络发展趋势,能对网络进一步的规划和扩容提供参考意见. 对故障多发地段或设备发送网络预警信息,加强网络通信的保障,将可能发生的故障降到最低.
5.6 告警相关性语言和规则
开发相关性描述语言的 1 个主要目的是,使告警相关性分析直观和用户友好. 警相关性的描述形式如下: If < 前提> Then< 结论> . 表示当< 前提> 成立时,得出< 结论> .为了严格地描述产生式,用巴科斯范式BNF(BackusNormal Form) 给出形式描述及语义:
< 告警相关性> : : = < 前提> →< 结论>
< 前提> : : = < 简单条件> | < 复合条件>
< 结论> : : = < 告警> | < 相关性操作>
< 复合条件> : : = < 简单条件> [ (AND <
简单条件> ) ⋯] | < 简单条件> [ (OR < 简单条件> ) ⋯]
< 简单条件> : : = < 告警属性> | < 操作符> | < 告警属性>
其中, < 告警属性> 包括告警的类型、告警的严重级别、时间戳、所属厂家信息、所属设备和端口等等.
< 操作符> 定义为“and”,“or”,“equal”,“is -duplicate”,“is - before”,“exist s”等等.
5.7 告警相关性规则发现
①确立规则来源. 告警相关性规则主要来源于通信专家的经验和相关ITU2T 技术建议,同时也可以通过分析历史告警进行数据挖掘,发现告警相关性规则.
告警相关性规则发现
②规则描述. 选择合适的规则表示模式并把概念化的规则表示出来.
③建立告警相关性数据库. 告警相关性数据库是告警相关性分析的核心,其规则的质量直接关系到整个系统的性能和效率.
④测试、精炼、维护告警相关性数据库. 包括知识的一致性、完整性、冗余性等检查. 数据库的建立过程需要把相关性规则经过一系列变换后进入计算机系统. 例如通信专家提供的经验并不一致,也不完全,甚至是错误的信息,必须对其进行增加、删除、修改后选用.
6 告警相关性在通信网故障诊断中的应用
故障诊断是故障管理中的一个重要步骤,即从采集到的告警信息中分析出故障源. 故障诊断中考虑了以下几个要素:
①告警的采集和存储;
②网络配置信息的存储;
③告警相关性规则的分析和建立. 告警相关性分析的前提条件是网络在正常监
控之下,且数据库更新不影响系统正常工作. 为了准确及时地定位网络出现的故障,告警相关性分析模块必须集中监控网络中所有的告警信息.
6.1 实现模型
告警相关性分析采用的是基于规则的分析方法(rule2based systems) ,适用于通信网的告警相关性分析. 告警相关性模型在光传输网故障诊断中的应用如图所示
告警相关性分析在光传输网故障诊断中的应用
该模型符合以下要求.
①传输网中实时告警和历史告警数据采集到告警数据库中. 告警消息通常采用
文本形式存储,表征系统状态的改变(异常或失效) . 告警消息包括多个字段,如告警发生时间、告警清除时间、告警发生的位置信息、告警级别、告警内容描述等. 通常告警不包含故障源的详细信息.
②告警相关性分析模型需要建立 1 个配置数据库用来存储网络中所有的拓扑信息. 当网络拓扑信息发生变化后,该配置数据库能实时更新相关的数据. 配置数据库包含网元层和网络连接层的具体信息,有助于从1 个小的故障发现故障的根源问题.网元层描述网络设备的类型,是物理网元的一个抽象描述. 网元面
向每个具体应用,不同的通信网中的网元类型各不相同,包括子网、局站、机框、机槽、机盘、端口等. 网络连接层描述的是网元之间的连接关系,包括光复用段和传送段,以上下游节点的放大盘端口标志.
③相关性描述语言作为规则发现模块接口的一部分,发现告警的特征,将告警转换成为规则,最终实现相关性引擎模块的配置.
④通信专家在线维护和配置对告警相关性规则.
④当告警相关性已知后,告警相关性分析提供网管人员定位具体发生的故障及
故障地点. 如果只有部分规则已知或者出现未知规则,网管人员要依据全部的有用信息,找出与故障最匹配的告警模式———类似与基于案例推理的告警分析.
图5 光传输网故障诊断流程
⑤故障诊断的流程如图 5 所示. 首先从告警数据库中读取告警信息;然后按照
网元进行分类,将告警定位到网元上;接着将告警逐行匹配到规则库中的所有规则,查找出可能的故障[4 ] . 在某些情况下(如线路故障) ,仅仅判断单个网元是无法准确判断故障点的,必须对远端网元发生的告警进行分析,最终确定故障点. 正确的网络配置信息是故障诊断的基础.
7结论
对提出的告警相关性分析模型与其他模型比较具有以下优点:
①更可靠,易于实现;
②便于修改告警相关性规则;
③自适于网络配置信息的改变;
④适用于通信网的故障诊断. 但由于组成通信网的设备很复杂,生产厂商型号、
规格的不同,得到1 个通用相关性模型,使它适用于各种电信网络,还需继续研究。

相关主题