当前位置:文档之家› 网络故障诊断解决专家系统

网络故障诊断解决专家系统

网络故障诊断与解决专家系统摘 要:为了使系统能够高效地对各种复杂网络进行管理,本文提出了基于产生式的故障诊断专家系统。

归纳总结了网络照片尺寸为20mm*30mm;最好不用红色背景故障的知识范围,构成故障知识库。

在该知识库的基础上采用故障定位向导程序进行推理,实现管理和诊断网络故障。

关键词: 网络故障诊断 专家系统 定位向导 层次推理中图分类号:TP722 文献标识码:A IX)I:10.3964/j.issm 1000-0593(2010)06—1628-06Network faults diagnosis and resolution ofexpert systemDENG Peng( Department, City, City Zip Code, China)Abstract: In order to manage all kinds of complex network efficiently ,fault diagnose Expert Database System based on production system is introduced in this paper. In this system ,network fault knowledge is collected and fault knowledge database is set up. Fault detecting guide is designed for managing and diagnosing network fault。

.Key words:Network fault detection ;Expert system ;Fault detecting guide ;Level reason 专家系统(Expert System, ES),也称基于知识的系统(Knowledge Based System,KBS),是人工智能(Artificial Intelligence,AI)的一个新的分支,也是发展最快的一个分支。

ES实际上是 AI 计算机程序系统,它能利用目前大量人类专家的专门知识和方法来解决现实生活中某些复杂的重要问题。

1 网络故障我们可以根据网络故障的性质把网络故障分为物理故障与逻辑故障,也可以根据网络故障的对象把网络故障分为线路故障、路由故障和主机故障。

1.1物理类故障 物理故障,一般是指线路或设备出现物理类问题或说成硬件类问题。

(一)线路故障 在日常网络维护中,线路故障的发生率是相当高的,约占发生故障的70%。

线路故障通常包括线路损坏及线路受到严重电磁干扰。

排查方法:如果是短距离的范围内,判断网线好坏简单的方法是将该网络线一端从电脑上拔出用测线器测量,因为我们一般上网只用1.2.3.6号线,所以这四根线亮的话就能够正常使用,也就是说到交换机之间的网线是可用的.(二)端口故障 端口故障通常包括插头松动和端口本身的物理故障。

排查方法:此类故障通常会影响到与其直接相连的其他设备的信号灯。

因为信号灯比较直观,所以可以通过信号灯的状态大致判断出故障的发生范围和可能原因。

也可以尝试使用其它端口看能否连接正常。

这时我们可以拔下插头反复插拔几次. (三)集线器或路由器故障 集线器或路由器故障在此是指物理损坏,无法工作,导致网络不通。

排查方法:通常最简易的方法是替换排除法,用通信正常的网线和主机来连接集线器(或路由器),如能正常通信,集线器或路由器正常;否则再转换集线器端口排查是端口故障还是集线器(或路由器)的故障;很多时候,集线器(或路由器)的指示灯也能提示其是否有故障,正常情况下对应端口的灯应为绿灯。

如若始终不能正常通信,则可认定是集线器或路由器故障。

如果整栋楼都上不去网的话,我们可以判断是不是交换机掉电,这时我们只须看交换机电源指示灯就可判断. (四)主机物理故障 网卡故障,笔者把其也归为主机物理故障,因为网卡多装在主机内,靠主机完成配置和通信,即可以看作网络终端。

此类故障通常包括网卡松动,网卡物理故障,主机的网卡插槽故障和主机本身故障。

排查方法:当我们用ping命令ping本机的ip地址时,如若不通我们可以判断是网卡的问题,或操作系统的问题,因网络中心人员有限我们不负责电脑硬件或电脑软件问题.1.2逻辑类故障 逻辑故障中的最常见情况是配置错误,也就是指因为网络设备的配置错误而导致的网络异常或故障 (一)路由器逻辑故障 路由器逻辑故障通常包括路由器端口参数设定有误,路由器路由配置错误、路由器CPU利用率过高和路由器内存余量太小等。

排查方法:路由器端口参数设定有误,会导致找不到远端地址。

用Ping命令或用Traceroute命令(路由跟踪程序:在UNIX系统中,我们称之为Traceroute;MS Windows中为Tracert),查看在远端地址哪个节点出现问题,对该节点参数进行检查和修复。

路由器路由配置错误,会使路由循环或找不到远端地址。

比如,两个路由器直接连接,这时应该让一台路由器的出口连接到另一路由器的入口,而这台路由器的入口连接另一路由器的出口才行,这时制作的网线就应该满足这一特性,否则也会导致网络错误。

该故障可以用Traceroute工具,可以发现在Traceroute的结果中某一段之后,两个IP 地址循环出现。

这时,一般就是线路远端把端口路由又指向了线路的近端,导致IP包在该线路上来回反复传递。

解决路由循环的方法就是重新配置路由器端口的静态路由或动态路由,把路由设置为正确配置,就能恢复线路了。

路由器CPU利用率过高和路由器内存余量太小,导致网络服务的质量变差。

比如路由器内存余量越小丢包率就会越高等。

检测这种故障,利用MIB变量浏览器较直观,它收集路由器的路由表、端口流量数据、计费数据、路由器CPU的温度、负载以及路由器的内存余量等数据,通常情况下网络管理系统有专门的管理进程,不断地检测路由器的关键数据,并及时给出报警。

解决这种故障,只有对路由器进行升级、扩大内存等,或者重新规划网络拓扑结构。

 (二)一些重要进程或端口关闭 一些有关网络连接数据参数得重要进程或端口受系统或病病毒影响而导致意外关闭。

比如,路由器的SNMP进程意外关闭,这时网络管理系统将不能从路由器中采集到任何数据,因此网络管理系统失去了对该路由器的控制。

或者线路中断,没有流量。

排查方法:用Ping线路近端的端口看是否能Ping通,Ping不通时检查该端口是否处于down的状态,若是说明该端口已经给关闭了,因而导致故障。

这时只需重新启动该端口,就可以恢复线路的连通。

(三)主交换机上ip地址与物理MAC地址绑定错误.判断方法:首先要判定线路没有问题,在这种情况下我们ping网关会ping不通,但是ping其他同一网段的ip地址可以ping通或arp –a能够看到网关及网关的物理地址,那么我们就可以判断是地址绑定错误.这时给网络中心负责ip地址管理的同学打电话,修改其绑定的物理地址.(三)主机逻辑故障 主机逻辑故障所造成网络故障率是较高的,通常包括网卡的驱动程序安装不当、网卡设备有冲突、主机的网络地址参数设置不当、主机网络协议或服务安装不当和主机安全性故障等。

1.网卡的驱动程序安装不当。

网卡的驱动程序安装不当,包括网卡驱动未安装或安装了错误的驱动出现不兼容,都会导致网卡无法正常工作。

排查方法:在设备管理器窗口中,检查网卡选项,看是否驱动安装正常,若网卡型号前标示出现“!”或“X”,表明此时网卡无法正常工作。

解决方法很简单,只要找到正确的驱动程序重新安装即可。

3.主机的网络地址参数设置不当。

主机的网络地址参数设置不当是常见的主机逻辑故障。

比如,主机配置的IP地址与其他主机冲突,或IP地址根本就不在于网范围内,这将导致该主机不能连通。

排查方法:查看网络邻居属性中的连接属性窗口,查看TCP/IP选项参数是否符合要求,包括IP地址、子网掩码、网关和DNS参数,进行修复。

计算机网络技术发展迅速,网络故障也十分复杂,上述概括了常见的几类故障及其排查方法。

针对具体的诊断技术,总体来说是遵循先软后硬的原则,但是具体情况要具体分析,这些经验就需要您长期的积累了。

如果你是网络管理人员,在网络维护中的还需要注意以下几个方面: 第一,建立完整的组网文档,以供维护时查询。

如系统需求分析报告、网络设计总体思路和方案、网路拓扑结构的规划、网络设备和网线的选择、网络的布线、网络的IP分配,网络设备分布等等。

第二,做好网络维护日志的良好习惯,尤其是有一些发生概率低但危害大的故障和一些概率高的故障,对每台机器都要作完备的维护文档,以有利于以后故障的排查。

这也是一种经验的积累。

第三,提高网络安全防范意识,提高口令的可靠性,并为主机加装最新的操作系统的补丁程序和防火墙、防黑客程序等来防止可能出现的漏洞。

2 专家知识库的建立因为建立的故障管理专家系统需要达到实时故障识别及非实时故障分析的任务。

为了实现故障的判别,我们建立了网络故障识别知识库,判断网络运行情况是否发生故障。

为了实现故障分析,我们建立了故障分析知识库,对用户待分析的故障进行故障原因分析。

故障识别产生的结果是进行故障分析的条件,二者有着必然的联系。

两个知识库都根据该领域专家的经验进行创建,为应用程序判断分析的准确性提供了必要的保障。

2.1故障识别知识库目前,网络故障识别主要采用在应用程序中添加判断语句实现。

针对故障的类型多,而且每种故障的判别方式多种多样,我们采用对MIB[4 ]数据库和网络轮询监测对象进行分析后做处理,得出具体的故障类型。

本算法最多只要有限次的二目运算就可完成。

以下是6 种网络故障识别的规则。

设MIBObj 为网络代理(Agent) 中的MIB 数据库中的对象,MIBObj1、MIBObj2 为中间变量,Const 为常量,则:(1) MIBObj1 =MIBObj1 - MIBObj2 ; (2)MIBObj1 =MIBObj1 +MIBObj2 ; (3) MIBObj1 = MIBObj1 3 MIBObj2 ; (4) MIBObj1 = MI2BObj1/MIBObj2 ; (5)MIBObj < Const ; (6)MIBObj > Const 。

结构说明:序列号为该表的主键。

故障名称为网络中出现的故障。

产生式序列号为引用故障识别产生式的外键。

故障事件计算顺序表明在应用多个产生式计算时的产生式应用顺序。

第一个参数标志可以是输入参数、常数或应用中间结果。

其后的第一个参数字段根据该标志确定,其中输入参数通过MIB 中的OID 值表示,应用中间结果通过其序号表明是前面哪一步计算的中间值。

相关主题