当前位置:文档之家› 第9章 网络故障诊断与维护

第9章 网络故障诊断与维护


9.2网络故障的分类
1.按网络故障的性质划分 (1)物理故障:是指设备或线路损坏、插头松动、线路受到严重电磁干扰等 情况。 (2) 逻辑故障:逻辑故障中的一种常见情况就是配置错误,就是指因为网络 设备的配置原因而导致的网络异常或故障。 2.按网络故障的对象划分 (1)线路故障:线路故障最常见的情况就是线路不通, (2)路由器故障:事实上,线路故障中很多情况都涉及到路由器,因此也可 以把一些线路故障归结为路由器故障。 (3)主机故障:主机故障常见的现象就是主机的配置不当。
9.3.4传输层故障
传输层的主要功能有:提供建立、维护和拆除传输层连接;选择网络层提 供合适的服务;提供端到端的错误恢复和流量控制;向会话层提供独立于网络 层的传送服务和可靠的透明数据传送。 传输层故障的检查主要包括以下几个方面: 差错检查,如数据包的重发等。 通信拥塞或上层协议在网络层协议上的捆绑方面。
9.5常见的网络故障及解决方法
9.5.1工作站故障
1.IP地址冲突 使用TCP/IP协议的每台计算机必须有自己独立的IP地址,有了IP地址才 能与网络上的其他主机间进行通信。一般情况下,IP地址配置不正确,主要 表现为IP地址冲突。如下几种情况可以造成IP地址冲突。 (1)用户对TCP/IP并不了解,不知道IP地址、子网掩码、默认网关等参 数如何设置,有时用户不是从管理员处得到上述参数的信息,或者是用户无 意修改了这些信息。 (2)管理员或用户根据管理员提供的上述参数进行设置时,由于失误造成 参数输错。 (3)维修调试时,维修人员使用临时IP地址所致。 (4)故意窃用他人的IP地址。


9.4网络故障诊断的工具
9.4.1软件工具

1. IP连接测试-ping
2. 路由追踪-tracert
3. 路径测试-pathping
4. IP路由表-Route
5. 网络诊断工具-netsh diagnostic
6. 显示IP地址信息-ipconfig
7. 网卡地址及协议列表工具-getmac
2.子网掩码设置不正确
子网掩码是一个32位地址,是与IP地址结合使用的一种技术。它的主要作用有
两个,一是用于屏蔽IP地址的一部分以区别网络标识和主机标识,并说明该IP 地址是在局域网上,还是在远程网上。二是用于将一个大的IP网络划分为若干 小的子网络。 在同一网段中的计算机应该具有相同的子网掩码。如果子网掩码不同,就算是 位于同一个网段的计算机也不可能通。所以,如果同一网段的计算机之间不能 通信,除了IP地址正确以外,子网掩码也必须相同。
3.服务器故障排除需要收集的信息 (1)服务器信息:机器型号(P/N:)、机器序列号(S/N:)、BIOS版本、是否增 加其它设备、硬盘如何配置(是否做阵列, 阵列级别)、安装什么操作系统及 版本。 (2)故障信息:在POST时,屏幕显示的异常信息、服务器本身指示灯的状态、 报警声和BEEP CODES、NOS的事件记录文件、Events Log 文件。 (3)确定故障类型和故障现象:开机无显示、上电自检阶段故障、安装阶段 故障和现象、操作系统加载失败、系统运行阶段故障。
9.5.2服务器故障

1.服务器常见的故障及排除方法 (1)服务被中止 (2)流量问题 (3)系统资源不足 (4)服务器软件故障 (5)管理方面的问题


2.服务器故障排除的基本原则 1) 尽量恢复系统缺省配置 (1)硬件配置:去除第三方厂商备件和非标配备件。 (2)资源配置:清除CMOS,恢复资源初始配置。 (3)BIOS,F/W,驱动程序:升级最新的BIOS,F/W和相关驱动程序。 (4)TPL:扩展的第三方的I/O卡属于该机型的硬件兼容列表(TPL) 吗? 2)从基本到复杂 (1)系统上从个体到网络:首先将存在故障的服务器独立运行,待测 试正常后再接入网络运行,观察故障现象变化并处理。 (2)硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到 现实系统为止。 (3)软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实 系统为止。 3) 交换对比 (1)在最大可能相同的条件下,交换操作简单效果明显的部件。 (2)交换NOS载体,即交换软件环境。 (3)交换硬件,即交换硬件环境。 (4)交换整机,即交换整体环境。
第9章 网络故障诊断与维护
本章学习目标 了解网络故障的诊断与网络维护的相关知识 掌握网络故障产生的原因,故障诊断的原理 掌握网络故障分层检查的方法 掌握网络故障诊断的常用软、硬件工具
9.1网络故障诊断概述
1.网络故障诊断的目的 确定网络的故障点,恢复网络的正常运行。 发现网络规划和配置中的瑕疵,改善和优化网络的性能。 观察网络的运行状况,及时预测网络通信质量。 2.网络故障产生的原因 (1)物理层问题,由于物理设备相互连接失败或者硬件及线路本身引起的问题。 (2)数据链路层问题,包括网络设备接口的配置等问题。 (3)网络层问题,由于网络协议配置或操作引起的错误。 (4)传输层问题,由于性能或通信拥塞引起超时等问题。 (5)应用层问题,包括操作系统、网络应用程序自身中的软件错误。。
9.3.2数据链路层故障
数据链路层的功能是在相邻两结点间无差错地传送数据帧,为网络层提 供服务。数据链路层互连的设备是网桥,网桥在网络互连中起到数据接收、 地址过滤与数据转发的作用,它用来实现多个网络系统之间的数据交换。用 网桥实现数据链路层互连时,允许互联网络的数据链路层与物理层协议是相 同的,也可以使不同的。
9.3.5应用层故障
应用层是开放系统互连(OSI)环境与本地系统的操作系统和应用系统直 接接口的一个层次。在功能上,应用层为本地系统的应用进程访问OSI环境提 供手段,也是唯一直接给应用进程提供各种应用服务的层次。根据分层原则, 应用层向应用进程提供的服务是OSI的所有层直接或间接提供服务的总和。 应用层故障检查主要包括以下几个方面: 操作系统的系统资源的运行状况 应用程序对系统资源的占用和调度 管理方面的问题,如安全管理、用户管理等。
9.5.3交换机故障
1.硬件类故障 硬件故障主要指交换机电源、背板、模块、端口等部件的故障,可以 分为以下几类: (1)电源故障 (3)模块故障 (4)背板故障 (5)线缆故障 从上面的几种硬件故障来看,机房环境不佳极易导致各种硬件故障, 所以在建设机房时,必须先做好防雷接地及供电电源、室内温度、室内湿 度、防电磁干扰、防静电等环境的建设,为网络设备的正常工作提供良好 的环境。

2.交换机的软件故障 交换机的软件故障是指系统及其配置上的故障,它可以分为以下几类: (1)系统错误:交换机系统是硬件和软件的结合体。在交换机内部有一个可刷 新的只读存储器,它保存的是这台交换机所必需的软件系统。由于设计的原因, 可以会存在一些漏洞,在条件合适时,会导致交换机满载、丢包、错包等情况 的发生。 对于此类问题,需要养成经常浏览设备厂商网站的习惯,如果有新的系统 推出或者新的补丁,请及时更新。 (2)配置不当:由于对交换机的性能等技术指标不熟悉可能会导致配置错误的 出现。比如VLAN划分不当导致网络不通,端口被错误地关闭,交换机和网卡的 模式配置不匹配等原因。这类故障有时很难发现,如果不能确保配置的正确性, 最好先恢复出厂的默认配置,然后再一步一步地配置。 在配置之前先阅读说明书是好的习惯之一。每台交换机都有详细的安装手 册、用户手册,深入到每类模块都有详细的讲解。如果还有不清楚之处就需要 向供应商的工程师咨询后再做具体配置。
9.3网络故障的分层检查
9.3.1物理层故障
网络物理层的故障主要是指网络设备的连接性能故障,包括网卡、交换 机、集线器、路由器等。其常见的物理故障如下: •电气性能故障:主要指网络设备的端口提供的电平不正常(过高、过低), 电压极性不正常。 •传输模式故障:网络设备的数据传输有半双工、全双工、自适应多种模式。 在数据传输过程中,可能发生模式人为设置错误,相互不匹配;或两端不能 自动地建立正确的传输协商机制等。
9.3.3网络层故障
在网络的运行中,经常会遇到因设备设置导致的网络错误,一般这些情况 的排除没有适当的工具是很难完成的。这些常见的网络问题归结成以下几类: 错误 :指可以导致网络的设备不能正常运行的网络问题。例如:IP地址冲突、 子网掩码错误、IP地址是子网地址、IP地址是子网广播地址、关键设备没有响 应、DHCP服务器提供了正在使用的IP地址、丢失DHCP给出的地址。 警告 :对网络的正常运行没有影响,但可能属于设备设置错误的网络问题。例 如: 缺省路由器没有响应、IP子网的唯一设备、IPX网络唯一设备、网络中唯一使 用IPX类型的设备、Proxy ARP响应本地IP 。
8. 网络协议统计工具-netstat
9.4.2硬件工具
1.物理线缆测试仪
图9-9 物理线缆测试仪图
9-10 TPT-8020A测试仪
2.网络测试仪
图9-11 安捷伦J6800A网络测试仪
图9-12 Optiview Integrated Network Analyzer




4.一般网络故障排除的步骤 (1)确定故障的具体现象,分析造成这种故障现象原因的类型。例如,主机不响 应客户请求服务,可能的故障原因是主机配置问题、接口卡故障或路由器配置命令 丢失等。然后根据故障的性质和影响范围进行故障定位。 (2)收集需要的用于帮助隔离可能故障原因的信息。从网络管理系统、协议分析 跟踪、路由器诊断命令的输出报告或软件说明书中收集有用的信息。 (3)根据收集到的情况考虑可能的故障原因,排除某些故障原因。例如,根据某 些资料可以排除硬件故障,把注意力放在软件原因上。 (4)根据最后的可能故障原因,建立一个诊断计划。开始仅用一个最可能的故障 原因进行诊断活动,这样可以容易恢复到故障的原始状态。如果一次同时考虑多个 故障原因,试图返回故障原始状态就困难多了。 (5)执行诊断计划,认真做好每一步测试和观察,每改变一个参数都要确认其结 果。分析结果确定问题是否解决,如果没有解决,继续下去,直到故障现象消失。 (6)记录解决方案,确定预防措施。在问题解决以后,作为合格的管理员还需要 将问题解决过程中的相关记录整合成文献,以备后用。同时,还要制定同样问题再 次产生的预防措施,以主动的方式进行网络管理活动。
相关主题