网络环路引起的故障汇总
在日常维护中,由于各种原因有时会形成网络环路。
以下汇总了自接手IP 维护工作以来碰到过的各种环路问题,由于水平有限,错误的地方请指正。
1、在调试设备时测试光路形成的环路。
目前DSLAM设备都下挂在L2 S8505。
在调试新DSLAM设备时,我们一般都会先完成数据配置再到现场开局。
有时我们会在远端机房的ODF进行收发环路,通过查看交换机端口是否UP的方法来判断光路是否正常。
事实上这样会造成VLAN 31环路,引起L2 S8505和下带设备的网管通信中断。
如果要采用此方法测试,应提前删除该端口的VLAN 31透传,等设备调试起来后再加入。
2、在配置或取消链路聚合时形成的环路。
为实现二层网络双路由保护或流量分担,链路聚合的应用越来越多。
链路聚合组要求端口的数据配置必须一样,也就是透传的VLAN也一样。
如果端口取消了链路聚合就会形成环路,该环路肯定会影响到业务。
如果端口也透传了VLAN 31,同理也会影响到L2 S8505和下带设备的网管。
2007年张埔IPSU和新局L2 S8505对开链路聚合时,由于有问题取消聚合,聚合取消后不仅引起了PPPOE、IPTV业务阻断,也引起了L2 S8505网管中断。
另外如华为的EPON OLT设备和L2 S8505对开聚合组时,调试人员最初将端口设置为强制模式。
为实现单芯中断时的业务保护,需要将强制改为自协商模式,而OLT设备必须将聚合组删除才能更改,这时就会产生环路。
因此取消链路聚合时应及时将聚合的某个端口SHUTDOWN或将配置数据删除。
3、2007年9月2日新局L2S8505下带设备网管通信频繁瞬告。
新局L2 S8505下带设备网管通信频繁瞬告,更换网管端口无效。
怀疑S8505被攻击,抓包分析发现ARP包偏多,但也不会影响到网管。
在T160G和L2 S8505下带的小L2设备上发现有接收到大量的IGMP报文信息,S3228上的LOG中有非常多的“Receive too many packets of 'igmp' from port gei_3/1”,抓包发现有非常多的IGMP报文(V2 LEAVE GROUP,源MAC地址为0015-EB6A-F186,目标MAC地址0100-5E00-002,源IP为0.0.0.0,目标IP为224.0.0.2,组播地址
为239.255.40.14 )。
怀疑网络存在环路引起该报文滥烂,将VLAN 29删除后网管立即恢复。
4、2007年7月美岭S3552设备阻断。
最早变电站VPN为二层VPLS,大部分采用ADSL接入。
2007年7月按客户需求需增开部分变电站光纤接入。
按原先数据规划,一都和古格变电站从美岭S3552接入,分别采用VLAN417和VLAN418。
变电站调试人员到现场调试时发现网络不通。
登陆设备后发现美岭S3552网管中断,从下洋S3550无法PING通美岭S3552的网管IP。
在依次排查了光路和下洋S3550设备问题后,最终怀疑设备存在环路。
进入美岭S3552,将端口2/5和2/6 SHUTDOWN,故障依旧。
分别进入端口取消ACCESS VLAN后,通信恢复。
后来测试时,发现只要在端口添加VLAN417数据,设备马上就会出现环路告警“Loopback does exist on port 17 vlan 417, please check it”,port 17即3/1,S3552的上联口。
VLAN 418同理。
这说明在美岭S3552的上层设备VLAN 417和418出现环路。
最后将美岭S3552的2/5和2/6全部改成VLAN 417。
5、网络改造时数据配置有误形成的环路
2008年5月变电站VPN进行MPLS VPN改造,原先主端口为新局L3 S8505的5/1/36 VLAN 420。
为方便改造,另外启用S8505的5/1/39 VLAN 410,该光路经光电转换器后接入监控网络。
改造后考虑到要到现场拆除光路,因此提前将5/1/36 的透传VLAN 420改成VLAN 410,结果造成网络环路。