当前位置:文档之家› 常见问题定位方法

常见问题定位方法

1.1 故障定位思路1.1.1 OSPF网上问题解决要点OSPF网上问题和其他模块的网上问题不同,大多数模块的问题往往只会导致部分报文丢掉,部分业务不通;而OSPF网上问题一旦发生往往会导致某个区域到某个区域所有业务都不通了,持续的时间长,影响的范围广,报的事故级别也就高。

解决OSPF网上问题首先必须要做的就是收集信息;然后就是要快速恢复业务;最后就是分析问题,解决问题。

1信息收集:如果你用的是Windows自带的telnet,请通过菜单选择:然后请将以下命令粘贴到telnet:为了方便收集信息,可以输入以下命令,使输出信息不分屏:然后输入以下命令收集OSPF信息:最好再收集一下fib信息。

2恢复业务,一般情况,采用以下三种措施就能够暂时将业务恢复,因此在收集完信息后马上就做,以减小事故的影响2.1如果配置了“引入直连或静态路由”,但却没有生成对应的ASE(这种问题已发生多次):去掉引入配置,再重新引入;如果问题不属于此类2.2使用reset ospf,重起ospf;不过,推荐做法是把OSPF配置清掉,重新配置OSPF;如果还不行2.3配置静态路由恢复业务;如果有多台路由器配置静态路由,可以先在某台路由器配置静态路由,然后再引入静态路由到OSPF通告出去。

但是,由于外部路由会通告到整个自治域,所以一定要慎重考虑。

3业务恢复了,我们就可以静下心来分析一下问题在哪。

1.1.2 OSPF问题分析:OSPF绝大部分网上问题表现就是“不通”,再细分下去1不通1.1没有生成路由1.1.1有LSA,但没有生成路由1.1.1.1ASE没有生成对应的路由:这时候要看看OSPF路由表中有无到forwarding address的路由,可以通过display ospf routing看有无“Routing for ASEs”:Routing for NetworkDestination Cost Type NextHop AdvRouterArea3.0.0.0/8 1 Net 3.0.0.1 1.0.0.212.0.0.0/8 1562 Stub 2.0.0.1 2.0.0.21.0.0.0/8 1563 Stub 3.0.0.1 1.0.0.21Routing for ASEsDestination Cost Type Tag NextHopAdvRotuer101.0.0.0/8 1 2 1 3.0.0.11.0.0.19.0.0.0/8 1 2 1 3.0.0.31.0.0.2Total Nets: 3Intra Area: 3 Inter Area: 0 ASE: 2 NSSA: 0如果没有的话,往往是因为没有到达ASBR或forwarding address的自治域内路由。

1.1.1.1.1ASE LSA的forwarding address不为0.0.0.0通过display ospf lsdb ase命令,可以看到Link State Data Basetype : ASEls id : 101.0.0.0adv rtr : 1.0.0.1ls age : 239len : 36seq# : 80000003chksum : 0x247options : (DC)Net mask : 255.0.0.0Tos 0 metric: 1E type : 2Forwarding Address :3.3.3.3Tag: 1OSPF协议要求必须有到达forwarding address的域内路由、域间路由,才会根据ASE生成路由,否则是不会生成的。

对于forwarding address不为0.0.0.0的ASE,一般是通过import static引入静态路由生成的。

这时候需要调整产生ASE的路由的配置,把ASE对应的静态路由的下一跳指向OSPF自治域内可达的IP地址;或者调整OSPF配置使forwarding address 自治域内可达。

1.1.1.1.2ASE LSA的forwarding address为0.0.0.01.1.1.1.2.1生成ASE的路由器和出问题的路由器在同一区域可以用以下命令查看有无生成ASE的路由器对应的Router-LSA:[Quidway]display ospf lsdb router X.X.X.X1.1.1.1.2.1.1没有相应的Router-LSA有ASE而没有ASBR的Router-LSA,一般是由于路由器链路down掉,停止通告LSA,而ASE的age比Router-LSA小,尚未被老化掉。

这时候需要查看对应路由器的链路问题。

1.1.1.1.2.1.2有相应的Router-LSA但Where属性不为SpfTree这种情况,一般是由于对应路由器邻居状态没有full,导致在OSPF区域内路由计算时,没有把该路由器加到SPF树上。

这时候需要查看对应路由器邻居状态问题,1.1.1.1.2.2生成ASE的ASBR路由器和出问题的路由器不在同一区域可以用以下命令查看有无生成ASE的路由器对应的4类Summary-LSA:[Quidway]display ospf lsdb asbr X.X.X.X如果没有,则要查看出问题的路由器所在区域的ABR是否和area 0相联,如果不相连。

ABR是不会生成ASBR Summary LSA的。

1.1.1.2没有生成任意LSA的路由:用display ospf lsdb,查看Router LSA和Network LSA状态是否都处于SpfTree或Clist1.1.1.2.1有些LSA处于Uninitialized:说明区域内路由计算出问题,需要查看对应路由器的ospf邻居状态是否正常1.1.1.2.1.1邻居状态不正常:略1.1.1.2.1.2邻居状态正常:则可能是以下原因:1.1.1.2.1.2.1链路类型不匹配:比如一边接口配ospf netowrkp2p,而另一边配ospf network broadcast1.1.1.2.1.2.2链路一边是unnumbered,另一边接口配有IP地址1.1.1.2.1.2.3两链路IP地址配反了,如:A—s0: 1.0.0.1/8----------------s0: 2.0.0.2/8—B|---s1: 2.0.0.1/8-----------------s1: 1.0.0.2/8—|1.1.1.2.2LSA状态正常:则可能是以下原因:1.1.1.2.2.1.1Ospf配置了路由引入过滤规则filter-policy %nimport1.1.2相关LSA没有生成1.1.2.1相关路由器的接口没有生成相应的Router-LSA1.1.2.1.1接口链路down略1.1.2.2ABR没有生成Summary-LSA1.1.2.2.1路由器没有连接到area 0如果路由器没有连接到area 0,是不会生成Summary LSA的1.1.2.3相关路由器的外部路由没有生成ASE-LSA1.1.2.3.1是缺省路由没有生成ASE1.1.2.3.1.1没有配default-route-advertise通过import static命令是不能引入缺省路由的,必须配default-route-advertise命令,才能生成缺省路由的ASE,相关说明请见用户手册。

1.1.2.3.1.2配了default-route-advertise1.1.2.3.1.2.1没有配置default-route-advertise always如果没有配置default-route-advertise always的话,如果路由表中没有缺省路由的话,也不会生成缺省路由的ASE的;而配置default-route-advertise always的话,将强制生成缺省路由的ASE。

1.1.2.3.1.2.2路由器所在区域为stub区域如果先配置区域为stub,如何配置default-route-advertisealways,将不会生成缺省路由的ASE;如果先配置default-route-advertise always,在配置stub的话,可能缺省路由的ASE已经生成,这时该ASE LSA不会被删掉,但不会再刷新、通告,在stub中也不参与路由计算,会自动老化掉。

1.1.2.3.2不是缺省路由1.1.2.3.2.1参见“1.1.2.3.1.2.2 路由器所在区域为stub区域”1.2生成路由但下一跳不对1.2.1首先看路由出接口上是否使能了ospf,如果没有使能ospf,则肯定是计算错了。

收集信息,然后配静态路由恢复业务。

1.2.2用display ospf lsdb命令,根据输出信息自己画出SPF图,即可判断出是否计算错误。

有时候客户发现某路由的下一跳变了就会认为出问题了,但很可能是路径中某链路down了或cost发生改变,ospf重新计算出了更优的路由。

1.2.3注意以下已知缺陷:1.2.3.1有3个以上到同一目的地址的ASE LSA,其中存在掩码不同的情况,而且不同掩码的ASE LSA来自不同的路由器(因此不是附录E问题),则可能会存在路由计算错误的问题:比如出接口不是最优路径,甚至出接口已被shutdown,或者没有使能ospf。

规避方法:建议用户不要引入掩码不同的外部路由;或升级为VRPV3R001M06B02D037以后的版本1.2.3.2当组网中存在vlink时,在某些情况下,到区域内路由下一跳会计算错误会选择非最优的vlink路径。

规避方法:建议用户不配vlink,可用tunel接口替代;或升级到VRPV3R001M06B02D031以后的版本在工程实施过程中会经常出现配置失误造成ospf邻居建立失败,这时可以用display ospf error命令查看一下错误统计,并根据错误类型进行相应处理,错误统计的具体含义请见下章。

以下是在无法通告display ospf error命令定位的情况:1.接口被配置成了passive的,所以在该接口上的邻居无法建立,需要查看ospf模式下的silent-interface配置2.配置了防火墙,将ospf过滤掉了对于ATM,FR接口等NBMA链路没有配置邻居,需查看ospf模式下的peer配置。

相关主题