当前位置:文档之家› 常见问题定位方法

常见问题定位方法

1.1 故障定位思路 1.1.1 OSPF网上问题解决要点 OSPF网上问题和其他模块的网上问题不同,大多数模块的问题往往只会导致部分报文丢掉,部分业务不通;而OSPF网上问题一旦发生往往会导致某个区域到某个区域所有业务都不通了,持续的时间长,影响的范围广,报的事故级别也就高。 解决OSPF网上问题首先必须要做的就是收集信息;然后就是要快速恢复业务;最后就是分析问题,解决问题。 1 信息收集: 如果你用的是Windows自带的telnet,请通过菜单选择:然后请将以下命令粘贴到telnet: 为了方便收集信息,可以输入以下命令,使输出信息不分屏: 老命令行 新命令行 user-interface vty 0 4 screen-length 0 line vty 0 4 screen-length 0 然后输入以下命令收集OSPF信息: 老命令行 新命令行 show ip ospf error show ip ospf cumulative show ip ospf show ip ospf interface show ip ospf neighbor show ip ospf routing show ip ospf border show ip ospf summary-address show ip ospf database display ospf error display ospf cumulative display ospf brief display ospf interface display ospf peer display ospf routing display ospf abr-asbr display ospf asbr-summary display ospf lsdb show ip ospf database router show ip ospf database network show ip ospf database summary show ip ospf database asbr show ip ospf database nssa show ip ospf database external self-originate show ip ospf nexthop show ip ospf request-list show ip ospf retrans-list show ip ospf virtual-links show ip rout show ip ospf error show ip ospf cumulative display ospf lsdb router display ospf lsdb network display ospf lsdb summary display ospf lsdb asbr display ospf lsdb nssa display ospf lsdb ase self-originate display ospf nexthop display ospf request-queue display ospf retrans-queue display ospf vlink display ip rout display ospf error display ospf cumulative

最好再收集一下fib信息。 2 恢复业务,一般情况,采用以下三种措施就能够暂时将业务恢复,因此在收集完信息后马上就做,以减小事故的影响 2.1 如果配置了“引入直连或静态路由”,但却没有生成对应的ASE(这种问题已发生多次):去掉引入配置,再重新引入;如果问题不属于此类 2.2 使用reset ospf,重起ospf;不过,推荐做法是把OSPF配置清掉,重新配置OSPF;如果还不行 2.3 配置静态路由恢复业务;如果有多台路由器配置静态路由,可以先在某台路由器配置静态路由,然后再引入静态路由到OSPF通告出去。但是,由于外部路由会通告到整个自治域,所以一定要慎重考虑。 3 业务恢复了,我们就可以静下心来分析一下问题在哪。

1.1.2 OSPF问题分析: OSPF绝大部分网上问题表现就是“不通”,再细分下去 1 不通 1.1 没有生成路由 1.1.1 有LSA,但没有生成路由 1.1.1.1 ASE没有生成对应的路由: 这时候要看看OSPF路由表中有无到forwarding address的路由,可以通过display ospf routing看有无“Routing for ASEs”: Routing for Network Destination Cost Type NextHop AdvRouter Area 3.0.0.0/8 1 Net 3.0.0.1 1.0.0.2 1 2.0.0.0/8 1562 Stub 2.0.0.1 2.0.0.2 0 1.0.0.0/8 1563 Stub 3.0.0.1 1.0.0.2 1

Routing for ASEs Destination Cost Type Tag NextHop AdvRotuer 101.0.0.0/8 1 2 1 3.0.0.1 1.0.0.1 9.0.0.0/8 1 2 1 3.0.0.3 1.0.0.2

Total Nets: 3 Intra Area: 3 Inter Area: 0 ASE: 2 NSSA: 0 如果没有的话,往往是因为没有到达ASBR或forwarding address的自治域内路由。 1.1.1.1.1 ASE LSA的forwarding address不为0.0.0.0 通过display ospf lsdb ase命令,可以看到

Link State Data Base type : ASE ls id : 101.0.0.0 adv rtr : 1.0.0.1 ls age : 239 len : 36 seq# : 80000003 chksum : 0x247 options : (DC) Net mask : 255.0.0.0 Tos 0 metric: 1 E type : 2 Forwarding Address :3.3.3.3 Tag: 1 OSPF协议要求必须有到达forwarding address的域内路由、域间路由,才会根据ASE生成路由,否则是不会生成的。对于forwarding address不为0.0.0.0的ASE,一般是通过import static引入静态路由生成的。这时候需要调整产生ASE的路由的配置,把ASE对应的静态路由的下一跳指向OSPF自治域内可达的IP地址;或者调整OSPF配置使forwarding address自治域内可达。

1.1.1.1.2 ASE LSA的forwarding address为0.0.0.0 1.1.1.1.2.1 生成ASE的路由器和出问题的路由器在同一区域 可以用以下命令查看有无生成ASE的路由器对应的Router-LSA: [Quidway]display ospf lsdb router X.X.X.X 1.1.1.1.2.1.1 没有相应的Router-LSA 有ASE而没有ASBR的Router-LSA,一般是由于路由器链路down掉,停止通告LSA,而ASE的age比Router-LSA小,尚未被老化掉。这时候需要查看对应路由器的链路问题。 1.1.1.1.2.1.2 有相应的Router-LSA但Where属性不为SpfTree 这种情况,一般是由于对应路由器邻居状态没有full,导致在OSPF区域内路由计算时,没有把该路由器加到SPF树上。这时候需要查看对应路由器邻居状态问题, 1.1.1.1.2.2 生成ASE的ASBR路由器和出问题的路由器不在同一区域 可以用以下命令查看有无生成ASE的路由器对应的4类Summary-LSA: [Quidway]display ospf lsdb asbr X.X.X.X 如果没有,则要查看出问题的路由器所在区域的ABR是否和area 0相联,如果不相连。ABR是不会生成ASBR Summary LSA的。 1.1.1.2 没有生成任意LSA的路由: 用display ospf lsdb,查看Router LSA和Network LSA状态是否都处于SpfTree或Clist 1.1.1.2.1 有些LSA处于Uninitialized: 说明区域内路由计算出问题,需要查看对应路由器的ospf邻居状态是否正常 1.1.1.2.1.1 邻居状态不正常: 略 1.1.1.2.1.2 邻居状态正常: 则可能是以下原因: 1.1.1.2.1.2.1 链路类型不匹配:比如一边接口配ospf netowrk p2p,而另一边配ospf network broadcast 1.1.1.2.1.2.2 链路一边是unnumbered,另一边接口配有IP地址 1.1.1.2.1.2.3 两链路IP地址配反了,如: A— s0: 1.0.0.1/8----------------s0: 2.0.0.2/8—B |---s1: 2.0.0.1/8-----------------s1: 1.0.0.2/8—| 1.1.1.2.2 LSA状态正常:

相关主题