网络高可用性技术白皮书(一)杭州华三通信技术有限公司目录网络高可用性技术白皮书(一) (1)1. 硬件冗余 (1)1.1 主控冗余 (1)1.2 单板热插拔 (2)1.3 电源风扇冗余 (3)2. 链路捆绑技术 (3)3. 热补丁技术 (3)4. IRF智能弹性架构 (4)4.1 分布式设备管理 (5)4.2 分布式路由 (7)4.3 分布式链路聚合 (8)网络高可用性技术白皮书网络高可用性技术,基本都可以归入容错技术,即在网络出现故障(错误)时,确保网络能快速恢复。
对目前常用的高可用性技术,可以作一个简单的归类:z单个设备上的硬件冗余,如双主控、单板热插拔、电源冗余、风扇冗余等;z链路捆绑,如以太网链路聚合、MP、MFR等;z环网技术,如RPR、RRPP;z STP、Smart Link、Flex Link等二层冗余技术;z冗余网关技术,如VRRP、HSRP、GLBP;z ECMP,浮动静态路由,动态路由快速收敛(如快速hello,iSPF);z不间断转发:NSF/SSO/GR;z MPLS 快速重路由;z快速故障检测技术,如BFD。
1. 硬件冗余这里的硬件冗余指的是单台设备上的硬件冗余,一般有主控冗余、交换网冗余、单板热插拔和电源风扇冗余等,使用冗余部件可以在单个部件可靠性一定的情况下,提高整个设备的可用性。
随着硬件技术的进步,目前很多设备交换网集成在主控板上,所以交换网冗余不单独介绍。
1.1主控冗余在设备只有单主控的情况下,如果主控板故障,重起主控板需要加载映象文件、初始化配置、重新注册业务板,然后重建控制平面和转发平面表项,整个过程在5分钟左右,这个时间实在是太长了,特别对于网络中处于单点故障的节点来说更是如此,因为业务在这个过程中将完全中断。
为了缩短这个时间,主控冗余应运而生。
主控冗余是指设备提供两块主控板,互为备份。
因为主控冗余在控制和转发分离的架构下才能发挥最大的效用,这里先介绍一下控制和转发分离的概念。
在控制和转发分离的架构中,控制平面负责各种协议,如路由协议(如RIP/OSPF/IS-IS/BGP)、标签分发协议(如LDP/RSVP-TE/BGP)等的处理,形成路由信息表(RIB)和标签信息表(LIB),从其中选择最优者,加上必要的二层信息,形成路由转发信息表(FIB)和标签转发信息表(LFIB),下发到转发平面,转发平面据此实现快速转发。
控制平面的处理在主控板上进行,转发平面的处理既可以在主控板(集中式设备),也可以在业务板(分布式设备)。
一旦实现了控制和转发分离,即使控制平面出现故障,转发平面的转发表项在短时间内可以认为仍然合理,继续转发数据而不会导致问题(如环路),当然,控制平面必须能快速恢复并重新和邻居建立协议会话,收敛后再对转发平面进行检查,对表项作必要更新,删除在新的会话环境下不再正确的转发表项。
在主控冗余的设备上,配备了两块主控板,一块实际起作用,称为Master,另一块备用,称为Slave。
只有Master进行控制平面的处理,并生成转发表项。
Slave上的映像文件虽然也充分启动,配置也从Master实时备份,但Slave不参与控制平面的处理。
不过,Master转发平面的各种表项(如L2/L3转发表项、组播转发表项、标签转发表项),会以实时增量备份和定期完整备份相结合的方式持续备份到Slave上。
虽然Slave上的控制平面对网络状况一无所知,但转发平面确因为和Master进行了同步而基本能反映当时的网络转发状态,随时可以替换Master 承担起转发任务,这就是转发和控制分离带来的效果。
设备实时检测Master是否正常工作,检测手段可以是检测主备板之间的硬件心跳,也可以使用IPC通道或用其他方式进行检测。
一旦发现Master异常,立即启动主备切换,由Slave接管Master的工作,Master和Slave的角色互换。
和单主控相比,双主控的收敛性能要好得多,因为在双主控情况下,Slave已经预先完成映象文件的加载和配置的初始化工作,主备切换时业务板不需要重新注册,二三层接口也不会出现up/down。
另外,因为Slave上已经备份有转发表项,可以立即承担转发任务,在一定程度上可以避免业务中断。
不过,因为新的Master在主备切换前不参与控制平面的处理,在切换后需要重新和邻居进行会话协商,所以虽然保存了完整的转发表项,但只能避免部分流量不中断。
比如,二层业务,以及从本设备往外发送的流量可以不中断;另外,如果和邻居之间配置的是静态路由或静态LSP 的话,邻居也会继续往发生倒换的设备发送流量,流量不中断。
但如果和邻居之间是动态路由协议或动态标签分发协议,和邻居之间的流量是会中断的,这是因为控制平面会话重置的情况下,邻居的控制平面会重新计算,选择它认为合适的路径。
以OSPF协议为例,新Master在发出的Hello报文中没有原来邻居的RID,会导致邻居把OSPF会话状态重置,并把和发生切换的设备相关的LSA删除,导致路由重新计算,如果有其他可选路径的话,流量会绕开发生主备切换的设备,如果没有可选路径,则需要等待OSPF重新收敛,在重新收敛之前,邻居是不会把流量发给发生主备切换的设备的。
下面分析一下主备切换的收敛时间。
主备切换的前提条件,是检测到Master故障。
在Master 故障但没有被检测到的时间内,会导致报文丢失。
其次,主备切换期间也会丢一部分报文。
最后,主备切换完成后,设备需要和和邻居重建协议会话,这也需要一定时间。
总的来说,主备切换的收敛时间为:Master故障检测时间+切换时间+信令收敛时间。
1.2单板热插拔单板热插拔,是指在设备正常运行时,在线插拔单板,而不影响其他单板的业务。
一般的中高端机架式设备,均支持单板热插拔。
单板热插拔功能包括:z往机框中新增单板不影响已经在用单板z可在线更换单板,即拔出单板换一块新单板(或老板重新插入)时,新单板能继承原来的配置,并且不影响其他单板的工作。
z对于分布式设备,在添加或插拔单板时,FIB表能同步到单板。
单板热插拔和跨板的链路捆绑技术相结合,一定程度上提供了单板间的1:N备份功能。
单板热插拔的收敛时间不好衡量,就以配置继承和生效为例,收敛时间和配置的类型及配置的多少有极大的关系。
如果和链路捆绑结合,收敛时间还和链路捆帮的收敛时间相关。
1.3电源风扇冗余为了保证设备电源收入的稳定,中高端设备一般提供双路电源输入,当一路输入出现故障时,能自动切换到另一路,不影响设备功能。
另外,中高端设备一般通过多个电源模块供电,采取1:N备份方式,一个电源模块为其他N个提供备份,在拔出某一个电源模块时,其他模块能提供足够电源功率。
风扇作为散热的重要手段,中高端设备也提供风扇冗余,一般提供多个风扇框,可以在线更换其中的风扇框,不影响产品功能。
电源和风扇的切换和更换不应该影响产品的转发功能,可以认为其收敛时间为0。
2. 链路捆绑技术链路捆绑,就是把多个属性相同的物理链路捆绑在一起,逻辑上当成一个链路。
链路捆绑能带来以下好处:z能提供更高的链路带宽z流量可在各个链路间实现负载分担z链路间互为备份,可提高可用性。
另外,跨单板、跨设备的链路捆绑事实上提供了一定程度的单板、设备间的互为备份功能,较大的提高了网络的可用性。
常见的链路捆绑有:以太网链路聚合,多链路PPP,多链路帧中继等。
因为链路捆绑相对比较简单,这里不展开叙述。
3. 热补丁技术1.热补丁原理补丁是计算机软件系统和软件工程学中的一个术语,一般是为了对系统中的某些错误进行修正而发布的独立的软件单元。
它能够在不影响系统正常运行的情况下完成对系统错误的修正,也就是对系统进行动态升级。
基本原理就是在系统中保留一段内存空间,将新的函数实体以补丁文件的方式加载其中,根据要被替换函数的入口地址找到被替换函数的第一条执行指令,将其改为一条跳转指令,跳转地址为新函数的入口地址;这样当其他函数要调用被替换函数时,CPU根据跳转指令就会执行新的函数实体。
2.热补丁状态转换各厂商实现热补丁的基本原理大体相同,但具体实现上有一定差别,下边以H3C公司热补丁技术为例简单介绍状态机转换和各状态的作用。
补丁存在四种状态:z空闲(IDLE):初始状态,补丁没有被加载z去激活(DEACTIVE):补丁已经加载,但未被激活z激活(ACTIVE):补丁处于试运行状态z运行(RUNNING):补丁处于正式运行状态激活态与运行态的最大区别在于系统重启后,激活态的补丁转换为去激活态,不再发挥作用,而运行态的补丁在系统重启后仍然保持为运行态,继续发挥作用。
补丁的激活态主要是提供一个缓冲带,以防止因为补丁错误而导致系统连续运行故障。
补丁的状态只有在用户命令的干预下才会发生切换,命令与补丁状态的切换关系如下图所示图1 命令行与补丁状态切换对应关系4. IRF智能弹性架构IRF(Intelligent Resilient Framework),即智能弹性架构,是创新性建设网络核心的新技术。
它将帮助用户设计和实施高可用性、高可扩展性的千兆以太网核心和汇聚主干。
运用IRF技术可以将多台三层交换机互联在一起形成一个逻辑交换实体,称为一个fabric,fabric内每一个交换机称为一个unit。
从管理和配置的角度看,一个fabric看起来就像一台交换设备;从性能角度看,分布式交换架构中的每台交换机都能针对其端口上的第二层/第三层流量通信业务制定本地转发决策。
图2IRF智能弹性架构示意图和传统的堆叠技术相比,IRF是一种更为增强的堆叠技术,在多方面进行了创新或增强,除了可以做到扩展端口、统一管理之外,IRF在高可靠性、冗余备份方面比传统堆叠有了很大提高。
IRF技术可以容许全局范围内的跨设备链路聚合,提供了全面的链路级保护。
同时,IRF技术实现了跨设备的三层路由冗余,可以支持多种单播路由协议、组播路由协议的分布式处理,真正实现了多种路由协议的热备份技术,这些方面都是传统堆叠技术难以做到的。
此外,IRF技术实现了二层协议在fabric内分布式运行,提高了堆叠内unit的利用率和可靠性,减少了设备间的协议依赖关系。
具体来说,IRF主要包括3方面的技术实现:DDM(分布式设备管理)、DDR(分布式路由)、DLA(分布式链路聚合)4.1分布式设备管理从外界看来,整个fabric是一台整体设备,用户可以通过CONSOLE、SNMP、TELNET、WEB等多种方式来管理整个fabric。
图3 整个fabric当成一台设备管理IRF技术最多可以连接8台设备组成一个fabric,无论是管理特性、还是转发特性,在用户看来,fabric就像是一台设备在运行。
既然多台设备堆叠当成一台设备运行,就要解决堆叠设备间配置不相同的问题。