F5服务器负载均衡解决方案目录一.大量数据处理所面临的问题 (2)1.目前存在隐患 (3)2.应用系统问题综述 (3)1)“峰值”问题 (4)2)多米诺”现象 (4)3)“N+1”方式 (4)4)“扩展”不便 (5)5)“免疫力”差 (5)6)“容灾”.................................................................................... 错误!未定义书签。
7)应用与网络脱节 (6)二.F5解决方案 (6)2.1 网络结构 (6)2.2 方案优势 (7)2.2.1避免“不平衡”现象 (7)2.2.2解决因“峰值堵塞”带来的性能调整“不平衡” (9)2.2.3避免“多米诺”现象 (9)2.2.4更好的提供系统容错,提高系统可靠性 (10)2.2.5“扩展”灵活 (11)2.2.6“免疫力”强 (12)2.2.7“容灾” (13)2.2.8网络感知应用,应用控制网络 (14)三.相关技术资料 (17)BIG-IP提供支持99.999%的正常运行 (17)四.成功案例 (19)F5为中国某税务机关提供高可用性解决方案 (19)一.大量数据处理所面临的问题在现今的企业中,不论是否提供关键性任务的服务,都需要一个持续运行不断的高可用性网络计算环境以维持不间断的高品质服务。
所谓高可用性的环境,也是信息管理人员所必须考虑的四件事:1.使数据有一个安全的存储和运作方式,即使在设备故障时仍能保持数据的完整一致。
2.使服务器系统持续运行,即使发生故障仍然让服务持续下去。
3.使整个计算环境能更好的管理,如何容错、容灾、集群共享。
4.如何使投资有最好的效益,使系统有最佳的扩充能力,有最低的整体拥有成本,也就是在任何情况之下均能确保数据的完整一致,系统持续运行,使服务不间断,同时有最好的投资回报率。
高可用性被定义为计算系统的连续运行。
根据故障停机的业务影响,应用系统需要不同的可用性水平。
要想实现一个应用系统的高可用性,所有组件(包括应用和数据库服务器、存储设备以及端到端网络)都需要提供连续的服务。
企业和机构对网络化应用及Internet 的日益依赖,加上语音和数据的集成,创造了对高可用性应用的增加需求。
任何类型的系统故障停机都可能意味着收入、信誉和客户满意的巨大损失。
高度网络可用性的利用,企业实施高可用性网络来:•防止财务损失•防止生产力损失•改进用户满意度•改进客户满意/信任•降低反应性IT支持成本,提高IT生产力•部署关键任务应用支持新业务实践的好处•典型的业务要求为了实现高度的网络可用性,需要部署下列组件:•可靠的网络设备H/W和S/W冗余及软件可靠性•弹性网络技术确保任何设备或链路故障快速恢复的功能性•网络设计定义良好的网络拓扑和配置,旨在以一种优化和计划良好的方式利用网络弹性功能。
•最佳实践定义良好的网络部署和维护过程,以及简化这些政策实施所必需的事件和变化管理工具•全球性支持全球性积极的支持和纠错支持,可以实现抢先的快速反应维护支持•行业伙伴关系确保端到端应用可用性的技术、支持服务及最佳实践的集成1.目前存在隐患1.1由于采用双机备份方式成本太高,如果不能建立有效的冗余技术,服务器不能保障得到24*7持续服务质量.1.2在广泛开展业务时,在流量的非线性变化或不平衡动态中,有可能需要根据具体情况增加或删除业务服务器,而增加与减少业务服务器材必须更改系统的IP地址指向,造成业务服务器的扩展达不到新业务的需求.1.3大量开展业务使服务器数量急剧增加,而如何管理监控服务器的流量,以便随时掌握服务器的负载情况和趋势是一个较大的难题.1.4服务器需要与许多异种架构系统配合,联网环境复杂,黑客攻击与病毒,蠕虫等侵入的可能性相对核心网络系统大,因为服务器的IP地址裸露在网络中使得服务器的安全性得不到保障2.应用系统问题综述1)“峰值”问题应用服务器的业务一般多为联机业务。
联机业务的处理多存在“波峰”和“波谷”的变化。
而且“波峰”时,业务量大小的变化又不规律,这就使应用服务器不得不面对“峰值堵塞”问题。
原有解决方法为增加应用服务器或主机数量,提高处理能力。
但仍存在性能不平衡问题,且这样做,投资成本大。
2)多米诺”现象单台服务器的设置,不可避免会出现“单点故障”,需要进行服务器“容错”。
为实现容错,往往在主服务器旁安置一台或多台备份服务器。
但这样做,平时只有一台服务器工作,其它服务器处于空闲状态,无法完全利用所有服务器的处理资源,投资得不到充分利用。
且当出现“峰值堵塞”时,所得到的往往是“多米诺”效应,即所有服务器连续被“堵”至“死”。
并且,当所有服务器都损坏时,无法动态地、合理地利用其它资源提供服务或备份。
3)“N+1”方式这种方式也是在应对服务器“容错”时,提出的应用方式。
“N”,即业务处理集群,“1”,即一台备份机。
我们注意到,虽然存在一台备份机,随时准备对业务处理集群中的任意一台服务器进行备份,但是,如果又有服务器或更多服务器(软硬件)出现故障呢?所以“N+1”也不能很好地完成系统“容错”。
4)“扩展”不便随着物理和应用的集中,应用服务器上所要处理的数据量(traffic)增大,客户交易产生的同时连接(concurrentconnection)数量会越来越多。
•若处理资源不够,在未超出系统容量时,往往是客户的请求回应越来越慢,可容纳的同时连接数量逐渐减小,系统性能严重下降。
•当超出系统容量后,系统“死机”,业务中断。
为应对日益增多的业务量,系统的扩展性尤为重要。
当前所采用的扩展方式多为利用CLUSTER的方式。
但这时,需要配置CLUSTER卡和CLUSTER集线器。
·这些硬件设备成本高,投资大。
·CLUSTER对硬件系统存在限制。
·CLUSTER的容量有限。
所有这些都会使系统“扩展”不便。
5)“免疫力”差由于系统服务器“裸露”于网络连接中,而防火墙的安置又多在网络总入口处,所以服务器很容易受到来自各方面的“恶意性”或“无意”地攻击。
为每台或每组服务器单独设置防火墙,又会使系统投资加大,维护量大幅提高。
6) 应用与网络脱节系统的变化随时随地都会发生,完全靠人工的方式去调整网络与之适应,已经显出了其“非时时地”、“不灵活的”缺陷。
如何使应用的变化动态地反映到网络的调整,已经成为现代化应用系统的一个新的课题。
二.F5解决方案2.1 网络结构如前所述应用系统出现的问题,经过认真的分析,结合F5在业界多年的经验,利用F5的流量管理设备提供良好的“备而不闲”的解决方案。
防火墙BIGIPServerSwitch在这种结构下,F5 BIGIP 与上联的防火墙和下联的交换机都采用交叉全冗余线路连接,因此需要在防火墙,BIGIP 和siwtch 上都开启spanning-tree 协议,从而避免环路的产生。
在F5上会添加一个virtual server ,映射到后台server 上。
只需要将dns 记录指到F5上的virtual server ,即可把用户导向到F5上。
当用户访问这个virtual server 时,流量会被均匀的负载均衡到后台server上。
如果某台server设备发生故障,F5将自动发现并不再把流量发送到这台故障的server上,从而实现server的高可用。
在需要扩展时,只需将新的服务器设备连接到网络中,在F5上做一些设置即可。
不会对现有网络产生任何影响的情况下就可以实现无缝扩展。
2.2 方案优势2.2.1避免“不平衡”现象如果能够充分利用所有的服务器资源,将所有流量均衡的分配到各个服务器,我们就可以有效地避免“不平衡”现象的发生。
BIGIP是一台对流量和内容进行管理分配的设备。
它提供12种灵活的算法将数据流有效地转发到它所连接的服务器群。
而面对用户,只是一台虚拟服务器。
用户此时只须记住一台服务器,即虚拟服务器。
但他们的数据流却被BIGIP灵活地均衡到所有的服务器。
这12种算法包括:•轮询(Round Robin):顺序循环将请求一次顺序循环地连接每个服务器。
当其中某个服务器发生第二到第7层的故障,BIGIP就把其从顺序循环队列中拿出,不参加下一次的轮询,直到其恢复正常。
•比率(Ratio):给每个服务器分配一个加权值为比例,根椐这个比例,把用户的请求分配到每个服务器。
当其中某个服务器发生第二到第7层的故障,BIGIP就把其从服务器队列中拿出,不参加下一次的用户请求的分配,直到其恢复正常。
•优先权(Priority):给所有服务器分组,给每个组定义优先权,BIGIP用户的请求,分配给优先级最高的服务器组(在同一组内,采用轮询或比率算法,分配用户的请求);当最高优先级中所有服务器出现故障,BIGIP才将请求送给次优先级的服务器组。
这种方式,实际为用户提供一种热备份的方式。
•最少的连接方式(Least Connection):传递新的连接给那些进行最少连接处理的服务器。
当其中某个服务器发生第二到第7层的故障,BIGIP就把其从服务器队列中拿出,不参加下一次的用户请求的分配,直到其恢复正常。
•最快模式(Fastest):传递连接给那些响应最快的服务器。
当其中某个服务器发生第二到第7层的故障,BIGIP就把其从服务器队列中拿出,不参加下一次的用户请求的分配,直到其恢复正常。
•观察模式(Observed):连接数目和响应时间以这两项的最佳平衡为依据为新的请求选择服务器。
当其中某个服务器发生第二到第7层的故障,BIGIP就把其从服务器队列中拿出,不参加下一次的用户请求的分配,直到其恢复正常。
•预测模式(Predictive):BIGIP利用收集到的服务器当前的性能指标,进行预测分析,选择一台服务器在下一个时间片内,其性能将达到最佳的服务器相应用户的请求。
(被BIGIP进行检测)•动态性能分配(Dynamic Ratio-APM):BIGIP收集到的应用程序和应用服务器的各项性能参数,动态调整流量分配。
•动态服务器补充(Dynamic Server Act.):当主服务器群中因故障导致数量减少时,动态地将备份服务器补充至主服务器群。
•服务质量(QoS):按不同的优先级对数据流进行分配。
•服务类型(ToS):按不同的服务类型(在Type of Field中标识)对数据流进行分配。
•规则模式:针对不同的数据流设置导向规则,用户可自行编辑流量分配规则,BIGIP利用这些规则对通过的数据流实施导向控制。
2.2.2解决因“峰值堵塞”带来的性能调整“不平衡”当出现流量“峰值”时,如果能调配所有服务器的资源同时提供服务,所谓的“峰值堵塞”压力就会由于系统性能的大大提高而明显减弱。