双机热备份软件介绍1、PrimeCluster(PCL)HA集群软件产品概述PrimeCluster HA(PCL HA)是德国富士通-西门子计算机公司(Fujitsu-Siemens Computers)提供的业界领先的支持双机热备和多节点集群的高可用管理软件。
PCL HA是一种应用与系统高可用性(High Availability)管理器。
它为关键业务应用及其相关资源提供了能够持续访问的平台。
PCL HA可为任何类型的应用、服务或数据提供最通用的高可用性环境。
最主要的优点在于自动识别系统故障及组件错误,并具有诸如透明本地恢复或应用故障转移(Failover)等合适的恢复措施。
PCL HA拥有多方向故障转移功能——集群内任一节点均可接管其他节点的功能。
若特定服务器出现故障,它所运行的应用会分配给余下正常运行的服务器,使管理员能灵活而有效地应用系统资源。
由于应用可通过管理干预转移到其他服务器,这样就能在不中断操作的情况下对集群进行扩容。
PCL HA for Linux同目前市场上其他的基于开放源代码的HA软件不同,PCL是由FSC完全自行开发的Linux平台上的高可用软件,它在维护、故障排除、升级、售后服务方面都能够有充分的保障。
同时根据PCL用户的反馈,对于开放源代码的HA类的系统关键软件,最终用户普遍对其版本更新能力、数据安全性和故障(特别是兼容性及底层故障)的排除能力普遍持怀疑态度。
PCL for Linux在欧洲已经有相当的关键业务成功案例,在中国也有上百个成功安装使用的案例,因此,最终用户对PCL的接受度明显较高。
PCL HA做为一个高可靠的HA软件,以德国富士通-西门子公司的先进技术、严谨作风和可靠信誉为后盾,为用户提供系统高可用性方面的可靠保障,是关键应用下服务器集群的理想选择。
PCL HA高可用软件应用环境PCL HA支持的操作系统有Linux和Solaris。
Intel-based的Linux发行版:∙RedHat Enterprise Linux ES/AS 3 (up to Update 5)∙RedHat Enterprise Linux ES/AS 4 (up to Update 2)以及64bit版本∙SuSE Linux Enterprise Server 8 ( up to SP4)∙SuSE Linux Enterprise Server 9 ( up to SP2)以及64bit版本∙以及各种兼容上述两种发行版的Linux,比如红旗、中标、CentOS等等Sparc-based的Solaris∙Solaris 8 / 9 / 10注:上述操作系统为PCLv4.2A00支持的操作系统,随着操作系统的升级,PCL也会做出相应的版本更新PCL HA可用于基于上述操作系统的所有应用,它可对几乎所有的系统组件和应用进行故障监测以及自动的故障转移,为客户的业务提供一个持续可用的平台。
PCL监控的对象包括:∙主机∙操作系统∙本地文件系统∙远程文件系统∙IP网络∙卷管理器(Volume Manager)∙裸设备(Raw Device)∙任何脚本或者程序PrimeCluster_HA特点及优势HA 服务器——应用与服务随时可用PRIMECLUSTER拥有近20年的历史,它随着富士通西门子计算机公司在全球的业务开展,遍布各个行业和领域,在欧洲、中东、非洲和亚洲有着大量的成功案例。
支持多平台――PRIMECLUSTER支持Linux/Intel和Solaris/Sparc平台。
它在用户层面保持界面、操作方法、管理命令的统一,和OS,硬件平台无关。
高效、冗余的集群心跳协议――PRIMECLUSTER可拥有多达8条心跳线路;采用自有的ICF (Internode Communication Facility)协议取代低效的IP协议保护数据完整性――独有的Shutdown Facility机制,确保在集群脑裂(Brain-Split)的情况下用户数据的完整性,最完美的解决方案。
严谨的Online、Offline检查机制,确保应用只可能在一个节点上启动。
灵活的配置方案――HA模式最大支持8个节点,支持1:1、N+1、N:M配置模式,多节点多应用可在集群内灵活配置。
单一管理图形界面――PRIMECLUSTER采用基于浏览器的Java管理界面,可在单一节点上远程管理集群内所有节点。
向导化的配置工具――PCS配置工具能够自动生成资源树,简化配置步骤,自动检查配置的一致性和生成配置文件信息。
能够自动识别某些资源,如卷管理器、SAN网络和NAS。
对于Oracle、DB2、WebServer、SAP等应用拥有Turn Key解决方案滚动升级――PRIMECLUSTER支持版本异构(甚至OS异构),从而支持滚动升级,最小限度减少停机时间。
动态配置――HA和负载均衡模式均支持动态配置,可以在不停止应用的情况下对配置进行修改并生效。
数据完整性保护任何一个集群系统在心跳线路出现故障,或者系统挂死的情况下都会出现集群分裂(Brain-Split)的情况:集群内的节点相互不能得知对方的状态。
如果没有一个严格的机制去处理集群分裂,那用户的应用就有可能同时在多个节点上运行,这种情况下会造成共享资源的争用,造成用户数据的损坏。
比如两台节点同时对共享磁盘上的数据进行写的操作,用户数据很可能就会被损坏,而且是无法恢复的。
PCL通过Shutdown Facility来处理集群分裂的情况,一旦某个节点在规定的时间范围内没有收到对方的心跳信号,那它就会将对方的节点状态改为LEFTCLUSTER,同时调用某个关机代理(Shutdown Agent)去将对方进行关机。
在关掉对方并通过确认对方节点已处于关机状态之后,该节点才将对方的状态变为DOWN,同时会按照用户设置的切换策略进行应用的切换。
在分裂发生之后,哪一台节点会被关掉,这是由用户设置的节点权重+应用权重来决定的。
Shutdown Agent是通过基于硬件的某种管理端口来对节点的电源进行控制(不是操作系统级的Shutdown),现今的PC Server大多数情况下都带有此类的管理端口,比如说HP的iLO,Blade Management,ATCA CMM等等,每种硬件需要不同的SA。
SA只是一个脚本或者程序,它在被调用时会通过远程接入的方式来对服务器进行电源关闭和查询的操作,对于某种特定的硬件来说,我们只需要对操作方法进行简单的修改即可完成SA的开发工作。
PCL除了在节点级给予用户数据最大的保护完,在HA管理器方面同样也有一套严格的数据保护机制。
用户的应用在切换过程中,必须要在一方应用的Offline操作完全执行完毕并且成功的条件下才会在另一方进行应用Online的操作,如果有任何一个资源出现“不一致”或者Offline操作不成功的情况,切换都会被阻止,从而最大限度的杜绝了共享资源争用的情况发生。
尽管高可靠性是RMS的目标,但在数据可能受到破坏的任何情况下,数据完整性优先于高可靠性。
PCL HA Active/Standby工作模式两节点的Active/Standby模式是HA中最简单的一种,两台服务器通过双心跳线路组成一个集群。
应用Application联合各个可选的系统组件如:外置共享的磁盘阵列、文件系统和浮动IP地址等组成业务运行环境。
PCL为此环境提供了完全冗余的服务器配置。
这种模式的优缺点:缺点:Node2在Node1正常工作时是处于“闲置”状态,造成服务器资源的浪费。
优点:当Node1发生故障时,Node2能完全接管应用,并且能保证应用运行时的对处理能力要求。
PCL HA Active/Active工作模式这是目前运用最为广泛的双节点双应用的Active/Active模式。
支撑用户业务的数据库和应用程序在正常状态下分别在两台节点上运行,各自有自己的资源,比如IP地址、磁盘阵列上的卷或者文件系统。
当某一方的系统或者资源出现故障时,就会将应用和相关资源切换到对方的节点上。
这种模式的最大优点是不会有服务器的“闲置”,两台服务器在正常情况下都在工作。
但如果有故障发生导致切换,应用和数据库将放在同一台服务器上运行,由于服务器的处理能力有可能不能同时满足数据库和应用程序的峰值要求,这将会出现处理能力不够的情况,降低业务响应水平。
PCL HA 集群工作模式PCL所支持的N+1模式是用一台Standby的服务器来为N台处理不同业务的节点做冗余备份。
任何一台业务服务器出现故障时都能自动地将业务转移到Standby服务器上,而对其他正常工作的服务器无任何影响。
这种模式可很好的解决集群中服务器“闲置”以及应用“堆叠”的问题。
PCL 与其他集群产品的比较来自第三方的测评报告:PrimeCluster SIS负载均衡软件概述PRIMECLUSTER(PCL) SIS是一个功能强大的基于软件的负载均衡产品,提供可扩展的容错网络服务。
SIS帮助用户建立一个可扩展的、可靠的并易于管理的服务器集群,提供了在Linux、Solaris、Windows环境下实现负载均衡(Load Balance)的高效、可靠和高性价比的方案。
PCL-SIS集群中的节点可通过一至多个虚拟IP(VIP)地址来访问,在用户面前就好象是一个网络服务器。
PCL-SIS节点可以包括Linux、Solaris或Windows,它们共享不同服务的负载。
有了SIS,用户可配置每项服务的负载共享,还可运用多种负载均衡算法对特殊应用及站点需求进行细调。
PCL-SIS删除了单一故障点并确保以下可用性:∙如果任一SIS节点或服务出现故障,SIS会对故障节点周围的请求进行调度;∙任一出现故障的SIS模块会得到适度修复;∙曾启动过SIS的故障节点重启之后将无缝加入集群,从而恢复最大性能。
∙通过将出局包从NIC路由至功能节点,SIS可恢复NIC故障。
SIS具有以下特色:∙为所有外部用户提供单一IP目标地址∙易于添加节点和服务∙基于每个端口的TCP和UDP服务配置∙多种可用的负载均衡算法∙无缝处理节点故障、服务故障和组件故障∙灵活的备份节点管理∙用于集群的代理服务器地址∙节点间的专用通信∙基于软件的解决方案∙基于图形界面GUI的配置和管理界面更多关于SIS:∙SIS应用环境∙SIS负载均衡工作原理∙SIS负载均衡算法∙代理服务器与专用地址∙故障转移SIS应用环境服务节点服务节点提供web服务和目录服务之类的网络服务。
SIS可将服务节点构成集群,如果一个服务节点发生故障,会在其周围调度服务。
服务节点恢复正常后将无缝加入应用集群中。
服务节点可以是Windows 2000服务器、Solaris及Linux。