双机容灾系统建设方案建议书第一章纯软方式双机热备系统建设方案提示:因为纯软双机只支持Windows平台,如不改变现有服务器的Linux操作系统,请跳过本章由于上述的建设双机系统的必要性和双机系统数据的重要性,就需要搭建一个非常适合双机系统运行和数据存储的平台,以此来保障双机系统安全、高效的运行。
只有这样,才能充分发挥双机系统在企业的核心作用,从而全面提升企业的竞争力和生产力。
结合贵方的需求和现状,我们设计一款纯软方式的解决方案,以供参考。
图4.1 拓扑结构图1.1方案描述使用用户原有得两台业务服务器,构成一对双机。
因为纯软双朵只支持Windows平台,所以需要将两台服务器全部改成Windows 系列操作系统,将原Oralce 9i数据库改成Windows平台版本Oracle数据库。
两台服务器通过双机软件组成双机热备系统,双机中任何一台机器发生故障的情况下,由备机接管相应的IP地址、主机名、数据库服务及业务应用。
硬件要求:两台服务器的配置相同(CPU、内存和磁盘分区的类型、大小),同时配置双网卡网络环境要求:两台服务器安装相同的操作系统、数据库、应用程序及服务将两台服务器部署到企业的以太网中,分别将两台服务器中的一块网卡设为业务网卡,并分配固定的物理IP地址。
将两台服务器的另一块网卡作为心跳网卡,通过一条心跳线相连。
两台服务为一主一从的关系,主机为当前业务服务器,从机为灾备业务服务器。
主机上的业务数据会被双机软件通过心跳线同步到从机。
通过双机软件虚拟一个业务IP地址,对外提供服务。
绑定在主机IP址上,当主机发生故障时,再自动切换到从机物理IP地址上进行绑定。
同时,接管数据库服务,应用程序服务等相关业务服务。
双机软件以一定时间频率通过心跳线从主机发送验证信息到从机,检验主机是否运行正常,当主机的IP地址,数据库服务,数据存储区三者之一发生问题,双机软件会认为主机业务已停止,需要从机进行业务接管。
同时停止主机的服务,开启从机服务。
当主机需要进行系统维护,系统升级,硬件安装等操作时,可手动将业务切换到从机上。
当操作完成时,再将数据同步回主机并将业务切换到主机上。
1.2本方案采用双机软件的特性●双机软件的产品和服务能够使信息不间断,它通过一个接近无缝的处理来管理和保护贯穿一个企业的数据。
●基于双机软件的高可用性和高可靠性,我们选择它作为核心信息系统和数据库服务器的双机切换软件。
第二章基于Linux的共享存储双机双机系统的意义在于业务系统的灾难接管,前提是保障数据的一致性和完整性。
因为纯软双机通过数据镜像来完成数据的同步,在同步过程中存在着各种风险,造成数据不完全一致。
在此需求的基础上,共享存储的双机成为双机系统的主流。
共享存储双机共享同一存储介质,主备机器使用同一份数据,两台机器轮流使用。
基于此种需求,双机的发展也是共享存储的双机为主流,且支持多种平台。
针对客户应用的特点,我们建议使用支持Linux平台的共享存储双机。
下面是共享存储双机系统拓扑图2.1方案描述方案部署:●准备两台配置相同(CPU、内存和磁盘分区的类型、大小)的服务器,要求至少配置两个百兆以上网口,一个网口用于提供业务,另外的网口提供两台设备间信息传输●准备一部磁盘阵列,用于存储数据库数据,共享存储方式建议采用IP SAN的方式●安装双机软件并完成配置●将业务IP地址配置成虚拟IP,将该虚拟IP与两台服务器的业务网口物理IP建立关联。
当A服务器作为主服务器运行业务时,虚拟IP 与A服务器业务物理IP相关联,从而将任务转向A服务器,启用B服务器作主机时,虚拟IP与B服务器业务物理IP关联。
双机切换描述两台服务器是一主一备的关系,A服务器开启服务,B服务器做备机。
当主机发生故障时,关闭主机服务,备机启动服务成为主机。
切换的条件有两点:1.网络故障:当主机的本地业务IP不能正常访问时,切换到备机2.数据库故障:当主机的数据库发生故障不能提供服务时,切换到备机3.其它各种软硬件故障导致不能正常提供以上两个服务时,切换到备机切换过程由程序自动完成,无需人员参与,可无人职守。
切换时间不超过45秒,可手动进行切换实验。
第三章本方案中使用的产品介绍3.1高可用双机切换软件要建立高可用的计算机处理系统,首先,在硬件上,要做到各部件的冗余,多台计算机组成集群结构,使整个系统不存在单点故障,此外,还需要有专门的高可用软件来进行管理和监控,需要使应用、服务器资源实现最大的可用性。
不管用户的数据中心是单独的机房、校园,或地理跨度较大的分布式复合站点,高可用软件都可以监控应用、系统和网络资源的运行情况,并保持他们的可用性。
如有故障发生,高可用软件可以重新启动应用,对资源重新分配、优化资源性能,从而减少停机时间,而且这个过程可以自动完成。
系统维护需要有计划的停机,同时又要保证应用的高可用,这个也需要高可用系统来保证。
所以,在高可用系统设计时,需要考虑下述关键点:●是否能避免发生失效,而不是发生失效后进行改正;●故障发生时,是否需要人为干预;●系统维护期间,应用仍然保持高可用;●是否适应于企业环境,在LAN、SAN、NAS、WAN的环境下运行;●与操作系统、应用程序是否能密切配合;●是否可以进行远程资源的管理;●配置和维护是否简单方便,易于管理;●可扩展性。
高可用解决方案首先需要选择底层的存储设备和存储架构,可以采用在Windows平台采用数据镜像的方法。
使用纯软件方式的软件不需要磁盘阵列柜,它将数据存储于各自服务器内,通过镜像引擎将数据进行实时复制,当有故障发生时设定的服务器接管相应的工作。
此双机软件是一个全面的、高可用性的软件解决方案。
可以使应用、服务器资源实现最大的可用性。
双机软件对重要的资源进行积极的管理,从而使业务运行流畅。
通过监控关键系统或应用的参数,双机软件能避免发生失效而不是失效产生以后在加以改正。
这个特性,以及能广泛应用在各种应用程序(比如ERP、RDB、电子邮件、防火墙以及基于网络的电子商务软件)的自动解决方案,使得公司的业务系统运行流畅而且达到最佳状态,并无需用户对软件更新版本。
采用双机软件高可用管理系统具有如下优点:●数据中心的连续动作和应用的●主动的服务管理●系统维护不受干扰●适用性好,使用简单●企业运行环境适用●集中化管理●加强远程资源的自动管理双机软件为您从分支机构到数据中心的应用和数据提供了极具价值的自动可用性。
通过监控应用的状态和性能,当资源接近耗尽时及时向您报警,以避免出现故障,并在发生故障时重新配置和重启服务,以及通过实现流程控制和数据管理的自动化,双机软件成功地做到了这一点。
将双机软件用于您的IT机构,可以减少管理员手动管理和配置应用的工作量,包括重启、恢复和维护等。
将双机软件应用于您的业务,可减少乃至避免停机,从而降低了成本,提高了业务效率。
无论您的数据中心和分支机构环境是大型工作间、园区,还是地理位置分散的复制现场,双机软件都可以执行上述功能。
双机软件支持重要的平台,包括Solaris、Windows Server 2003、Windows 2000、Linux、HP-UX和AIX。
双机软件的全球管理控制台让您通过企业任何地方都可访问的单一界面,轻松地管理所有本地和远程服务器及数据的可用性。
●通过自动资源管理提高企业性能和可用性●充分发挥自动管理的优势●让您的IT基础设施实现更高性能即使您需要24x7的全天候运营,双机软件也可以保证业务顺利运行。
通过监控关键的系统和应用参数,双机软件可以检测并自动修复故障,使您能够继续开展业务。
您还可以利用双机软件监控关键资源,并在这些资源达到临界状态时通知您,以避免故障的发生。
双机软件也可用于实施定制自动资源管理解决方案,通过最大限度地使用应用和资源,确保企业的高效运营。
借助双机软件,数据存储设备、系统、IP地址、NIC等组合成系统资源,网络信息,以及应用和数据库被组合在一起,以便您能方便地定位和管理它们。
您可以自动通过预先定义的策略,或通过手动,控制其可用性。
从应用的角度管理资源,增强了IT机构对业务可用性的控制能力。
双机软件的全球管理Java控制台可以提供可管理应用的状态、所支持资源的快速浏览,且使您只需利用简单的点击界面,即可手动或自动管理自动运营、正常运行时间和停机时间。
全球管理控制台包含在双机软件许可中,可以从您的IT基础设施中的任意系统安装和访问。
只需一个易用的可用性系统控制台,即能监控和管理分布于您企业的任意位置、本地或远程的多个多样化计算平台,因而可以轻松地确保业务出色运行。
双机软件构建在简单而灵活的自动架构上。
凭借传感器、触发器和规则,双机软件可创建任意数量的自动应用资源、策略或流程。
双机软件的功能从简单的故障检测和修复,到完全自动地实施一个预定义控制流程,应有尽有。
双机软件中的自动基础设施是灵活的。
双机软件管理员和IT策略制订者可以决定实现自动操作的时间、方式和程度。
IT员工可以选择是否参与和如何参与某一双机软件自动流程。
双机软件是唯一能够提供这一灵活性、自动地控制服务级别的高可用性工具。
3.2特性和优点持续数据中心运营能力和出色的应用可用性利用双机软件可以保持服务器和应用在发生系统故障、网络硬件故障、定期系统维护和终端用户负载需求动态变化时的可用性。
当一个应用发生故障时,双机软件都能在原服务器或指定备用服务器上迅速将其重启。
双机软件有能力执行N路故障恢复,可以根据公司的特殊要求,独立地或在多台服务器间重启多个应用。
扩展距离可更好地防御大型灾难双机软件跨越远程距离,以保护复制数据和应用的地点。
该配置为企业防御大型灾难提供了最强有力的保护功能。
当与EMC FULLTIME RepliStor或EMCMirrorView/SRDF共用时,双机软件可以确保在灾难需要远程地点间故障恢复时,应用和数据仍能自动保持可用和正常运行。
并且,在您的主地点恢复后,双机软件可以确保在这一过程中被更新的复制数据集可同步运行并返回主现场,从而自动管理整个恢复过程。
这一故障恢复后的自动流程意味着,您的应用始终可以访问当前准确无误的数据集。
用于Windows Server 2003和Windows Server 2000的集成双节点同步镜像双机软件 Synchronous Mirroring for Windows是一个高速块级同步镜像引擎,无需共享磁盘,并可用于复制数据,从而实现了业务的持续性。
它支持服务器间长达6英里的间距,因此,您可以通过创建复制站点,并在发生大型故障的情况下,让双机软件自动执行故障切换,从而使您的关键任务Exchange或SQL 服务器免受大型灾难的影响。
由于双机软件 Synchronous Mirroring for Windows是一个块级同步远程镜像解决方案,使客户可确信其重要数据得到了可靠镜像。