当前位置:文档之家› 5.应用系统高可用性(精)

5.应用系统高可用性(精)


Active/Standby
双机热备=主机+备机,Active/Standby
LAN
主服务器 心跳线
备份服务器
双机软件
双机软件
磁盘阵列
Active/Active
双机热备援=主机(备机)+备机(主机),Active/Active
LAN
主/备服务器 心跳线
备/主服务器
双机软件
双机软件
磁盘阵列
Cluster技术
应用系统高可用性
锐捷网络 存储产品线
什么是高可用性?
计算机系统的可用性(availability)是通过系统的可靠性 (reliability)和可维护性(maintainability)来度量的。工程 上通常用平均无故障时间(MTTF)来度量系统的可靠性,用平 均维修时间(MTTR)来度量系统的可维护性。于是可用 性被定义为:MTTF/ (MTTF+MTTR)*100%
高可用性目的之业务连续性
业务连续性是指企业有应对风险自动调整和快速反应的能 力,以保证企业业务的连续运转。为企业重要应用和流程 提供业务连续性应该包括以下三个方面: 高可用性(Highavailability):是指提供在本地故障情 况下,能继续访问应用的能力。无论这个故障是业务流程、 物理设施、IT软/硬件的故障。 连续操作(Continuousoperations):是指当所有设备无 故障时保持业务连续运行的能力。用户不需要仅仅因为正 常的备份或维护而需要停止应用的能力。 灾难恢复(DisasterRecovery):是指当灾难破坏生产中 心时在不同的地点恢复数据的能力。灾难恢复的特点是在 不同的地点不同的硬件设备上流程。同时三个部分又不是 相互孤立的,是相互关联,而且有交叉的。
总结
阐述系统高可用的必要性和实现的方式 附加实验:在模拟软件
根据集群系统的不同特征一般把集群系统分为两类: (1)、高可用(High Availability)集群,简称HA集群。 这类集群致力于提供高度可靠的服务。就是利用集群系 统的容错性对外提供7*24小时不间断的服务,如高可用的 文件服务器、数据库服务等关键应用。 负载均衡集群:使任务可以在集群中尽可能平均地分摊 不同的计算机进行处理,充分利用集群的处理能力,提高 对任务的处理效率。 (2)、性能计算(High Perfermance Computing)集 群,简称HPC集群,也称为科学计算集群。 在这种集群上运行的是专门开发的并行应用程序,它可 以把一个问题的数据分布到多台的计算机上,利用这些计 算机的共同资源来完成计算任务,从而可以解决单机不能 胜任的工作(如问题规模太大,单机计算速度太慢)。
HA模式
HA三种工作方式: (1)、主从方式 (非对称方式) 工作原理:主机工作,备机处于监控准备状况;当主机 宕机时,备机接管主机的一切工作,待主机恢复正常后, 按使用者的设定以自动或手动方式将服务切换到主机上运 行,数据的一致性通过共享存储系统解决。 (2)、双机双工方式(互备互援) 工作原理:两台主机同时运行各自的服务工作且相互监 测情况,当任一台主机宕机时,另一台主机立即接管它的 一切工作,保证工作实时,应用服务系统的关键数据存放 在共享存储系统中。 (3)、集群工作方式(多服务器互备方式) 工作原理:多台主机一起工作,各自运行一个或几个服 务,各为服务定义一个或多个备用主机,当某个主机故障 时,运行在其上的服务就可以被其它主机接管。
服务器高可用技术—Cluster技术
LAN
主控节点 从节点
主控节点负责任务调配; 从节点共同执行任务; 节点之间负载均衡和故障接管; 专用的集群文件系统; 对存储系统的并发处理能力有较高要求。
磁盘阵列
高可用性之Cluster
集群(cluster)就是一组计算机,它们作为一个整体向用 户提供一组网络资源。这些单个的计算机系统就是集群的 节点(node)。一个理想的集群是,用户从来不会意识 到集群系统底层的节点,在他/她们看来,集群是一个系 统,而非多个计算机系统。并且集群系统的管理员可以随 意增加和删改集群系统的节点。
99.9
99
高可用性之HA
HA的容错备援运作过程 自动侦测(Auto-Detect)阶段由主机上的软件通过冗余侦 测线,经由复杂的监听程序 自动切换(Auto-Switch)阶段 某一主机如果确认对方故障, 则正常主机除继续进行原来的任务,还将依据各种容错备 援模式接管预先设定的备援作业程序,并进行后续的程序 及服务。 自动恢复(Auto-Recovery)阶段在正常主机代替故障主机 工作后,故障主机可离线进行修复工作。在故障主机修复 后,透过冗余通讯线与原正常主机连线,自动切换回修复 完成的主机上。整个回复过程完成由EDI-HA自动完成,亦 可依据预先配置,选择回复动作为半自动或不回复。
如何衡量高可用性?
计算机产业界通常用如下表所示的"9"的个数来划分计算机 系统可用性的类型。
可用性分类 容错可用性 极高可用性
可用水平 99.9999 99.999
每年停机时间 < 1 min 5 min
具有故障自动恢复能 99.99 力的可用性
53 min 8.8 h
43.8h
高可用性
商品可用性
相关主题