常用容错及冗余机制
4 常用容错及冗余机制
4.3.3 SAN的优点 1. 管理上的方便性,集中式管理软件允许远程配置、监管 和无人值守运行; 2. 可扩展性,容量可扩展以符合网络需求,在不影响LAN性 能的情况下充分发挥存储硬件的功能; 3. 高容错能力、高可靠性和高可获性,SAN就绪的磁带库具 备可热插拔的冗余磁带机、介质、电源和冷却系统以确 保可靠性; 4. 配置的灵活性,具备长达20公里距离的远程功能及灵活 的网络部件,基于光纤通道的SAN可以根据要求进行配置; (可实现物理上分离的、不在机房的存储) 5. 支持异构服务器,UNIX、NT和NetWare服务器可同时连; 6. 能够有效地减少总体拥有成本(TCO)。
4 常用容错及冗余机制
4.2.2 双机热备份的硬件系统结构 双机系统是由两台服务器和共享存储子系统组成的。其 中: 每台主机都有自己的系统盘,安装操作系统和应用程序。 每台主机至少安装两块网卡,一块对外工作,另一块相互 侦测对方的工作状况。 每台主机都连接在共享磁盘子系统上,共享磁盘子系统通 常均为有容错的磁盘阵列。各种应用所需的数据均储存在 磁盘阵列子系统上。 下图是双机容错系统的硬件示意图
4 常用容错及冗余机制
2、RAID 1: 两组相同的磁盘系统互作镜像,速度没有提高,但 是允许单个磁盘错,可靠性最高。RAID 1就是镜像。其原 理为在主硬盘上存放数据的同时也在镜像硬盘上写一样 的数据。当主硬盘(物理)损坏时,镜像硬盘则代替主 硬盘的工作。因为有镜像硬盘做数据备份,所以RAID 1的 数据安全性在所有的RAID级别上来说是最好的。但是其 磁盘的利用率却只有50%,是所有RAID上磁盘利用率最低 的一个级别。
4 常用容错及冗余机制
4 常用容错及冗余机制
4.2.3双机容错的工作模式 双机容错有两种工作模式:一种是热守候,另一种是双工 模式。 1、热守候模式 在热守候模式下,双机容错系统对外只有一个服务(如数 据库服务)在运行。其中一台服务器对外服务另一台处在 守候状态,并不启动服务。当工作的服务器出现问题时, 如数据库服务器出现操作系统挂起、死机、网卡坏、硬盘 控制器坏等等,热守候服务器接管工作主机的任务。
4 常用容错及冗余机制
RAID 0 over RAID 1 假设我们有四台磁盘驱动器,每两台磁盘驱动器先做 成RAID 1,再把两个RAID 1做成RAID 0,这就是RAID 0 over RAID 1: (RAID 1) A = Drive A1 + Drive A2 (Mirrored) (RAID 1) B = Drive B1 + Drive B2 (Mirrored) RAID 0 = (RAID 1) A + (RAID 1) B (Striped) RAID 1 over RAID 0 假设我们有四台磁盘驱动器,每两台磁盘驱动器先做 成RAIቤተ መጻሕፍቲ ባይዱ 0,再把两个RAID 0做成RAID 1,这就是 RAID 1 over RAID 0: (RAID 0) A = Drive A1 + Drive A2 (Striped) (RAID 0) B = Drive B1 + Drive B2 (Striped) RAID 1 = (RAID 1) A + (RAID 1) B (Mirrored)
4 常用容错及冗余机制
4.1冗余磁盘阵列(RAID) 4.1.1 RAID的概念 RAID,为Redundant Arrays of Independent Disks的简 称,中文为廉价冗余磁盘阵列。 4.1.2 RAID的级别 1、RAID 0: 将多个较小的磁盘合并成一个大的磁盘,不具有冗 余,并行I/O,速度最快。RAID 0亦称为带区集。它是将 多个磁盘并列起来,成为一个大硬盘。在存放数据时, 其将数据按磁盘的个数来进行分段,然后同时将这些数 据写进这些盘中。所以,在所有的级别中,RAID 0的速 度是最快的。但是RAID 0没有冗余功能的,如果一个磁 盘(物理)损坏,则所有的数据都无法使用。
4.3 SAN存储 4.3.1 SAN的概念 SAN ( Storage Area Network ) :存储区域网络,是随 着光纤通道技术的出现而产生的新一代磁盘共享系统,是 一种类似于普通局域网的高速存储网络。 4.3.2 SAN的构成 SAN 由 硬 件 和 软 件 构 成 , 硬 件 主 要 包 括 FC ( Fibre Channel)卡、FC HUB、FC 交换机、存储设备;软件主要 包括FC卡对各种操作系统的驱动程序及存储/监控管理软件。 SAN通过光纤通道连接到一群计算机上。在该网络中提供了 多主机连接,但并非通过标准的网络拓扑。
4 常用容错及冗余机制
4、RAID 5: 向阵列中的磁盘写数据,奇偶校验数据存放在阵列 中的各个盘上,允许单个磁盘出错。RAID 5也是以数据的 校验位来保证数据的安全,但它不是以单独硬盘来存放 数据的校验位,而是将数据段的校验位交互存放于各个 硬盘上。这样,任何一个硬盘损坏,都可以根据其它硬 盘上的校验位来重建损坏的数据。硬盘的利用率为n-1。 基本上来说,多人多任务的环境,存取频繁,数据量不 是很大的应用,都适合选用RAID 5 架构,例如企业档案 服务器、WEB 服务器、在线交易系统、电子商务等应用, 都是数据量小,存取频繁的应用。
4 常用容错及冗余机制
在RAID 1 over RAID 0架构之下,如果 (RAID 0) A有 一台磁盘驱动器故障,(RAID 0) A就算毁了,当然RAID 1 仍然可以正常工作;如果这时 (RAID 0) B也有一台磁盘驱 动器故障,(RAID 0) B也就算毁了,此时RAID 1的两磁盘 驱动器都算故障,整个RAID 1资料就毁了。 因此,RAID 0 OVER RAID 1应该比RAID 1 OVER RAID 0 具 备 比 较 高 的 可 靠 度 。 所 以 我 们 建 议 , 当 采 用 RAID 0+1/RAID 10架构时,要先作RAID 1,再把数个RAID 1做成 RAID 0
4 常用容错及冗余机制
下图为双机工作示意图:
双机软件应支持WINDOWS NT 和主流的UNIX操作系统。 支持主流 的 数 据 库 , 如 SQLSERVER 、 ORACLE 、 SYBASE 、 INFORMIX 等 。 支 持 TCP/IP通讯协议。 支持现在市场上的主流服务器产品。
4 常用容错及冗余机制
4 常用容错及冗余机制
3、RAID 3: RAID 3 存 放 数 据 的 原 理 和 RAID0 、 RAID1 不 同 。 RAID 3是以一个硬盘来存放数据的奇偶校验位,数据则 分段存储于其余硬盘中。它象RAID 0一样以并行的方式 来存放数,但速度没有RAID 0快。如果数据盘(物理) 损 坏 , 只 要 将 坏 硬 盘 换 掉 , RAID 控制系统则会根据校验盘的数据校验位在新盘中重建坏 盘上的数据。不过,如果校验盘(物理)损坏的话,则 全部数据都无法使用。利用单独的校验盘来保护数据虽 然没有镜像的安全性高,但是硬盘利用率得到了很大的 提高,为n-1。RAID 3 以其优越的写入性能,特别适合用 在大型、连续性档案写入为主的应用,例如绘图、影像、 视讯编辑、多媒体、数据仓储、高速数据撷取等等。
4 常用容错及冗余机制
5、RAID 0-1: 同时具有RAID 0和RAID 1的优点。适合用在速度需求高, 又要完全容错,当然经费也很多的应用。 RAID 0+1到底应该是RAID 0 over RAID 1,还是RAID 1 over RAID 0,也就是说,是把多个RAID 1 做成RAID 0, 还是把多个RAID 0 做成RAID 1?
4 常用容错及冗余机制
4.2.4双机容错软件 在双机容错系统的工作中,双机软件是必不可少的。一切 故障的诊断,服务的切换,硬件的控制都由双机软件来控制 实现。同时为了使双机系统对外象一个单主机系统一样,双 机软件还可以为双机系统生成系统虚拟IP对外工作,客户机 通过虚拟IP访问双机系统。这样就避免了服务切换后主机IP 地址改变导致客户机无法连通的问题。并且双机软件还可以 控制两台服务器对共享磁盘子系统的访问同一时刻只能有一 台主机可以对其访问,避免了同时访问可能造成的数据破坏。 双机软件通过侦测网卡或两台服务器之间互连的串口线进行 两台主机的状态诊断,一旦工作的主机出现问题,如数据库 服务器出现操作系统挂起、死机、网卡坏、硬盘控制器坏等 等,双机软件控制备份机接管系统的虚拟IP和共享磁盘子系 统的控制权并启动备份机上的服务对外工作,保证系统的实 时性和可靠性。
4 常用容错及冗余机制
2、双工模式 在双工模式下双机系统对外提供两个服务(例如:应 用服务和数据库服务)。两台服务器都安装了应用服务和 数据库服务软件,数据库的数据存在共享盘中。在正常情况 下,一台服务器只起应用服务,未起数据库服务,对客户端的 应用请求进行处理;另一台服务器只起数据库服务,不起应 用服务,对共享盘拥有控制权并对共享盘中的数据进行存取, 提供数据库服务.当其中任何一台服务器出现问题,如数据 库服务器出现操作系统挂起、死机、网卡坏、硬盘控制器 坏等等。这时,另一台服务器将出问题的服务器上的任务 接管,此时,这台服务器同时提供应用服务和数据库服务, 客户端就可继续进行对服务器的业务请求,保证业务的继 续进行。在出问题的服务器恢复正常后,又可选择适当时 间切换到正常操作状态,以保证整体性能。
4 常用容错及冗余机制
4 常用容错及冗余机制
FC卡用于主机和FC设备之间的连接,一般为64 PCI总线。 存储/监控管理软件的主要功能是自动发现网络拓扑及映 射,当存储网络发生变化时可自动发现并更新。另一个重要 的功能是作传输的监视,报告及预测网络的交通情况,管理 人员可根据这些情况作最佳化的设计以平衡负载。 由于采用光纤接口,一般使用FC存储设备,如光纤硬盘, 当然也可以采用SCSI硬盘,但要使用Fiber to SCSI转接设 备。
4 常用容错及冗余机制