服务器RAID知识介绍第一章RAID知识介绍RAID的全称是廉价磁盘冗余阵列(Redundant Array of Inexpensive Disks),于1987年由美国Berkeley 大学的两名工程师提出的RAID出现的,最初目的是将多个容量较小的廉价硬盘合并成为一个大容量的“逻辑盘”或磁盘阵列,实现提高硬盘容量和性能的功能。
随着RAID技术的逐渐普及应用,RAID技术的各方面得到了很大的发展。
现在,RAID从最初的RAID0-RAID5,又增加了RAID0+1和RAID0+5等不同的阵列组合方式,可以根据不同的需要实现不同的功能,扩大硬盘容量,提供数据冗余,或者是大幅度提高硬盘系统的I/0吞吐能力。
RAID技术主要有三个特点:第一、通过对硬盘上的数据进行条带化,实现对数据成块存取,减少硬盘的机械寻道时间,提高数据存取速度。
第二、通过对一阵列中的几块硬盘同时读取,减少硬盘的机械寻道时间,提高数据存取速度。
第三、通过镜像或者存储奇偶校验信息的方式,实现对数据的冗余保护。
经常应用的RAID阵列主要分为RAID 0,RAID 1,RAID 5和RAID 0+1。
1.1 RAID0:条带化RAID 0 也叫条带化,它将数据象条带一样写到多个磁盘上,这些条带也叫做“块”。
条带化实现了可以同时访问多个磁盘上的数据,平衡I/O负载,加大了数据存储空间和加快了数据访问速度。
RAID 0是唯一的一个没有冗余功能的RAID技术,但RAID0 的实现成本低。
如果阵列中有一个盘出现故障,则阵列中的所有数据都会丢失。
如要恢复RAID 0,只有换掉坏的硬盘,从备份设备中恢复数据到所有的硬盘中。
硬件和软件都可以实现RAID0。
实现RAID0最少用2个硬盘。
对系统而言,数据是采用分布方式存储在所有的硬盘上,当某一个硬盘出现故障时数据会全部丢失。
RAID 0 能提供很高的硬盘I/O性能,可以通过硬件或软件两种方式实现。
1.2 RAID1也被称为磁盘镜像。
系统将数据同时重复的写入两个硬盘,但是在操作系统中表现为一个逻辑盘。
所以如果一个硬盘发生了故障,另一个硬盘中仍然保留了一份完整的数据,系统仍然可以照常工作。
系统可以同时从两个硬盘读取数据,所以会提高硬盘读的速度;但由于在系统写数据需要重复一次,所以会影响系统写数据的速度。
硬盘容量的利用率只有50%。
1.3 RAID0+1对RAID0阵列做镜像。
这是一种Dual Level RAID,也有人称之为RAID level 10。
是两组硬盘先做RAID0,组成两颗大容量的逻辑硬盘,再互相为“镜像”。
在每次写入数据,磁盘阵列控制器会将资料同时写入该两组“大容量数组硬盘组”内。
同RAID level 1 一样,虽然其硬盘使用率亦只有50%,但它却是最具高效率的规划方式。
1.4 RAID5是在RAID3和RAID4的基础上发展来的,它继承了它们的数据冗余和条带化的特点,并将数据校验信息均匀保存在阵列中的所有硬盘上。
系统可以对阵列中所有的硬盘同时读写,减少了由硬盘机械系统引起的时间延迟,提高了磁盘系统的I/O能力;当阵列中的一块硬盘仿生故障,系统可以使用保存在其它硬盘上的奇偶校验信息恢复故障硬盘的数据,继续进行正常工作。
第二章RAID的实现RAID可以通过软件或硬件实现。
软件实现RAID需要操作系统的支持。
硬件实现就是使用专用的RAID卡来实现。
2.1软件RAID一些网络操作系统可以使用标准的SCSI适配卡支持和管理驱动器。
一些网络操作系统支持RAID0,RAID1和RAID5。
由于是操作系统下实现RAID,软RAID不能保护系统盘。
亦即系统分区不能参与实现RAID。
有些操作系统,RAID的配置信息存在系统信息中,而不是存在硬盘上;当系统崩溃,需重新安装时,RAID的信息也会丢失。
当运行I/O增强应用程序,如文件服务器或应用程序服务器,可适当的使用软件RAID。
RAID 5是CPU的增强方式,所以不建议使用软件RAID在增强的处理器服务器中。
磁盘的容错技术并不等于完全支持在线更换,热插拔或热交换,有些操作系统不能支持系统不经过重启的在线热交换。
能否支持错误硬盘的热交换与操作系统有关。
NetWare支持RAID 1 (镜像和双工) 。
Windows NT 、Windows2000、LINUX、OPENSERVER支持RAID 0, RAID1和RAID5。
另一种方案是配置系统在线扩充,服务器中配置一块备用硬盘,当系统中没有硬盘错误时,它处于等待状态,当RAID5或RAID1中出现硬盘错误时,它可以自动取代坏盘,当系统确认后,即可成为阵列的一部分。
2.2硬件RAID硬件RAID是采用集成的阵列卡或专用的阵列卡来控制硬盘驱动器,这样可以极大节省服务器系统CPU和操作系统的资源。
从而使网络服务器的性能获得很大的提高。
RAID控制器对主系统,是藉由连接至其存取接口(目前以SCSI 为主)作信道。
换言之,它在主系统的存取接口上,是一个独立的直接存取储存体DASD Direct Access StorageDevice。
而这个大的储存体内,可以有不只一个的逻辑磁盘LUN Logical Unit Number。
RAID控制器,对下管理多颗数组硬盘机们。
而主系统是不会看到或直接管理该硬盘的。
例如:Mylex、AMI、Adaptec等... 都有相关的产品。
现在的RAID卡产品,都支持在线更换,热插拔或热交换。
并在部分操作系统下实现软件监控和管理。
第三章RAID卡原理RAID卡有自己的CPU,Cache Memory,通过集成或借用主板上的SCSI控制器来管理硬盘,可以称之为一个智能化的设备。
RAID卡的分类一般根据集成的SCSI控制器来划分。
如果没有集成SCSI控制器,而是借用主板上的SCSI 控制器来管理硬盘,则为零通道RAID卡。
根据RAID卡集成的SCSI控制器的通道数量,可以分为单通道、双通道、三通道RAID卡。
还可以按照SCSI控制器的标准来划分RAID卡的种类,如Ultra Wide、 Ultra2Wide、Ultra160 Wide。
RAID处理器是一个PCI从设备,接受并执行来自系统的命令。
同时占用PCI中断,代表SCSI磁盘子系统向系统提出中断请求,请求占用PCI总线,返回对系统命令的响应,如输送SCSI硬盘上的数据。
作为RAID卡的CPU,通过执行闪存中的Firmware,控制SCSI控制器、Cache Memory以及指示报警电路,来实现RAID卡的功能,运作流程如下:(1)初始化RAID卡寄存器(2)读取NVRAM的上次RAID参数,与硬盘实际信息进行比较,显示结果(3)发送配置提示、响应 HOST 命令进入配置界面(4)提供配置菜单、将用户提供的RAID卡参数、RAID参数存入NVRAM(5)根据RAID参数,通过SCSI控制器对硬盘进行初始化写操作(6)完成配置(7)等待Host发出读写操作命令RAID卡提高磁盘读写性能的另一手段是:磁盘CACHE。
对于磁盘I/O来说,如果没有CACHE,就直接从硬盘读写;如果有CACHE,则首先从CACHE读写。
CACHE具有两大功能:--预读CACHE预读提高了计算机系统中的硬盘读的功能,尤其是在读取含有大量文件碎片的文件时。
具有良好预读功能的RAID卡能在看起来很随机的读访问中,识别出读取磁盘的规律,通过这个规律提前将系统要读取的数据放在CACHE中。
预读的两种方式:Read Ahead由于硬盘数据经常是以一族连续的硬盘扇区组织起来的,所以有时侯如把系统所请求的扇区随后的一个扇区里的数据同时读进来是有价值的。
对于数据文件的读取有利,特别是系统CPU的性能低时。
Pre-Fetch当RAID卡发现系统要读的是先前已经读过的数据时,在这一次,便将这一个数据块的数据写到CACHE里。
对于程序文件的读取有利。
--回写回写是通过暂时将数据存在CACHE里,从而推迟将数据写到慢设备(如硬盘、磁带机)的一种工作方式。
数据将在随后的时间,硬盘闲置的时候写到硬盘中。
写的时候也是统一将CACHE内的尚未写出的数据按照数据块的在硬盘中的BLOCK序号写入,这样可以提高写的效率。
回写需要加电池给CACHE供电,以免数据在写到硬盘之前系统断电导致硬盘数据丢失。
增加CACHE大小对于预读来说,为系统提供了更多的来自CACHE的可供读取的记录。
对于回写来说,允许控制卡保存更多的记录留待后期写磁盘。
特别是对于电梯式回写,使得连续的回写段之间有更近的间隔,降低硬盘写操作的平均访时间并提高了吞吐率。
写策略--回写(Write Back)--通写(Write Through)通写模式下,所有数据在以命令完成状态返回到计算机之前,直接写到硬盘。
两种写策略比较来说,写策略由通写改为回写时,可大幅度提高RAID性能。
但回写具有一定的数据危险性。
在突然断电的情况下,会丢失存于Cache尚未写入硬盘的数据。
RAID卡工作在写策略为THROUGH时,缓存大小对RAID卡的性能影响很小,只有当写策略改为BACK时,缓存的作用才会发挥出来。
影响RAID卡性能的因素很多,其中可调因素主要有RAID卡缓存(CACHE)大小、写策略(WRITE POLICY)、读策略(READ POLICY)、条带的大小(STRIPE SIZE)。
不同的RAID卡虽然说法略有不同,但意思是一样的。
很多设置可以在RAID卡的配置工具中调整。