存储基本原理
条带化
12
RAID基本概念—校验
A0值
A1值
P值
0
0
0
0
1
1
1
0
1
1
1
0
奇偶校验(XOR)算法
数据A0和A1通过异或运算(相同为0,相异为1) 得到校验位P
13
RAID基本概念—磁盘数据 重建
A0 =
XOR
XOR
故障
A1
A2
数据盘1 数据盘2 数据盘3
更换
P 数据校验盘
14
RAID基本概念—物理卷、 逻辑卷
29
动态磁盘池特点
• 系统提供持续不受影响的性能
• 系统性能保持在 “绿色区域”
– 硬盘故障对系统的性能影响最小 – 显著加快系统恢复时间 – 10倍于传统RAID的恢复速度 – 加速数据重建
• 磁盘池规避硬盘热点
Performance Impact of a Drive Failure
Optimal
• 全局式:备用硬盘为系统中所有的冗余RAID组共享
• 专用式:备用硬盘为系统中某一组冗余RAID组专用
磁盘阵列
热备盘
RAID 5
RAID 5
24
传统RAID数据保护方式
▪ 磁盘组织管理通过RAID组 ▪ 卷空间只能分布在RAID组中的磁盘上
– 性能受磁盘数目限制 ▪ 热备盘直到硬盘故障的时候参与工作 ▪ 热备的空间总是处于备用状态
31
JBOD
•最初用来表示一个没有控制软件提供协调控 制的磁盘集合。
阵列-控制器=扩 展柜
SAS、FC线缆
带有控制单元的阵列
磁盘扩展接口
磁盘扩展接口
32
外置独立存储系统的配件组 成
•BBU
•电源
•风扇 •硬盘
•CacTitle
he
•控制 器
33
存储重要组成——硬盘
硬盘的主要 • 指容标量:指硬盘能存储的数据量大小,以字节常为用基指标本单位
辑
RAID5 (3)
RIAD1
财务、金融系统
性能
可靠性
RAID3 视频监控等需要高吞吐量
的场合
RAID1
0
RAI
D1
RAID5 OLTP、OLAP、数据库系 统
RAID6 对数据安全性要求很高的
场合
23
RAID基本概念—RAID硬盘 故障处理
热备:HotSpare
• 定义:当冗余的RAID组中某个硬盘失效时,在不干扰当 前RAID系统的正常使用的情况下,用RAID系统中另外 一个正常的备用硬盘自动顶替失效硬盘,及时保证RAID 系统的冗余性
• 缺点: 1、随着服务器数量的增多,磁盘数量也在增加,且分
散在不同的服务器上,查看每一个磁盘的运行状况都需 要到不同的应用服务器上去查看。
2、更换磁盘也需要拆开服务器,中断应用。
6
真正的企业级存储
将磁盘从服务器中脱离出来,集中到一起管理 商业、大容量、为企业解决信息时代海量数据的存 储才是真正的存储
7 7
存储发展历史
Tape
存储产品的发展历程就是数据保存、应用
1920’s HDD 发展的过程
1956 DAS
1970’s FC
SAN
IBM推出第一 款HDD
1980’s
数据脱离Server,存储单
独发展 数据的集中管理需求,
SAN出现
NAS 1993
IPSAN 2001
非结构化数据的增长需求,NetApp推出 第一款NAS
10
RAID诞生的因素
容量
• CPU运算速 度飞速提高, 数据读写速 度不应该成 为计算机系 统处理的瓶 颈
性能
可靠性
RAID
• 计算机发展 初期,大容 量硬盘价格 非常高,而 需要存储的 数据量越来 越大
• 信息时代,数 据对企业和个 人的重要性越 来越大,数据 存储安全更需 要保障
11
RAID基本概念—条带化
23 24-drive system with single 24-drive pool
28
动态磁盘池特点
• DDP 动态分布数据、热备空间 • 数据保护信息保存在所有磁盘池中所有硬盘上
• 智能算法实现硬盘的分片管理 • 硬盘分片根据性能平衡需要动态实现重建、再分
配 • 快速实现硬盘故障的恢复 • 所有硬盘参与数据重建 • 数据重建对系统性能影响极小
• 单碟容量:硬盘都是由一个或几个盘片组成的,单碟容量就是 指包括正反两面在内的单个盘片的总容量
• 转速:即主轴马达转动速度,单位为RPM(Round Per Minu常te用)指,标即每分钟盘片转动圈数
• 缓存:是硬盘控制器上的一块内存芯片,具有极快的存取速度, 它是硬盘内部盘片和外部接口之间的缓冲器
4
SCT
不支持
支持
5
错误纠正功能
不机体温度及
保证长时间工作
可靠性)
支持
35
各类接口
阵 列
管 理 接 口
磁盘 扩展 接口
主 机 接 口
扩展 柜
服务 器
36
关于存储磁盘阵列性能
性能不仅仅是IOPS,从存储系统的角度,有三个尺度可以来衡量存储 系统的性能: • IOPS(Input/OutputPer Second)——IOPS即每秒的输入输出量(或
79%的复合增长率
结构化数据31%的复合增长率
=
4
IT技术的发展趋势
数据如何存储? 数据如何保护? 数据如何高效使用?
5
独立存储的诞生
• 存储系统是整个IT系统的基石,是IT技术赖以存在和发 挥效能的基础平台。
• 早先的存储形式是存储设备(通常是磁盘)与应用服务 器其他硬件直接安装于同一个机箱之内,并且该存储设 备是给本台应用服务器独占使用的。
读写次数),IOPS是指单位时间内系统能处理的I/O请求数量,一般 以每秒处理的I/O请求数量为单位,I/O请求通常为读或写数据操作 请求。随机读写频繁的应用,如OLTP(OnlineTransaction Processing),IOPS是关键衡量指标。 • Bandwidth-带宽:指单位时间内可以成功传输的数据数量。对于大 量顺序读写的应用,如VOD(Video On Demand),则更关注吞吐 量指标。 • Response Time-响应时间,通常与控制器与硬盘类型相关
24-drive system with (2) 10-drive groups (8+2) and (4) hot spares
25
传统RAID数据保护方式
▪ 数据重建到热备盘上 – 热备盘需要承担数据重建的所有写操作 – 成为性能瓶颈 – 数据重建只能依序进行,一次一个数据条带
▪ 此RAID组上所有的数据访问都会受到影响
%
时间
间
时间
1 个 9 90%
.9
.1
36 天
2 个 9 99%
.99 .01 87 小时
3 个 9 99.9%
.999 .001
8 小时
99.99 4个9
%
.9999 .0001
52 分钟
99.99
.0000
39
灾备衡量指标
RTO:(Recovery Time Object,恢复时间目标 )是指 信息系统从灾难状态恢复到可运行状态所需的时间,用来 衡量容灾系统的业务恢复能力
24-drive system with single 24-drive pool
27
动态磁盘池——当发生磁盘 故障时
▪ Data is reconstructed throughout the disk pool – 所有的硬盘都会参与数据重写操作 – 数据重建多条带并行处理 – 10倍速度完成数据重建
“计9算”方意法味着什么?
A(Availability) = MTBF/(MTBF+MTTR) Downtime = 525600×(1-A) mins/year Availability:可靠性
MTBF:平均无故障时间
MTTR:平均故障恢复时间
Downtime:宕机时间
9 的个 数
正常运行 停机时 每年的停机
DDP
Acceptab le
Performance
Time
RAID Rebu
ild
– 所有的卷空间分布在磁盘池中全部的硬盘中
– 降低硬盘故障率
• 动态的数据分布和再分配由后台持续进行
30
磁盘阵列
•由一个或者多个磁盘子系统中的磁盘组成的磁盘 集合,这些磁盘由控制软件组合到一起并统一控 制。自带RAID控制器的盘柜就叫做磁盘阵列或者 盘阵。 •控制软件将磁盘集合的总磁盘存储容量作为一个 或者多个虚拟磁盘提供给主机。
HDS:我们有权威的SPC数据,证明我们的性能。
EMC:SPC的测试标准没有考虑规定许多对存储性能测试至关重要的因 素,SPC平台并不能代表客户的实际应用。
37
关于存储磁盘阵列性能
应用访问模式
受到 15K 2.5-in 或 3.5-in 驱动器 的最好服务
IOPs
读密集型 写密集型
I/O 密集型
吞吐密集 型
“从石器时代到存储设备(From StoneAge to StorAge),硬盘发展至今,简直就像从石器时 代走到现在。”
3
信息化数据发展
海量数据 多元化数据
截止2013年,中国数据总量达到8-从2011年开始,75%以上的数据
10EB 每年以50%的速度增长
都是基于 文件的数据类型,非结构化数据
21
RAID基本概念—RAID0+1