当前位置：文档之家› 存储基本原理

存储基本原理

条带化
12
RAID基本概念—校验
A0值
A1值
P值
0
0
0
0
1
1
1
0
1
1
1
0
奇偶校验（XOR）算法
数据A0和A1通过异或运算（相同为0，相异为1）得到校验位P
13
RAID基本概念—磁盘数据重建
A0 ＝
XOR
XOR
故障
A1
A2
数据盘1 数据盘2 数据盘3
更换
P 数据校验盘
14
RAID基本概念—物理卷、逻辑卷
29
动态磁盘池特点
• 系统提供持续不受影响的性能
• 系统性能保持在 “绿色区域”
– 硬盘故障对系统的性能影响最小 – 显著加快系统恢复时间 – 10倍于传统RAID的恢复速度 – 加速数据重建
• 磁盘池规避硬盘热点
Performance Impact of a Drive Failure
Optimal
• 全局式：备用硬盘为系统中所有的冗余RAID组共享
• 专用式：备用硬盘为系统中某一组冗余RAID组专用
磁盘阵列
热备盘
RAID 5
RAID 5
24
传统RAID数据保护方式
▪ 磁盘组织管理通过RAID组 ▪ 卷空间只能分布在RAID组中的磁盘上
– 性能受磁盘数目限制 ▪ 热备盘直到硬盘故障的时候参与工作 ▪ 热备的空间总是处于备用状态
31
JBOD
•最初用来表示一个没有控制软件提供协调控制的磁盘集合。
阵列－控制器＝扩展柜
SAS、FC线缆
带有控制单元的阵列
磁盘扩展接口
磁盘扩展接口
32
外置独立存储系统的配件组成
•BBU
•电源
•风扇 •硬盘
•CacTitle
he
•控制器
33
存储重要组成——硬盘
硬盘的主要 • 指容标量：指硬盘能存储的数据量大小，以字节常为用基指标本单位
辑
RAID5 （3）
RIAD1
财务、金融系统
性能
可靠性
RAID3 视频监控等需要高吞吐量
的场合
RAID1
0
RAI
D1
RAID5 OLTP、OLAP、数据库系统
RAID6 对数据安全性要求很高的
场合
23
RAID基本概念—RAID硬盘故障处理
热备：HotSpare
• 定义：当冗余的RAID组中某个硬盘失效时，在不干扰当前RAID系统的正常使用的情况下，用RAID系统中另外一个正常的备用硬盘自动顶替失效硬盘，及时保证RAID 系统的冗余性
• 缺点： 1、随着服务器数量的增多，磁盘数量也在增加，且分
散在不同的服务器上，查看每一个磁盘的运行状况都需要到不同的应用服务器上去查看。
2、更换磁盘也需要拆开服务器，中断应用。
6
真正的企业级存储
将磁盘从服务器中脱离出来，集中到一起管理商业、大容量、为企业解决信息时代海量数据的存储才是真正的存储
7 7
存储发展历史
Tape
存储产品的发展历程就是数据保存、应用
1920’s HDD 发展的过程
1956 DAS
1970’s FC
SAN
IBM推出第一款HDD
1980’s
数据脱离Server，存储单
独发展数据的集中管理需求，
SAN出现
NAS 1993
IPSAN 2001
非结构化数据的增长需求，NetApp推出第一款NAS
10
RAID诞生的因素
容量
• CPU运算速度飞速提高，数据读写速度不应该成为计算机系统处理的瓶颈
性能
可靠性
RAID
• 计算机发展初期，大容量硬盘价格非常高，而需要存储的数据量越来越大
• 信息时代，数据对企业和个人的重要性越来越大，数据存储安全更需要保障
11
RAID基本概念—条带化
23 24-drive system with single 24-drive pool
28
动态磁盘池特点
• DDP 动态分布数据、热备空间 • 数据保护信息保存在所有磁盘池中所有硬盘上
• 智能算法实现硬盘的分片管理 • 硬盘分片根据性能平衡需要动态实现重建、再分
配 • 快速实现硬盘故障的恢复 • 所有硬盘参与数据重建 • 数据重建对系统性能影响极小
• 单碟容量：硬盘都是由一个或几个盘片组成的，单碟容量就是指包括正反两面在内的单个盘片的总容量
• 转速：即主轴马达转动速度，单位为RPM（Round Per Minu常te用)指，标即每分钟盘片转动圈数
• 缓存：是硬盘控制器上的一块内存芯片，具有极快的存取速度，它是硬盘内部盘片和外部接口之间的缓冲器
4
SCT
不支持
支持
5
错误纠正功能
不机体温度及
保证长时间工作
可靠性）
支持
35
各类接口
阵列
管理接口
磁盘扩展接口
主机接口
扩展柜
服务器
36
关于存储磁盘阵列性能
性能不仅仅是IOPS，从存储系统的角度，有三个尺度可以来衡量存储系统的性能： • IOPS(Input/OutputPer Second)——IOPS即每秒的输入输出量(或
79%的复合增长率
结构化数据31%的复合增长率
=
4
IT技术的发展趋势
数据如何存储？数据如何保护？数据如何高效使用？
5
独立存储的诞生
• 存储系统是整个IT系统的基石，是IT技术赖以存在和发挥效能的基础平台。
• 早先的存储形式是存储设备（通常是磁盘）与应用服务器其他硬件直接安装于同一个机箱之内，并且该存储设备是给本台应用服务器独占使用的。
读写次数)，IOPS是指单位时间内系统能处理的I/O请求数量，一般以每秒处理的I/O请求数量为单位，I/O请求通常为读或写数据操作请求。随机读写频繁的应用，如OLTP(OnlineTransaction Processing)，IOPS是关键衡量指标。 • Bandwidth-带宽：指单位时间内可以成功传输的数据数量。对于大量顺序读写的应用，如VOD(Video On Demand)，则更关注吞吐量指标。 • Response Time-响应时间，通常与控制器与硬盘类型相关
24-drive system with (2) 10-drive groups (8+2) and (4) hot spares
25
传统RAID数据保护方式
▪ 数据重建到热备盘上 – 热备盘需要承担数据重建的所有写操作 – 成为性能瓶颈 – 数据重建只能依序进行，一次一个数据条带
▪ 此RAID组上所有的数据访问都会受到影响
%
时间
间
时间
1 个 9 90%
.9
.1
36 天
2 个 9 99%
.99 .01 87 小时
3 个 9 99.9%
.999 .001
8 小时
99.99 4个9
%
.9999 .0001
52 分钟
99.99
.0000
39
灾备衡量指标
RTO：（Recovery Time Object，恢复时间目标）是指信息系统从灾难状态恢复到可运行状态所需的时间，用来衡量容灾系统的业务恢复能力
24-drive system with single 24-drive pool
27
动态磁盘池——当发生磁盘故障时
▪ Data is reconstructed throughout the disk pool – 所有的硬盘都会参与数据重写操作 – 数据重建多条带并行处理 – 10倍速度完成数据重建
“计9算”方意法味着什么？
A(Availability) = MTBF/(MTBF+MTTR) Downtime = 525600×(1-A) mins/year Availability：可靠性
MTBF：平均无故障时间
MTTR：平均故障恢复时间
Downtime：宕机时间
9 的个数
正常运行停机时每年的停机
DDP
Acceptab le
Performance
Time
RAID Rebu
ild
– 所有的卷空间分布在磁盘池中全部的硬盘中
– 降低硬盘故障率
• 动态的数据分布和再分配由后台持续进行
30
磁盘阵列
•由一个或者多个磁盘子系统中的磁盘组成的磁盘集合，这些磁盘由控制软件组合到一起并统一控制。自带RAID控制器的盘柜就叫做磁盘阵列或者盘阵。 •控制软件将磁盘集合的总磁盘存储容量作为一个或者多个虚拟磁盘提供给主机。
HDS：我们有权威的SPC数据，证明我们的性能。
EMC：SPC的测试标准没有考虑规定许多对存储性能测试至关重要的因素，SPC平台并不能代表客户的实际应用。
37
关于存储磁盘阵列性能
应用访问模式
受到 15K 2.5-in 或 3.5-in 驱动器的最好服务
IOPs
读密集型写密集型
I/O 密集型
吞吐密集型
“从石器时代到存储设备（From StoneAge to StorAge），硬盘发展至今，简直就像从石器时代走到现在。”
3
信息化数据发展
海量数据多元化数据
截止2013年，中国数据总量达到8-从2011年开始，75%以上的数据
10EB 每年以50%的速度增长
都是基于文件的数据类型，非结构化数据
21
RAID基本概念—RAID0+1

e商务文档

存储基本原理

相关文档推荐：