当前位置:
文档之家› 软件定义存储的现状和发展简介
软件定义存储的现状和发展简介
GB 时代 1996
2006Biblioteka TB 时代 2016PB 时代 2026
未来
把通用Server变成Server SAN
Server + SDS = Server SAN
SDS 软件定义存储
x86 标准化服务器
Server SAN 标准存储架构
SDS 软件定义存储以及分布式架构的出现,让x86标准化服务器化身为存储,企业级用户基于Intel 标 准化的x86服务器体系,就可以灵活构建弹性扩展与软硬件解耦的存储解决方案。
(Hyperconvergence)
*参考资料 • IDC: Worldwide Software-Defined Storage, 2014–2019 Forecast Report
▪ Licensed Software ▪ Commercial systems TB & $ ▪ Architectures
140
Ceph 2011年1月 - 2016年2月 每月“作者”数量
105
70
35
0 2011.012011.082012.032012.102013.052013.122014.07 2015.022015.09
351 3365
9.6X
8
111
13.9X
Ceph的CRUSH算法——均衡一致的智能数据分布
✓ 丰富的API体系 ✓ 监控/审计等管理API ✓ 增删改查等资源使用
API ✓ 扩容/换盘等运维API ✓ OpenStack/Docker
等云计算生态系统 API
统一存储
✓ 块设备存储 ✓ 对象存储 ✓ 文件存储 ✓ NFS/CIFS文件系统 ✓ Hadoop 大数据存
储 ✓ iSCSI/FC
Hyperscale Server SAN Storage
Overall Growth of Hyperscale Server SAN Storage is assumed to be (CAGR) 22.7%
发展 大潮流,Ceph块存储的发展速度远远超出文件存储的发展速度。 • 必然
Ceph还会继续火下去,因为它契合SDS的发展潮流——开源+通用平台。
Ceph,活跃的开源软件定义存储
4000
Ceph 2011年1月 - 2016年2月 每月commits数量
3000
2000
1000
0 2011.012011.082012.032012.102013.052013.122014.072015.022015.09
SNIA 对 SDS 包涵特征的完整描述
SNIA (Storage Networking Industry Association的简称,也即全球网络存储工业协会)
自动化
✓ 应用感知存储 ✓ 策略驱动存储 ✓ 冷热数据自动分层 ✓ 损坏数据自动重构 ✓ 扩容数据自动平衡 ✓ 故障自动检测自动恢
复
标准化
footprint
▪ Commercial systems TB & $
▪ Internal and DAS
▪ Open-source
▪ ODM/VAI
Software-Defined
Convergence
▪ Packaging ▪ Licensed software ▪ Mgmt. & Provisioning ▪ New Architectures
❖ 比如根据输入的物理逻辑拓扑,CRUSH可以选择性地进行 主机内部迁移,或者同一个机架/核心交换机迁移,大大减 小了迁移造成的资源损耗。同时根据集群状态进行数据分 布,能够充分兼容不同的存储设备。
IDC:企业存储的四大颠覆性技术
Flash
▪ HDD TB & $ ▪ Controller designs ▪ Internal and DAS
Cloud
存储体系的发展历程
块/文件 单机/DAS
SCSI SCSI/IDE
RAID HDD
计算虚拟化 块/文件
SAN/NAS iSCSI/FC/SAS
SAS/SATA RAID 2.0 HDD/SSD
分布式
存储与计算的界限开始融合 数据中心虚拟化 对象将在未来占据半壁江山 x86 Server 逐步替代专有存储 速度更快,接口标准更加统一 3D XPoint,基于内存接口 更分散/跨服务器/更安全 更快速度/更大容量/更高IOPS
软件定义存储的现状和发展
Ceph是开源SDS的明星
• Ceph确实很火 超过100位社区主要贡献者,来自Red Hat,Dreamhost,Mirantis,Suse,
Deutsch Telekom,巴特云。每月3000余次代码提交。 • 偶然 Ceph从最开始设计初衷的超算分布式文件系统,到无心插柳柳成荫,碰上云计算
扩展性
✓ 横向扩容 ✓ 数据资源分布式 ✓ 性能/容量线性增长 ✓ 可靠性随扩展提升 ✓ 存储基础设施无缝扩
容
透明性
✓ 通用硬件 ✓ 存储资源透明管理 ✓ 成本审计公开透明 ✓ 对SLA可控可管理
SNIA认为,存储服务的接口需要允许数据拥有者(存储用户)同时表达,对于数据和所需服务水准的需求。数据的需求,就是SDS建立在数据 路径(Data Path)的虚拟化,而控制路径(Control Path)也需要被抽象化成为存储服务。云、数据中心和存储系统,或者数据管理员能够被用于部 署这个服务(指Control Path)。
❖ 传统数据分布策略采用一致性哈希(DHT)算法决定数据分 布的策略,其将整个存储空间划分成虚拟的 N 个部分,然 后将这些虚拟节点平均分给 M 个物理节点。一致性哈希部 分解决了扩容导致的毁灭性数据迁移问题。但是随着集群 几何级增加导致的数据不均衡问题仍然存在。
❖ 而 Ceph使用的 CRUSH 算法通过增加多维参数来解决原来 的一致性哈希问题。简单而言,CRUSH 算法在原来的哈希 算法之上增加了物理部署逻辑和集群状态参数,使得在发 生集群数据迁移变化时,根据物理部署情况最小化数据迁 移量。
Wikibon Server SAN 下一个10年的市场预测 (2012-2027)
$70,000 $60,000 $50,000 $40,000
Overall Growth of Enterprise (Server SAN & Traditional) & Hyperscale Storage is assumed to be (CAGR) 4.2%