分层存储技术
了解分层存储技术
数据增长速度的加快、新应用需求的增加、对数据存档的监管力度的增大和业务连续性需
求,正在让企业的IT预算越来越吃紧,同时也使得其传统存储架构的不足日益显露,而
分层存储从某种程度上可以减缓这些压力。 TechTarget专家将深入给我们讲解如何选购分层存储工具,以及在应用过程中的遇到的一
些问题和解决方法。 如何选购分层存储工具 随着存储需求呈螺旋状上升,将公司所有的数据保存在价格不菲的高性能光纤通道磁
盘中显得有点不切实际。分层存储是将关键数据保存在光纤通道磁盘中,而将价值略低的
数据保存在速度较慢、价格较低的存储中,如SATA磁盘甚至是磁带。大多数企业会建立
几层存储。但是,将公司数据存入存储层中,并非那么容易。首先,存储管理员必须将数
据分类,以了解文件或文件种类的价值…… z 如何选购分层存储工具
z 专家导购 分层存储工具购买指南
z 通过重复数据删除服务提供价格合理的分层存储
数据分类工具的购买标准 迁移数据其实就是移动数据:从文件夹、分割区、磁盘或磁盘子系统提取数据,放入其它的物理站点。大多数情况下,迁移数据是为了执行数据分类措施,实现分层存储。例如,高性能Tier 1光纤通道磁盘中不常使用的数据可以迁移到近线SATA磁盘阵列中。随后,这些数
TT存储技术专题之分层存储技术 第 2 页 共 17 页
据可以放入固定内容归档系统、VTL或者磁带库。有时候,迁移数据是为了将旧式存储系统中的信息移动到新平台中…… z 购买数据分类工具的注意事项
z 数据迁移工具的购买标准
分层存储遇到的问题 将大型存储池分割成小型存储池,然后使用各自所需的技术,这样就能节约资金。存储供应商和IT人员夸大了ILM在控制存储成本上的作用,而没有讨论操作不当可能引起的后果…… z 分层存储遇到的问题
TT存储技术专题之分层存储技术 第 3 页 共 17 页
如何选购分层存储工具
随着存储需求呈螺旋状上升,将公司所有的数据保存在价格不菲的高性能光纤通道磁盘中
显得有点不切实际。分层存储是将关键数据保存在光纤通道磁盘中,而将价值略低的数据
保存在速度较慢、价格较低的存储中,如SATA磁盘甚至是磁带。
大多数企业会建立几层存储。但是,将公司数据存入存储层中,并非那么容易。首
先,存储管理员必须将数据分类,以了解文件或文件种类的价值。电子邮件等经常需要访
问的数据应该由自动化的归档工具进行索引和存储。然后,数据就可以在存储平台中迁
移,从而根据分类情况实现存储。
在翻看产品目录之前,我们先来明确一下需要注意哪些核心问题。
预先制定数据保留策略。数据保留是分层存储的一部分。大多数企业需要保留特定种
类的数据,以满足法规遵从和诉讼需求,一旦过了保留期限就可以删除这些数据。
但是保留策略并非自动设定的——没有软件会告诉你数据需要保留多长时间。为了
明确保留时间,你必须了解每种数据的价值,以及该种数据与法规遵从的关系。然后,你
就可以利用数据迁移和归档工具,针对存储层执行保留策略。
预先制定数据分类计划。数据分类不能自动完成。没有软件能够确定数据对公司的实
际价值,因此不能依靠数据分类工具来作出分类决策。数据分类过程需要公司其它部门的
参与,如人力资源部、金融部和法律部。一旦明确了各种数据的相对价值,数据分类工具
就能找到所需数据,利用元数据执行保留策略。请注意:只有制定了合适的分类和保留策
略,才能成功地部署分类存储。
另外,存储系统会对管理有所影响。分层存储需要利用多种存储系统,可能会对存储
管理员形成负担。例如,Tier 1 存储可能寄存在光纤通道SAN中,Tier 2 可能寄存在
TT存储技术专题之分层存储技术 第 4 页 共 17 页
SATA NAS中,而Tier 3存储则可能寄存在内容寻址存储(CAS) 归档系统、VTL或磁带库
中。多层存储会增加成本和管理费用,甚至入不敷出。实际上,一些大型数据中心已经开
始放弃分层存储,而采用单层存储。
设定符合实际的成本节省目标。分层存储的最终目标是节约资金,真正节省下来的资
金可能会少于预期值。Tier 2 存储成本应该比Tier 1低20%-30%;Tier 3 存储则应该比
Tier 1低50%-60%。可实际上,大多数公司采用Tier 2只能节约10% -15%的成本,而采
用Tier 3只能节约30%-40%。节省下来的成本无法达到预期值,这也是许多公司转而采用
单层存储的一个原因。一些公司已将分层存储措施并入其它的存储整合计划中。
购买符合要求的工具。你可以看到不计其数的迁移、归档和数据分类工具,能自动将
你的存储环境分层,但是这些工具的复杂程度、成本和容量都不一样。一些工具相对简
单,如博科公司的数据迁移管理器;另一些则提供具有先进功能的套件,如赛门铁克公司
的Enterprise Vaul。你可以选择针对具体存储平台的工具,如EMC公司的SRDF工具就是
针对该公司的Symmetrix;或者可以选择异构工具,如Incipient公司的网络存储平台。
一些工具只针对某个应用程序,如Mimosa公司的NearPoint只针对Microsoft Exchange
Server;而有些工具则支持多种应用程序。你应该关注产品能否满足你的最低需求,而不
是着眼于某些非必要的附加功能。
是否能够提高存储性能?分层存储能够提高存储性能。例如,当所有的存储位于同一
层时,用户和应用程序在访问存储时可能会出现冲突,这样就有损存储系统的性能。将访
问分散在多层存储中,就能缓解冲突。虽然SAS和SATA磁盘的性能不如FC磁盘,但是由
于访问时冲突减少,SAS和SATA 层的性能就会提高。同时,这么做减少了抵达FC磁盘的
请求次数,因此提高了高层性能。
考虑选择支持多层存储的存储系统。实施分层存储有一种十分流行的方法,即选择能
够在同一阵列中支持不同存储层的存储系统。日立数据系统公司的全球存储平台V就是个
很好的例子,该平台能在同一阵列中同时支持光纤通道磁盘和SAS磁盘。这种方法不仅能
TT存储技术专题之分层存储技术 第 5 页 共 17 页
够简化管理,还能减少存储系统的数量。在进行常规的技术更新时,也可以考虑选择分层
存储。
评估Tier 0存储的需求。固态磁盘驱动器(SSD)为企业级应用程序提供了前所未有
的存储性能。Solid Access Technologies LLC提供64 GB的全球固态磁盘,STEC提供
256 GB的ZeusIOPS固态驱动器,这些产品正在日渐吸引存储管理员的注意。一些存储人
员甚至会选择固态层——通常称为Tier 0存储,从而减少计算机的等待时间,克服传统
硬盘的局限性。用户如果需求极高的性能,可以考虑使用Tier 0存储。
掂量存储虚拟化在分层过程中的作用。虚拟化在应用程序和存储系统之间添加了软件
抽象层。这样,就可以组合利用、分配多个存储系统的存储资源,而无须涉及物理位置—
—这就是分层的一大优势。存储管理员可以在虚拟化的帮助下,利用物理系统的存储创建
和分配存储层,而每个应用程序具有各自的存储池。大多数情况下,虚拟化能够提高存储
利用率。
(作者:Stephen J. Bigelow翻译:周姝嫣 来源:TT中国)
TT存储技术专题之分层存储技术 第 6 页 共 17 页
专家导购 分层存储工具购买指南
当对存储的需求量越来越大的时候,单纯地把公司所有数据存放在昂贵的高性能的FC磁
盘上是不切实际的。分层存储理念的出现是为了节省成本,将业务关键数据存放在最快速
的磁盘平台上,而将价值相对较低的数据放在速度较慢价格较低的存储上面,比如SATA
磁盘甚至磁带。
在很多情况下,公司会建立基层不同的存储层,但是,要把所有的数据放到不同的存
储层上绝非易事。首先,数据必须分类,就需要了解每一个文件或文件类型的相对价值。
只需要偶尔访问的数据类型,比如电子邮件,经常存储在自动归档工具上。然后,数据还
需要在不同的存储平台之间进行迁移,以便根据分类来进行存储。这份购买指南介绍了购
买分层存储产品所需要考虑的主要因素。
提前制定数据留存策略。很多公司必须将某些类型的数据保留一定时间以满足法规遵
从的要求,然后在留存时期期限过后将数据删除。然而,留存策略并不是自动设置的,没
有软件可以告诉你某个数据需要保存多长时间。相反的是,只有了解每个类型数据的价值
才能制定策略,这是与法规遵从相关的。数据迁移和归档工具可以用于执行已经制定好的
留存策略。
提前制定数据分类计划。数据分类也不是自动的,没有软件可以确定您自己的公司的
数据的实际价值,因此不要依赖数据分类工具来帮助您分类。数据分类是一个人工的过
程,需要了解到多个部门的具体情况,比如人力资源部门、财务部门等。一旦你已经确定
好每个数据类型的相应的价值,数据分类工具就可以找到数据,应用元数据并执行已经制
定好的留存策略。专家发现绝大多数成功的分层存储部署都出现在数据分类和留存策略已
经成熟并得到认可时。
TT存储技术专题之分层存储技术 第 7 页 共 17 页
考虑到分层存储系统所增加的管理成本。分层存储经常涉及到对多个存储系统的利
用,有些时候这对于存储管理员来说意味着负担的增加。比如,第一层存储可能是在FC
SAN上,第二层存储在SATA NAS上,第三层存储在内容可寻址存储归档系统,虚拟磁带库
或磁带库上。对于一些公司来说,多个存储层所增加的成本和管理费用会超过从中获得的
利益,专家注意到一些大型数据中心实际上放弃采用分层存储而更愿意采用单一层存储。
不要过高预期可节省的成本。虽然分层存储的目的是为了节省开支,但是实际情况通
常达不到预期。举个例子,业内人士经常说第二层存储的花费比第一层存储的花费少20%
至30%,而第三层存储的花费比第一层少50%至60%。然而事实上,专家发现第二层存储的
花费只能比第一层减少10%至15%,而第三层只能减少30%至40%。一些企业从分层存储转
而采用单一层存储的原因之一也是由于成本节省不如预期。
购买最适合你需求的工具。你将发现有很多数据迁移、归档、数据分类工具能帮助你
自动化分层存储环境。但是这些工具在复杂性,成本和性能方面差异很大。有很多例子可
以说明这个问题。一些产品可能会经常提供一个相对简易的集中的工具,比如博科公司的
Data Migration Manager,Enterprise Vault。同样的,你还可以选择一个用于特定存储
平台的工具,比如EMC的SRDF,或者选择一个更加异构的工具,比如Incipient 公司的
Network Storage Platform (NSP)。最后,一些工具可能会针对特定应用,比如Mimosa
Systems公司的NearPoint for Microsoft Exchange Server,而其他工具可能会支持多
项应用。专家建议你购买产品时注重满足最低的性能标准,而不是一些潜在的不需要的增
值功能弄得焦头烂额。
考虑到性能改善的可能性。当所有数据放在一个单一的存储层上时,用户访问和应用
访问的冲突反而会影响存储系统的性能。当在多个存储层之间分散访问时就可以缓解这种
冲突。即使SAS或SATA存储的性能会低于FC存储的性能,将访问冲突缓解时实际上也会
保障SAS或SATA层的高性能。同时,由于减少了对FC存储的访问需求数量,第一层FC
存储的性能也能改善。
(作者:Stephen J. Bigelow 来源:TT中国)
TT存储技术专题之分层存储技术 第 8 页 共 17 页