南方李锦记有限公司DiskXtender™——分级存储解决方案目录一、前言...................................................................................................................... - 3 -1.1、在线存储....................................................................................................... - 3 -1.2、离线存储....................................................................................................... - 3 -1.3、近线存储....................................................................................................... - 4 -二、数据价值与存储投资的矛盾................................................................................... - 4 -三、分级存储重在管理................................................................................................. - 6 -3.1、分级存储管理................................................................................................ - 6 -3.2、信息生命周期管理......................................................................................... - 6 -四、采用分级存储的优点 ............................................................................................. - 8 -五、EMC|Legato DiskXtender分布式分级存储 .............................................................. - 9 -六、方案描述............................................................................................................. - 11 -6.1、拓扑图及方案描述....................................................................................... - 11 -6.2、本方案的优点.............................................................................................. - 12 -七、相关资源............................................................................................................. - 13 -一、前言随着信息量的增长的越来越快,数据存储必然是IT基础架构中的首要考虑问题之一。
在现有的解决方案中,越来越多的硬件厂商所提供的存储技术越来越先进,容量扩展越来越大,同时也满足不同用户、不同级别的存储要求。
但是,不同的存储设备,在存储性能、可用性及成本上,差异很大,用户随着数据的不断增长,存储的压力越来越大,不得不通过购买新的存储来解决这类问题。
但从用户的数据结构来看,真正的生产数据其实很少,约占总体数据的20%都不到,80%的空间都存放着不常用的历史数据,在些数据占据着用户宝贵的存储性能和空间。
这就迫切需要将生产数据与历史数据分开存放,采用不同的存储产品,以节约存储成本,在生产数据上投入更多,保证业务数据的顺畅与高安全性。
在投资要求和资源管理一般花费和企业发展要求面前,选择和布置存储环境是很重要的。
根据现行存储技术,可以简单的将存储分为如下的几类:1.1、在线存储在线存储又称工作级的存储,存储设备和所存储的数据时刻保持“在线”状态,是可随意读取的,可满足计算平台对数据访问的速度要求。
如我们PC机中常用的磁盘基本上都是采用这种存储形式的。
一般在线存储设备为光纤磁盘阵列等高性能磁盘设备,价格相对昂贵,但性能最好。
FC SAN和DAS存储就是属于这个范畴。
DAS技术是最初的存储技术,造价高、管理困难。
SAN技术是近几年新兴的存储技术,它经历了市场考验,能够比较好提高存储的效率。
主要是缺点是成本较高。
1.2、离线存储离线存储主要是用于对在线存储的数据进行备份,以防范可能发生的数据灾难,因此又称备份级的存储。
离线海量存储的典型产品就是磁带库,价格相对低廉。
离线存储介质上的数据在读写时是顺序进行的。
当需要读取数据时,需要把带子定位到零位置,再进行定位。
当需要对已写入的数据进行修改时,所有的数据都需要全部进行改写。
因此,离线海量存储的访问是慢速度、低效率的。
也就是我们通常的备份与恢复的存储技术,这是一个最为低廉的解决方案。
但是同时面临着数据的不可直接读取的问题,所以它这是一个保护数据的措施。
1.3、近线存储所谓近线存储,就是指将那些并不是经常用到,或者说数据的访问量并不大的数据存放在性能较低的存储设备上。
对这些的设备要求是寻址迅速、传输率高。
因此,近线存储对性能要求相对来说并不高,但由于不常用的数据要占总数据量的大多数,这也就意味着近线存储设备首先要保证的是容量。
NAS就是这样的一种存储方式,成本相对较低。
EMC为了让近线存储更容易部署及管理,在现有的CX光纤磁盘阵列上支持大容量的A TA硬盘(目前最大为单盘500GB),来实现数据的分级存储。
不常用的数据,存放在性价比较低的A TA硬盘上,生产数据存放在高性能的FC硬盘上。
二、数据价值与存储投资的矛盾“今天企业的数据中心非常复杂,数据保护是其关键。
但是,并非所有的数据都具有同样的价值;并非所有的企业都具有同样的需求。
”,IDC存储研究部副总裁这样认为。
企业拥有海量的数据,但往往只有有限的预算用于数据保护。
因此,很有必要基于精心定义的风险规避政策来为精选的数据分配适当的保护资源。
IT企业总是要面对增长起来无休无止的数据量。
各种应用都在创建越来越大的文件。
用户也很少删除数据和存档,这就导致要访问旧一些的文件已经变得非常困难。
因此,目前的潮流是购买更多的软件。
然而,这种解决方案产生了非常复杂和笨拙的存储环境,不仅需要更多的维护和管理,而且需要更多的金钱来维持。
系统中60%至80%的数据经常在一个月,甚至一年中都不会被访问。
(如上图所示)而在经常访问的数据中,重要性差别也十分突出,有的数据与用户的业务联系紧密,可靠性、可用性及性能要求都很高,有的尽管经常使用但是与业务联系不是特别紧密。
一般来说,重用数据的概率自数据创建3天之后就会下降50%,当数据创建30天后,重用的概率通常会降至很低,而高达90%的数据超过90天后就不会或很少被读取。
为了提供良好的数据保护,IT部门通常都保留巨大的空余空间,用以防止出现容量不足的现象。
分析专家曾报告说,Unix和Windows的存储利用率只有20%至50%。
这也就是说,许多企业支付巨资购买的大量存储空间都被浪费掉了。
这种浪费是体系结构造成的,使用者要支付系统资源费用,系统需要管理员的维护,备份的成本也增加了,而且恢复数据的时间也更长。
只要解决了这种效率低下的问题,企业就能避免为这些未使用的存储空间进行灾难恢复操作,并且能够通过合并硬件来减少日常运营开支。
但怎样才能实现这一目标呢?解决办法看起来应该是对比较陈旧或未使用的数据进行删除或存档。
这样做可以释放大量的空间,但这种办法远不够理想。
删除是一项手工作业,要冒数据丢失风险,甚至会导致法律纠纷。
存档虽然是一个自动的过程,但却要迫使企业对用户进行存档应用的培训和支持,而且经常需要专用的存储设备。
还有一个很重要的问题是,在一个大型用户那里,拥有从高端存储系统到低端带机、带库全系列的存储设备。
高端存储系统中存放的数据不一定都为价值最大的数据,相反,在低端带机、带库中也会有价值很高的关键数据。
这样的坏处是,增加了数据保护工作的风险也降低了整体存储资源的利用率,一定程度上造成了投资的浪费。
因此,合理利用存储资源并且尽量降低数据保护的风险是一个巨大的挑战。
三、分级存储重在管理存储实现分级以后,在线、近线与离线存储存放的数据价值不同,在同一级别存储内部(比如在线和离线存储),存放的数据也应该不同,实现每一级别内的“分级存储”。
如何将各个级别存储中数据统一管理起来便成了最为关键的问题。
3.1、分级存储管理分级存储管理(Hierarchical Storage Management,HSM) 起源于1978年,首先使用于大型机系统。
近10年来,HSM被广泛应用于开放系统的Unix和Windows平台。
分级存储管理是一种将离线存储与在线存储融合的技术。
它将高速、高容量的非在线存储设备作为磁盘设备的下一级设备,然后将磁盘中常用的数据按指定的策略自动迁移到A TA 磁盘、磁带库等二级大容量存储设备上。
当需要使用这些数据时,分级存储系统会自动将这些数据从下一级存储设备调回到上一级磁盘上。
对于用户来说,上述数据迁移操作完全是透明的,只是在访问磁盘的速度上略有怠慢,而在逻辑磁盘的容量上明显感觉大大提高了。
通俗地讲,数据迁移是一种可以把大量不经常访问的数据存放在A TA磁盘、带库、盘库等离线介质上,只在高速盘阵上保存少量访问频率高的数据的技术。
当那些磁带等介质上数据被访问时,系统自动地把这些数据回迁到高速盘阵中;同样,盘阵中很久未访问的数据被自动迁移到A TA硬盘或磁带介质上,从而大大降低投入和管理成本。
HSM应用也具备监测磁盘容量并在关键容量情况下作出反应的能力。
这种软件经过配置后可以为某个卷设定一个最小的剩余空间,如20%。