CommVault技术白皮书规划合理的存储策略版本控制:目录一.文档说明: (4)二.存储策略基本介绍 (4)2.1什么是存储策略. (4)2.2存储策略分类. (5)2.3存储策略属性: (5)三存储策略拷贝介绍: (7)3.1什么是存储策略拷贝. (7)3.2拷贝的保留属性 (8)3.3拷贝的数据路径 (11)3.4拷贝中的多路复用 (13)3.5拷贝中的数据校验 (14)3.6辅助拷贝定义: (15)四.存储策略最佳实践: (16)4.1什么做好的存储策略 (16)4.2如何规划存储策略 (17)4.3存储策略最佳实践: (18)一.文档说明:存储策略是实现现数据保护和恢复操作的管理通道。
其首要功能是映射原始数据到物理介质。
存储策略是CommVault数据管理的一个核心。
因为其是前端应用数据和后端存储数据的关联纽带。
存储策略的功能非常多. 本文作业上篇介绍将主要针对以下方面介绍:1:存储策略的基本介绍。
2:存储策略的拷贝介绍。
3:存储策略的最佳实践。
二.存储策略基本介绍2.1什么是存储策略.假设客户有Oracle 的客户端,有100G的在线数据,为了保护这100G数据需要每周日做一次全备份,周一到周六做增量备份。
这样就面临以下的问题:1): 数据存放位置: 是备份到二级存储上还是磁带库上.2):数据写入路径:客户端通过那条链路将数据写入后端存储3): 数据保留周期:是保留1个月,半年,还是更久。
为了解决上面的问题。
我们就引入了”存储策略”。
简单的说存储策略首先是一个管道。
通过这个管道将生产数据复制到后端存储。
当然存储策略的作用绝对不仅仅是在存储介质中控制数据的拷贝或移动。
存储策略通过使用一系列的规则来保证数据的生命周期.无论什么时候需要恢复数据时,数据都是可用的;当数据不再被需要时,可以有相关的动作来删除数据;维护正常的数据的生命周期来满足不同的公司、法律、策略调整的需要。
2.2存储策略分类.存储策略按照保护数据类型分为如下2种1):DR恢复: 只保护CommServe数据库的备份.DR恢复存储策略在带库配置完成后系统会自动创建,默认命名CommServDR DR 恢复存储策略默认数据保留周期是60 天60周期.DR 恢复存储策略是无法被普通客户端作为存储设备.2):标准IDA: 保护备份、归档类型数据需要根据不同的应用数据类型,保留周期, 数据链路来创建合适的存储策略.2.3存储策略属性:本章节将省略“如何创建存储策略”,有兴趣可参考OnlieBook1): 常规属性:设备流: 定义存储策略可以并行写的最大设备流数.带库:建议值>= 可用驱动器数量.磁库: 建议值>= 磁库Writer * 磁库MountPath 数量.启用流随机: 仅适用于辅助拷贝时提高并行拷贝效率.误区纠正: 该选项并不能提高任何在线数据的备份效率。
在多存储策略条件下可能造成介质的不充分使用。
建议客户在所有存储策略中不要选择该项。
有磁盘的话没有影响隐藏存储策略: 仅适用于没有任何子客户端关联的存储策略。
增量存储策略:适用于全备份和增量分散到不同的介质.增量存储策略的优点在于。
可以在物理上将全备份和增量备份区分开来,存放到不同的物理介质中。
有利于恢复效率和数据安全.情景模拟:当全备份的数据写到磁带上时,增量存储策略通常被用来把增量备份的数据写到硬盘上。
这对于备份频率很高而且并发的非全备份的作业来说,充分利用了硬盘的高性能和高灵活性的特点;同时对于全备份来说,磁带的高容量,低投入也得到了充分的体现。
这种数据分开备份的方式使备份要使用的硬盘空间得到了非常大的节省同时也减少了需要多个物理磁带机的需求。
在这样的情况下,合成全备份就可以既使用磁带上的全备份也使用硬盘上的增量备份来形成一个新的全备份,并发该全备份写到磁带中。
法规遵从:适用于备份/归档,CI 查找的情况下,可以手动对单个文件制定Legal Hold.三存储策略拷贝介绍:3.1什么是存储策略拷贝.存储策略拷贝定义了存储策略数据副本的数据路径,数据存放的位置,数据存放的生命周期. 一个存储策略至少要有且只有一个主拷贝(Primary Copy). 当然我们可以根据数据副本的存放要求定义多个次级拷贝。
存储策略拷贝分类:1)主拷贝(Primary Copy): 所有的客户端数据一定是先写入主拷贝。
2)次级拷贝(Secondary Copy): 主拷贝以外的所有拷贝都是次级拷贝次级拷贝按照功能又分为如下两种:同步性拷贝:选择主拷贝中的所有作业产生副本。
类似主拷贝的一份镜像。
任何同步拷贝都可以升级为主拷贝。
选择性拷贝:只选择主拷贝中特定的全备份产生副本. 主拷贝中的增量被过滤。
选择性拷贝无法升级为主拷贝。
3)快照拷贝(Snap Copy): 结合硬件快照技术存放SnapProtect 产生快照备份快照拷贝的详细细节我们会在其他篇幅详细介绍,在本章只要了解即可。
3.2拷贝的保留属性启用数据时效:是否按照保留周期执行数据老化,选择:该拷贝中的数据将按照下面的保留规则过期取消:该拷贝中的数据将永久保留。
为磁性数据启用可控磁盘空间: 是否参考磁库的可控磁盘阀值释放磁库空间。
默认改选项是未选择.不选择:假设保留15天2周期的作业在第15天达到过期条件,作业被老化掉,那么该作业所占用的介质磁盘空间会立即被释放。
作业CHUNK 会被立即删除。
选择:假设保留15天2周期的作业在第15天达到过期条件,作业被老化掉, 但此时磁库所在的磁盘空间没有达到磁库阀值,这样虽然作业过期,作业存放的CHUNK 并没有从磁盘删除。
只有当磁盘空间达到设定法制(默认85%),此时才会删除那些过期作业的Chunk。
情景模拟:很多客户可能就是由于选择了此项,会发现数据已经老化了,为什么磁盘空间占用率老保持在80% 以上,没有足够可用空间。
此时可以取消该项,或者调解磁库属性里德可控磁盘空间阀值。
差异备份之间不保留增量和差异:假脱机拷贝:主拷贝仅仅是作为一个缓存区, 默认数据保留周期是0天0周期设置条件:•只有主拷贝才可以设置为加脱机拷贝。
此时将无法选择时间周期,默认0天0周期。
•必须要有个同步拷贝存在•同步拷贝完成后,主拷贝中的数据立即老化,释放空间备份基本保留规则:定义备份类型数据的保留周期。
基本概念:天:就是我们所谓的自然天, 24小时为一天。
周期:一个全备份和依附于这个全备份的所有增量备份为一个周期。
简单的说就是两个全备份之间,但不包括后一个全备份的所有备份作业集为一个周期。
情景模拟:假设每周日做全备份,周一到周六做增量。
那么本周日和之后周一到周六的所有备份集合就是一个周期。
(如果你说周三。
周四的增量备份失败了怎么办。
无所谓, 我们只关心这个时间段内的集合,不关心这个集合里做了几次增量。
即使周日做了一次全备,周一到周六增量都失败了。
但只有下周日的全备执行了,那前面的也是一个完整周期)设计优点:有人可能会问,为什么设置的这么麻烦?按日期定义不是更简单。
正如上面情景模拟你定义的保留策略设置为7天,而没有周期。
再假设你的DB 在9月30日做了备份,在10月1日到10月7日你的管理员去休假了,而此时带库随坏导致7天的备份都没有成功。
那么在10月8日你发现有个数据需要回复的时候,发现7天前的数据已经被老化掉了。
如果定义了周期的约束,1周期,那么即使15天没有备份成功,最后一个周期就是9月30好的数据始终是保留下来可用的。
明白了上面的概念我们就要知道。
CommVault 中数据的老化需要同时满足天和周期的条件,才能被过期掉。
情景模拟:如果你发现自己定义的摸个客户端数据已经远远超过了过期天数,去没有被过期掉。
空间也没有释放出来。
请检查你的作业是不是在改日志后从来没有做过新的全备份,导致没有满足周期条件。
数据/符合性数据归档基本保留规则:定义归档类型数据的保留归档数据的基本保留规则只有自然天的约束.没有周期条件因为归档数据不同于备份数据。
备份数据在每个备份周期内可能有多个版本。
而且每个周期都会重复备份。
归档数据的特殊之处在于:一份数据被归档后,只要没有被回迁,那以后不可能第二次被归档。
而且归档也没有所谓类似的全归档。
增量归档之类。
所以这份归档数据就永远存放在哪里。
知道满足保留天数的约束。
可以被过期掉。
注意事项:归档数据因为在一个拷贝里只有有一个版本,所以归档一般都是永久保留。
不要随便拷贝里的归档基本保留天数。
万一修改错误,数据被过期,会造成数据丢失后果。
完全备份的延长保留规则:延长保留规则可以方便的用户对某些需要长期保留的作业延长器保留规则。
可以选择所有全备份、周全备份,月全备份,季全备份,年全备份等条件选定作业进行延长保留。
但是我们推荐首选使用辅助拷贝作为数据延长保留的首要方式:基于以下原因:1: 并行多流备份的作业,会将数据分散在多卷介质中,延长保留会导致所有存放部分数据的多卷磁带不能释放。
无法有效理由资源。
2: 通过辅助拷贝,可以将分散在多个介质上的数据集中到比较少的介质中存放。
有效利用资源。
而且减少数据过于分散的风险(某个介质随坏会造成所有其他介质都不可用)3: 既然是需要延长保留的数据,那么如何保证数据在介质上的可靠性能。
单纯的设定延长无法保证那些延长保留作业使用的介质是不是完整的,是不是可恢复的。
辅助拷贝则会读取原始介质上的数据,拷贝到新的介质中,这样既验证了介质的好坏,又校验了所有数据。
3.3拷贝的数据路径添加多数据路径:此功能需要Grid Store License. 否则无法添加多数据路径Grid Store 的使用和高级功能我们会在单独章节介绍。
在此不再冗述附加:在没有Grid Store 的情况下如何更改存储策略的数据路径. 选择拷贝->右键“所有任务” -> 更改数据路径选择更改数据路径后。
指定新的Library 和MeidaAgent.复用因子:一个Driver 可以并行写的数据流数启用:在驱动器较少。
而并发作业比较多的情况下,启用多路复用,可以提高并行写效率。
建议事项:在资源充足的情况下,不建议使用多路复用,尤其是对比较大的数据库做备份。
启用多路复用将严重影响数据的恢复速度。
这就鱼于熊掌只能选其一。
看你是要备份效率还是要恢复效率。
作业:选择全部作业/ 仅全备份作业到期:日期定义作业自上次校验后多久自动取消”校验成功“标识。
以便下次校验作业可以选择该作业再次执行”数据校验”过期后校验:过期1个月以后校验3.6辅助拷贝定义:主拷贝:可以升级同步拷贝为主拷贝。
活动:如果取消该辅助拷贝将禁用。
不选择任何数据进行拷贝.注意:如果你创建了一个辅助拷贝,而没有定义计划定期执行或不想执行,那么请务必将“活动”选项取消掉。
禁用该辅助拷贝,否则主拷贝中的数据将永远无法过期。