分布式存储系统文件级连续数据保护技术研究 董志强(中国海洋石油总公司,北京100010) 【摘 要】信息技术的不断发展使得产生的数据规模也不断的增大,对其安全性得到有效保护就显得比较重要,而这就需要在存储系统方面要 能有良好可扩展性和通过有效措施来对用户的数据可靠性充分保障。基于此,本文则主要就分布式存储系统文件级连续数据保护技术进行研 究,对连续数据保护技术发展面临的挑战以及分布式存储系统应用连续数据保护优势等进行详细化研究。 【关键词】分布式存储;连续数据保护;优势 【中图分类号】TP333 【文献标识码】A 【文章编号】1006—4222(2015)09—0215—01 引言 典型的连续数据保护系统要能够有高效存储系统进行支 撑,连续数据保护是数据保护的高级形式。并在存储行业成为 关注焦点。由于传统数据保护方案注意力都集中在数据周期 性的备份方面,但连续数据保护则能够进行捕获和对数据的 变化进行保护.从而将数据恢复到单个时间点。 1连续数据保护技术及面临的挑战分析 1.1连续数据保护技术分析 连续数据保护是在对主要数据运行不造成影响基础上. 并能够实现持续捕捉及跟踪目标数据发生任何变化恢复任意 时间点的技术方法。其自身也具有着较为鲜明的特征,主要体 现在能够对数据恢复时间点目标大幅提高.连续数据保护能 实现任意时间点的数据访问,并且在恢复数据的灵活性方面 也相对比较灵活.当前部分产品解决方案已经允许最终用户 直接对数据实施恢复的操作.这样就对使用者提供了很大的 方便。在连续数据保护技术的这些方面的优势也使得其在实 际中的应用比较广泛『l】n 1.2连续数据保护技术面临的挑战分析 传统的数据备份技术不能对由于人为错误操作以及计算 机病毒等影响造成的数据丢失起到防范作用。虽然连续数据 保护技术能够对各种粒度的数据重建有着一定作用效果.但 却不能对错误产生到发现中间的数据变化起到保护的作用. 并不能够阻止一个计算机病毒感染一个文件.虽能够恢复病 毒感染前的时间点,但在所有的数据变化都会由此而消失。连 续数据保护技术其实是和快照技术实现的细节有着诸多的相 似之处。 2连续数据保护技术类型及优势 2.1连续数据保护技术类型分析 数据块级连续数据保护技术能够在物理存储设备上进行 运行,同时也能在数据块传输层进行运行.数据块级连续数据 保护技术又能够在传输层以及主机层和存储层进行实现 而 在文件级连续数据保护技术方面主要是在文件系统上.能够 跟踪文件系统中文件数据和元数据改变.以及及时的对动态 信息备份记录发生改变时间从而方便于实现文件历史的任意 时间点恢复[21 还有就是应用级续数据保护技术.在实现应用级连续数 据保护技术的时候.要能在受保护应用程序当中插入及运行 连续数据保护功能程序代码,而连续数据保护程序代码能够 通过程序开发商直接在软件产品当中嵌入。应用程序当中所 实现的连续数据保护的最大优势就是和应用程序进行的无缝 整合,并以此确保应用程序实施连续保护中的一致性.而在实 际的管理上也较为灵活。通过以上的连续数据保护技术.能够 以多样的应用进行支持 2.2分布式存储系统文件级连续数据保护技术优势 对于分布式存储系统文件级连续数据保护技术.分布式 文件系统调度下元数据操作和数据操作是分离进行的.在数 据的传输和数据操作方面能最大化的实现并行执行来对性能 进行提高,从而对时间的开销有了减少。连续数据保护性能开 销方面在数据恢复的时候能利用并行操作将数据恢复操作分 不到各相关存储服务器节点.而对于连续数据保护备份的数 据量层面,由于分布式体系结构自身的良好可扩展性.在分布 式文件系统合理策略下容量扩充能透明化的体现[31 再者就是连续数据保护通用性及易用性.能够将连续数 据保护当中备份数据元数据管理和分布式文件系统元数据管 理两者得到有机结合,从而把备份数据作为是分布式文件系 统分条数据对象。如此便能够轻易的实现文件历史版本的查 看.而对指定历史点的请求在返回指向和时间条件得到有机 结合。 2-3对连续数据保护元数据管理的优化 针对连续数据保护元数据管理策略的优化要从多层面进 行实施。由于传统文件系统元数据是采取的一维分布.所记载 的文件以及目录数据的最新动态在元数据组织方式上会存在 相应的问题,倘若是需要连续数据保护。那么就只有额外新建 文件进行保存数据保护的相关数据信息 根据元数据符合的 不同数据更改类型要能采取特定数据备份的策略.进而在性 能和空间占用的效率上获取平衡。对数据的恢复是重要的内 容.主要就是要在提交数据恢复请求基础上实现文件系统数 据的恢复.而在恢复请求方面要采取指定时间标信息.进行提 示需要文件系统恢复的时间点 3结语 总而言之.针对分布式存储系统文件级连续数据保护技 术的简要分析,能对实际的操作起到一定促进作用。当前所采 取的单一元数据服务器模式在对海量数据实施存储过程中。 就要能扩展到数据服务器的集群上。今后的发展过程中,“机 遇重复数据”的删除思想.以及差异数据备份方法。对数据的 被分量降低方面的研究还会进一步深化 由于本文的篇幅限制 不能进一步作出探究,希望此次努力能起到抛砖引玉的作用。 参考文献 [1]李红艳.块级连续数据保护系统元数据管理方法fJ].计算机应用, 2o14(08). [2]刘正伟,张华忠,文中领,王旭.海量数据持续数据保护技术研究及 实现IJ】.计算机研究与发展,2o14(S1). [3]李琥,谭毓安,李元章.一种连续数据保护系统的快照方法【JJ.软件 学报,2o14(1O). 14]王超,李战怀,胡娜,侯利曼.一种低恢复时间低存储空间的块级 连续数据保护机制【J].西北工业大学学报,2o13(03). 收稿日期:2015—4—15
霾每 簪