当前位置:
文档之家› 存储技术基础(2)20160526百度文库
存储技术基础(2)20160526百度文库
机械设备故障率高
磁带库是一个机械密集型设备,磁带库的核 心部件机械手、磁带驱动器为机械易损件, 本身故障率高,灰尘、潮湿等使故障不可预 期,导致设备可用性差
"What are the most common causes of a backup failure?" -Percent of All Users (multiple responses accepted), N = 222
全备份
星期天 周一 周二 周三 周四 周五 周六
全备份
星期天 周一 周二 周三 周四 周五 周六
备份模式-LAN备份
LAN
BUSY!!!!! 应用服务器
备份服务器
应用服务器
磁带库
存储系统
备份模式服务器 备份服务器
Storage Nerwork
快速备份/恢复 快照可迅速生成,并可用作传统备份和归档的数据源,缩小甚至消除了数据备份窗口 快照/克隆存储在磁盘上,可以快速直接存取,大大提高数据恢复的速度
保存多个恢复点目标 基于磁盘的快照使存储设备有灵活和频繁的恢复点,可以快速通过不同时间点的快照 恢复数据 重新定义数据用途 快照提供一份接近实况数据的拷贝,可供测试、归档、查询使用,既保护生产系统 又赋予备份数据新的用途。
物理 分配
3 GB
公用存储池
业务连续性——容灾(Disaster Recovery)
同步方式:可以做到主/备中心磁盘阵列同步地进行数据更新,不会造成数据丢失。 同步方式对系统要求高,通常在近距离范围内(实际用户部署多在35KM左右) 异步方式:主/备中心磁盘阵列数据更新不同步,但对系统要求低,且对性能的影 响通常较小,并且备份磁盘的距离和生产磁盘间的距离理论上没有限制(可以通过 IP连接来实现数据的异步复制)
RPO(Recovery Point Time,恢复点目标)是指业务系统所允许的在灾难过 程中的最大数据丢失量 ,用来衡量容灾系统的数据冗余备份能力
什么是灾备?
灾备就是为了灾难恢复而对数据、数据处理系统、网络系统、基础设施、专业技 术支持能力和运行管理能力进行备份的过程。 灾备的级别 数据灾备:建立一个异地的数据系统对本地系统关键应用数据进行复制。当出现 灾难导致应用系统数据损坏时,能够通过异地保存的数据进行灾难恢复(Disaster Recovery) 应用灾备:异地建立一套完整的、与本地数据系统相当的应用系统(可以同本地 应用系统互为备份,也可与本地应用系统共同工作)。在灾难出现后,远程应用 系统可承担本地应用系统的业务运行。应用容灾的基础是数据容灾,只有保持本 地与异地数据的一致,才有可能进行应用容灾 业务灾备:还包括非IT系统的办公地点、环境、电话等
生产卷
指令流 数据流
备份模式-Server Free备份
LAN
应用服务器 应用服务器
备份服务器
介质服务器
Storage Nerwork
指令流
生产卷
快照卷
数据流
备份模式-Server Less备份
LAN
应用服务器 应用服务器 备份服务器
Storage Nerwork
生产卷
指令流 数据流
磁带备份的问题
HDS:TrueCopy/Sync EMC:MirrorView/S MirrorView/A
1
存储发展历史 企业级存储分类
2 3
4 5 6
存储技术及常用术语介绍
存储高级功能介绍
备份基础知识 容灾基础知识
数据保护技术-备份
传统的备份是指利用备份软件把数 据从磁盘备份到磁带进行离线保存 1. 备份方式支持每次针对增量数据 进行保护、可以制定策略自动完成, 并且可以对正在使用的数据(如注 册表)进行保护 2.备份数据是磁带格式,不能被应 用系统直接访问 3.备份过程中,应用系统的性能、 带宽等都会受影响
物理磁盘一般不建议移动 高,一般IT人员就可维护 磁盘阵列控制器、电源、磁盘、 风扇均采用冗余配置
环境影响
部件故障率 存储设备类型
受湿度、粉尘影响大
磁带机、机械手均为非封闭电控转动、 移动机械部件,故障率高 离线存储设备
受湿度、粉尘影响小
磁盘为封闭精密部件,故障率低; 磁盘阵列并有RAID保护 近线存储设备
小结:数据保护技术——备份
效果评估
1.支持增量的数据保护,但增量颗粒度大 2. 定期需要全备份,不适合远距离传输 3. 数据的提取严重占用应用服务器资源 4. 对系统平台兼容性要求很高,服务器增加,软件成本线性增长 1. RTO,数小时至一天,前提是所有备份介质完好 2. RPO,损失自上一次备份后的数据,一般为一天 软硬件投入成本相对较高。LAN Free模式、数据丢失带来的损失、备 份软件和磁带库的运维,磁带库较高的环境要求等
备份窗口与BC的关系 业务连续性越高(比如7x24小时的应用), 备份窗口与业务连续性的矛盾就越突出
备份技术基本概念——备份策略
全备份: 是对数据的完全备份 增量备份: 是对上次全备份或者增量备份后被修改了的文件 做备份 优点是备份数据量小,需要的时间短 缺点是恢复的时候需要多份备份数据,出问题的 风险较大 差量备份: 是备份自上次全备份后被修改过的文件 优点是恢复速度相对较快,因为只需要两份磁 带—最后一次完全备份和最后一次差量备份 缺点是每次备份需要的时间较长
抓带、加载、机械定位文件等机械动作延长 等待时间,如果需要多盘磁带恢复数据,业 务连续性会受到更大影响
备份介质的安全性
磁带为非封闭介质,且磁带库中的磁带之间 没有容错保护。备份业务涉及到的磁带组中 任一盘磨损、卡带、霉点、粘连等,均会导 致整个备份无法恢复
备份技术新的发展趋势
有什么办法?
单块磁盘容量的增长,价格的下降
受湿度、粉尘影响小
磁盘为封闭精密部件,故障率 低;磁盘阵列并有RAID保护 近线存储设备
VTL和D2D2T备份的问题—RTO、RPO目标难以保证
虚拟磁带库和D2D2T方式解决了传统磁带备份的难题即: •提高备份数据的可靠性 •提高备份速度,减小备份窗口 •VTL可用于优化备份环境,配合磁带库完成历史归档 但是备份窗口的存在,使得应用系统仍然面临丢失一部分数据的风险,而且备 份数据流对带宽的要求非常高,很难进行数据在远程或者异地的保护。更重要 的是改变原来数据的格式,备份数据无法直接使用,必须通过备份软件恢复后 才能使用,影响业务连续性
全拷贝快照——克隆 分离镜像 (Splitting a mirror) 差分快照 写即拷贝 (CoW: Copy On Write) 写即重定向 (RoW: Redirect On Write) 随机写 (WA : Write Anywhere)
提高性能——数据自动分层(Tiering )
主流备份软件厂商
Symantec(Veritas)主要的是高端的NetBackup和低端的 Backup Exec。备份软件市场占据了40%左右的份额
Commvault公司的SIMPANA™ EMC(Legato)公司的备份软件产品以NetWorker系列为主 CA公司的ARC Server定位在低端市场,BrightStor定位中 高端市场 BakBone的NetVault软件
1
存储发展历史 企业级存储分类
2 3
4 5 6
存储技术及常用术语介绍
存储高级功能介绍
备份基础知识 容灾基础知识
快照和克隆
Snapshot/Clone (/dictionary) A fully usable copy of a defined collection of data that contains an image of the data as it appeared at the point in time at which the copy was initiated. A snapshot may be either a duplicate or a replicate of the data it represents.
快照/克隆是特定数据集的一个可用拷贝,该数据集包含源数据在拷贝点的静态映
象;快照可以是数据再现的一个副本或者复制。 快照和克隆的区别: • 快照比较节省空间,但依赖源数据;快照预留空间通常只占源数据的20%左右
• 克隆是源数据在某个时间点的一份完整拷贝,所需空间和源数据一样大小,克
隆不依赖源数据
快照和克隆的价值及分类
将设备虚拟化到存储池 仅分配需要使用的物理空间以杜绝浪费
逻辑应用程序用户视图
将“臃肿的”卷变为“精简的”卷
优化存储性能
用户 A 10 GB
用户 B 10 GB
用户 C 10 GB
4 GB 3 GB
易于创建 易于分配 易于管理
HDS Hitachi Dynamic Provisioning EMC Thin Provisioning
应用服务器 LAN 应用服务器 备份服务器
Master Server SAN
磁带库
存储系统
备份系统的组成
备份软件
具体备份策略的制定、备份介质的管理及一些扩展功能的实 现,都由其最终完成。如Netbackup、NetWorker、 Brightstor等
磁带库
磁带库由库体、机械手、磁带机、磁带槽位和磁带等组成, 是一个完全自行控制并按照备份软件的策略自动进行工作 的体系
IBM Tivoli Storage Manager产品是高端备份产品,但更 多的适用于IBM主机为主的系统平台
……
BakBone
备份技术基本概念——备份窗口
备份窗口:Backup Window 是一个时间概念,即一个工作周期内留给备 份系统进行备份的时间长度。BC要求越高, 备份窗口就会越小
基于不断变化的需求自动移动和放置数据 数据写入性能最高的第 1 层 将活动频度较低的数据迁移到下面的分层 如果活动频度提高,再迁回到上面的分层 20% 的数据占数据活动量的 80%