<Insert Picture Here>甲骨文最高可用性架构 骨 最高 用性架构 Maximum Availability Architecture议程表• • • • • 甲骨文简介 高可用性介绍 传 高 用性分析 传统高可用性分析 甲骨文高可用性方案介绍(MAA) 客户成功案例分享2Oracle公司概揽总揽• • • • • • 从08财年收入$22.4B,11财年收入35.6B 在40多项产品或市场领域占据业界第一 320,000客户跨越145国家 10W员工规模 (1 in i 3 joined j i df from acquisition) i iti ) Oracle在线社区上有超过五百万开发者 34年从业经验革新和创新• 超过3,000 3 000个产品,拥有 个产品 拥有2,000 2 000多个专利 • 09财年投入$3B 研发和测试资金 • 7,500 售后支持人员, 支持27国语言3今天的甲骨文公司• 全球最大的企业软件供应商 • 数据库市场占有率第一 • 中间件市场占有率第一 • 应用软件市场占有率第一 • 服务器市场占有率第三 • 开源产品的领军者 • 虚拟化产品的竞争者 • 云计算方案供应商FAST = FusionMiddleware Applications System Tech4议程表• • • • • 甲骨文简介 高可用性介绍 传 高 用性分析 传统高可用性分析 甲骨文高可用性方案介绍(MAA) 客户成功案例分享5系统可用性意味着…各个企业和机构不同的业务特点决定了,其对系统可用性要求遵循着一 定的评判标准,如:7 :7*24*365 24 365,99%等… …保证系统高可用性不仅仅是一个口号,它需要底层架构和 IT技术的保障6Oracle对宕机原因的系统分类三十四年IT从业经验系统故障意外停机数据故障系统更改计划停机数据更改7传统的数据库高可用性昂贵的空闲冗余主服务器 空闲的故障转移服 务器冗余的系统和存储 在你尝试故障转移前,无法确认 一切都会正常工作。
(信不 切都会正常 作 (信不 信由你,反正我是不敢相信)空闲的灾难恢复 服务器系统第三方远程镜像 第三方的 备份软件 对应的存储阵列 存储阵列 第三方的卷管理器8议程表• • • • • 甲骨文简介 高可用性介绍 传 高 用性分析 传统高可用性分析 甲骨文高可用性方案介绍(MAA) 客户成功案例分享9人为错误Other Downtime是造成宕机的最主要原因其它 原因人为 错误• 客户需要快速的调查和修复• 对于局部损坏 • 需要细粒度的调查与修复 • 例如错误的删除了记录 • 对于大范围损坏 • 需要完整的回退来避免宕机 • 比如批量任务错误的删除了当月订单10DBA的工作经历 的工作经历上午10:30出纳找我说ERP系统入错账了,属于敏感模块不能撤 销或修改,只能还原昨天凌晨的备份数据。
于是将数据 库恢复至凌晨24点,当天和昨天输入的财务数据全部丢 点 当天和昨天输入的财务数据全部丢 失,然后整个办公室一起停下当前任务,找出纸文档重 新录入,花费5个小时,6位人力,公司数据库到下午3点 半,恢复正常。
假设每小时20美金人工,这次人为错误 成本最少600美金。
11传统的冷灾备系统是否可靠?你无法知道真相 直到有 天 你无法知道真相,直到有一天。
2011年10月10日, 2011年10月10日 BlackBerry发生全球服务 故障,全球七千万用户因 IT基础件故障受影响达4天 以上*,雪上加霜的是,空 闲的后备设施居然无法启 动灾难转移。
股价同期下 跌6%+。
Zuma Press* http://calgary.ctv.ca/servlet/an/local/CTVNews/20111012/CGY_blackberry_services_111012/20111012/?hub=CalgaryHome12单点故障怎么解决?没有选择的无奈。
没有选择的无奈2011年07月23日,这是沉 重的 天。
两列动车在温州 重的一天。
两列动车在温州 附近追尾,造成40人身亡、 191人受伤* 。
初步解释是 初步解释是 由于信号故障导致事故。
唯 一的信号系统宕机了,如何 维持 常 作呢 维持正常运作呢?Associated Press* /gb/20110801/bch125056.asp?source=NewSearch13硬盘故障丢失数据缺少备份?送修请谨慎 确保不含有敏感内容 送修请谨慎,确保不含有敏感内容365天,分分秒秒在发生。
大家有没有经历过硬盘损坏, 数据丢失?辛辛苦苦攒了几 年的片子 下载的电影 熬 年的片子,下载的电影,熬 夜的文档全木有了,全木有 了!!!* /gb/20110801/bch125056.asp?source=NewSearch14议程表• • • • • 甲骨文简介 高可用性介绍 传 高 用性分析 传统高可用性分析 甲骨文高可用性方案介绍(MAA) 客户成功案例分享15最佳的服务器保护以最低的成本系统故障真正应用集群 (RAC)意外停机数据故障系统更改计划停机数据更改16通过 RAC 实现服务器水平扩展真 应用集群 真正应用集群• RAC 共享异构的 低成本 服务器 • 最高的扩展性和可用性• 资源按需求配置,没有空闲资源DatabaseStorage• • • •切换到任意其它节点 集成集群软件 应用程序通知 图形化界面自动配置与监控消除服务器单点故障而设计17最佳的数据保护职业的面面俱到系统故障意外停机数据故障Flashback RMAN Oracle Secure Backup ASM Data Guard G ld G t GoldenGate保护人为错误保护数据损坏保护存储 / 站点故障实现双活数据中心18闪回技术 FLASHBACK错误数据检测与修正• 闪回技术变革错误恢复操作• 根据时间点查询原始数据 • 简单回溯数据变更 • 修正错误的时间长度等于产生错误的时间修正时间 = 犯错时间 + f(DB_SIZE)• 低影响,简单容易的指令,没有复杂的程序• 比如: SQL> fl flashback hb k d database t b t to <ti <timestamp>; t >• 非常低的性能开销 – 少于 2% • 也非常适合于测试!19通过 ASM 进行数据镜像存储和管 所有数据 存储和管理所有数据• ASM 通过低成本的模块化存储阵列镜 像数据• 磁盘或阵列出现故障时自动重新镜像数据库• ASM是免费的 • OEM可帮助将数据库从文件系统移植 到ASM • 11g ASM 增强功能• 在发生临时磁盘故障时可以暂停IO,当 故障解决后可继续读写 • 滚动升级 ASM 实例存储允许存储阵列故障20数据卫士Oracle Data Guard :成本最低的最佳故障保护自动故障切换物理/生产数据库同步/ 异步重做日志发送/ 逻辑备用数据库Data Guard•零数据丢失,秒级故障切换•支持RAC ,支持所有数据类型•高可用及灾备方案•防止数据损坏,低网络开支Oracle Active Data Guard 活动数据卫士最佳资源利用,没有空闲冗余!最佳资源利用没有空闲冗余!可读备用数据库生产数据库同步/ 异步重做日志发送Active Data Guard•甲骨文数据库级别数据可用性和数据保护•高达三十台的统一配置备用可读数据库•备用可读数据库可供查询,报告,测试和备份负载分流Oracle GoldenGate捕捉: Committed changes are captured (and can be filtered) asthey occur by reading the transaction logs.架构y y g g跟踪文件: Stages and queues data for routing.输送: Distribute data for routing to multiple targets.递交:Applies data with transactionintegrity, transforming the data as required.路由: Data is compressed, encrypted for routing to targets.读写工作负荷读写工作负荷LAN / WAN /Internet(TCP/IP)CaptureSource Trail Target TrailDeliveryPump原数据库目标数据库双向的Bi-directionalSource TrailTarget TrailDelivery CapturePumpGoldenGate 支持的异构平台数据库操作系统和平台Capture :O l •Windows 2000, 2003, XP Oracle DB2Microsoft SQL Server •Linux •Sun Solaris •HP NonStop Sybase ASE Teradata Enscribe •HP-UX •HP TRU64•HP OpenVMS SQL/MP SQL/MXDelivery -all listed above, plus:p •IBM AIX •IBM z/OSHP Neoview, Netezza, Greenplum, and any ODBC compatible databases ETL productsJMS message queues MySQL TimesTen甲骨文数据库高可用性Active Data Guard 与GoldenGate 的使用场景•容灾和数据保护¾Active Data Guard: 简单的Oracle 数据库全面保护g p,p,p,y9High-performance, simple, drop-in solution for HA and DR, readable at standby 9Zero data loss, integrated data corruption protection, switchover / failover9DR for all data types & apps including packaged apps that can’t be changed •数据传递, 灵活的高可用性¾GoldenGate: 异构,双活,数据迁移G ld G t9Heterogeneous replication, transformations, subsetting, multiple topologies9All sites fully active (read/write): avoid or manage conflicts at application level9Enable minimal downtime app migrations with 2nd database copy最佳的联机系统更改保持系统在线系统故障数据故障意外停机两种系统更改对策联机重配置系统更改数据更改计划停机联机滚动升级最佳联机数据更改保持系统在线系统故障数据故障意外停机系统更改数据更改对策数据更改计划停机联机重定义甲骨文最大可用性架构低成本,兼容,热备,高投资回报热备份Active Replica生产库Active Data Guard–数据保护,容灾–RAC–可扩展性查询分流GoldenGate–双活–服务器高可用性Flashback–人为错误修正–异构ASM–卷管理–自动镜像校验RMAN & Fast Recovery AreaOracle Secure Backup–备份到磁带或云端Edition-based Redefinition,Online Redefinition, Data Guard, GoldenGate–,–磁盘备份最小化因维护, 升级,迁移引起的停机时间议程表•甲骨文简介•高可用性介绍传高用性分析•传统高可用性分析•甲骨文高可用性方案介绍(MAA)•客户成功案例分享RAC:淘宝20节点的集群系统数据仓库部署于集群之上,过去需要数天才能完成的计算现在当天就能完成,部分以前属于小时级别的计算更是提高到了分钟级别。