业务应急与运维保障方案XXX .................................................................................. 错误!未定义书签。
第1章需求分析 (1)1.1多业务应急系统建设背景 (1)1.2信息中心运维面临的问题 (1)1.3业务应急和运维保障系统建设的要求 (2)第2章整体方案设计 (3)2.1方案设计原则 (3)2.2整体方案描述 (4)2.3方案的扩展性 (4)2.4方案实现的效果 (5)2.4.1CDAP实现本地多业务应急 (5)2.5产品价值 (5)2.5.1“CDAP多业务应急与运维保障平台”能实现一对多的应急接管 (5)2.5.2“CDAP多业务应急与运维保障平台”能改善备份方案 (6)2.5.3“CDAP多业务应急与运维保障平台”提供的测试和迁移工具 (7)第3章CDAP业务应急与运维保障平台介绍 (8)3.1方案环境部署 (9)3.2方案关系配置: (9)3.2.1应急数据源 (10)3.2.2同步配置 (10)3.2.3备份配置 (10)3.2.4数据同步 (10)3.3应急机制和预案建立 (10)第4章灾难恢复方案 (12)4.1.1应急接管 (12)4.1.2数据与业务系统恢复 (13)4.1.3文件和数据库逻辑错误恢复 (13)4.1.4服务器系统错误恢复 (14)4.1.5服务器硬件故障异机恢复 (15)第5章产品维护方案 (15)5.1目的 (15)5.2范围 (15)5.3服务 (15)5.4内容 (16)第1章需求分析1.1多业务应急系统建设背景在现代社会各单位和企业越来越注重信息化的建设,为了满足业务不断的需要,每年都会新增加各种信息化管理系统,经过不断的发展和建设,信息中心的运维和管理工作的复杂度在不断增加;如何保障信息中心的业务系统和服务器主机的正常运行,成为信息中心的运维工作人员的主要任务和考核指标。
传统的数据安全保障机制越来越不能适应新形势下信息中心的运维保障需求。
需要一种智能的、一体化的、适应各种应用环境的业务应急和运维管理平台。
随着金保工程的上线,XXX目前已经基本完成了覆盖全县完整信息系统,包括人力资源管理系统和社会保险管理系统。
目前核心业务系统包括:医保系统、网上申报业务系统、异地接入系统、阳光医保系统、网上办事业务系统等业务前置系统。
这些业务系统运行都会根据实时更新的数据库系统做连接,虽然对数据系统做了双机保障,但前置应用服务器都时单应用服务器在运行,如果发生前置业务系统故障,各种业务办理就要停止,给业务开展带来不变。
1.2信息中心运维面临的问题大量服务器业务应急需求:信息化平台现有的大量业务系统设备采用了一机一应用/一机多应用的模式,当前的这种部署模式,如果某台物理服务器因为各种原因计划内停机或者故障停机,都不可避免的会造成其上运行的业务系统停止的问题,这将直接影响到用户业务的正常开展。
运维环境复杂,响应速度滞后:由于当前信息化平台服务器数量巨大,如何处理各种不同操作系统、业务系统的日常维护与故障处理对平台的运维管理是极大考验。
如果没有统一的备份管理与应急恢复的管理手段,因服务器与操作系统存在差异,管理难度极大,极有可能无法响应业务系统的要求,影响日常工作。
数据和应用备份的快速恢复系统:信息化平台现有的大量应用系统存在数据备份保护问题,简单的手动备份不仅需要耗费大量的人力物力,效果往往会得不偿失,无法实现对应用数据的实时保障。
当服务器出现硬件和系统错误时候,当前平台系统也缺少非常简便和快速备份和恢复系统。
平台系统运维缺少测试环境迁移手段:信息化平台现有服务器数量繁多,种类复杂,各种不同系统与应用都存在,在运维过程中对于应用程序或者操作系统的测试与补丁升级,往往需要耗费大量的人力物力资源,缺乏有效的仿真测试环境,来简化运维管理中碰到的测试升级问题。
另外,有些老的系统需要迁移到新的硬件平台,需要一个方便的系统迁移工具。
混合环境统一应急管理:在信息中心,各种业务有的在虚拟机、有的在物理服务器环境,需要一套可以解决在混合环境中都可以实现业务应急和业务备份恢复的手段。
1.3业务应急和运维保障系统建设的要求根据需求了解,机房业务应急和运维保障系统需要支持以下功能:●业务负载应急:可以支持各种类型的服务器业务负载转移接管,包括数据库系统、中间件、文档管理系统、邮件系统、域控、安全管理平台等。
快速地实现业务的切换,同时也可以从不同的时间点实现业务的应急。
●仿真测试功能:可以实现服务器整体业务的任意时间点仿真模拟,可以为日常机房运维提供测试,补丁升级的测试环境。
●虚拟机迁移功能:可以实现对机房不同品牌服务器一次性完整迁移,同时也可以实现对虚拟化平台的迁移,可以支持对物理服务器业务系统,一键完整迁移到虚拟化平台上。
第2章整体方案设计2.1方案设计原则为满足XXX信息中心的需求,本次方案设计遵循以下原则:➢开放性:采用标准的技术、结构、系统组件和用户接口,支持所有流行的国际标准及协议。
➢先进性:方案的技术、设计思想、管理工具要先进,符合信息科技的发展趋势,保证业务发展具有巨大的拓展空间;选用的产品为具有先进性和市场成熟度的存储系统产品。
➢经济性:有良好的性价比,最大化保护现有投资。
➢可扩展性:系统能够在规模和性能两个方面向上扩展,以保证未来不断发展的要求。
随着业务量的增长独立升级;能够比较方便地进行扩展,扩展时与应用无关。
2.2整体方案描述在社别中心机房的,设置两台CDAP应急服务器,将机房中所有的x86服务器的业务实时备份到CDAP设备中,可以为关键应用比如:医保前置业务系统、网上申报业务系统、异地接入系统、网站放在性能比较高的CDAP设备上,其他次重点业务系统实时备份在另外一台CDAP设备上,分散业务应急和备份的风险。
同时可以采用CDAP统一保障物理机和虚拟机所有业务系统,不用区分其中平台架构的区别,减少应急保障的投入。
网络架构图:2.3方案的扩展性CDAP产品是采用开放式架构的一体化应急产品,以后信息中心的业务量有增加可以从软件和硬件存储去扩展;软件:增加容灾点,保障更多的应用业务和服务器;硬件:增加容量,可以直接增加盘柜和连接第三方的存储。
目前的容量配置,可以满足未来3~5年机房信息中心建设的需求。
2.4方案实现的效果2.4.1CDAP实现本地多业务应急在本地机房的核心交换机上部署CDAP多业务应急和运维保障平台,其中CDAP为数据中心的所有服务器的备机,实现当本地服务器发生故障,包括硬件故障和软件故障,可以在几分钟实现快速应急的效果。
CDAP设备解决机房运维中90%的故障,保障整个数据中心的应用和数据实时备份和快速顶替故障服务器。
CDAP业务应急和运维保障平台是一个可扩展的平台。
2.5产品价值2.5.1“CDAP多业务应急与运维保障平台”能实现一对多的应急接管可以随机接管机房内任何X86的应用服务器,任意一台服务器发生数据丢失等故障时,1-2分钟内就可以快速恢复数据并接触故障。
任意一台服务器发生应用故障,3-5分钟就可以实现接管,一台保护多达25台,实施简单,不用改变配置和改动网络架构。
用一台设备就可以实现类似于几十套双机效果,能大量节约资金和维护量.2.5.2“CDAP多业务应急与运维保障平台”能改善备份方案提供整机一体化实时备份,兼容所有需要备份的系统环境,而且改善了备份效率。
a.很多重要数据实现了接近实时数据保护;b.不仅备份了数据还备份整个系统环境及应用; c.系统能够改变以前数据备份无法验证不足,能够实现及时验证备份数据;d.恢复数据方式非常快和便捷,不仅几秒钟就能恢复单个数据,也可以几十分钟就可以完整恢复一个应用和数据,立即就可以使用,能可彻底改观传统恢复漫长局面。
2.5.3“CDAP多业务应急与运维保障平台”提供的测试和迁移工具能提供了方便的各种操作系统和应用的迁移工具,为本单位一些老设备的应用提供迁移到新服务器的手段。
能提供了原机多时间点的快照,提供了原机实时的仿真系统,能非常方便做各种应用系统测试。
第3章CDAP业务应急与运维保障平台介绍CDAP业务应急与运维保障平台是上海数腾公司历时六年,采用当前最新的实时虚拟化镜像与驱动抽象化技术研发的平台化软件产品。
作为一款致力于为用户解决多服务器多应用等复杂环境下机房业务应急与运维管理的产品,平台解决了一对多保护、系统应用和数据整机一体化实时备份、服务器快速应急接管以及服务器无缝恢复等一系列机房运维管理中常见的各种难题。
另外,本着简易、高效、开放、绿色等原则,CDAP业务应急与运维保障平台集一对多的业务应急、机房智慧运维管理与虚拟化保障于一身,为用户带来新的机房运维管理体验。
3.1方案环境部署CDAP业务应急与运维管理平台本着简易高效原则,部署简单,稳定可靠。
首先,将CDAP一体机服务器接入用户网络内,确保与需保障服务器相互ping即可,无需更改机房现有的网络配置;其次,登入客户端服务器,登入CDAP平台的Web管理界面,通过网络推送的方式获取客户端,安装即可。
客户端安装简便,对客户服务器性能影响极少。
最后,客户端软件安装完成以后,用户就可以直接登入CDAP软件Web管理界面进行统一的客户端备份的管理。
3.2方案关系配置:CDAP业务应急与运维管理平台提供了各式各样的关系配置选择,配置简单易懂。
服务器接管与备份关系相关的配置主要包括:应急数据源、同步策略设置以及快照策略设置。
3.2.1应急数据源通过对客户端进行配置操作可以进入相关的配置界面,应急数据源主要是业务服务器需要备份的分区进行选择确认。
3.2.2同步配置备份数据的数据同步最短可以实现秒级的数据同步,用户可以根据自身业务服务器负载能力进行数据同步间隔时间的选择。
3.2.3备份配置快照策略设置主要包括快照周期设置,快照保存份数以及完整备份数,用户可以根据自身业务服务器负载能力进行数据同步间隔时间的选择。
另外平台系统还提供快照合并功能,用户可以根据自身要求,制定自动合并快照策略以及通过手动合并快照的方式进行数据的周期备份。
3.2.4数据同步CDAP 采用磁盘I/O实时复制技术,技术基于磁盘过滤驱动,实时监控每个磁盘的读写I/O,同时记录下来每个写I/O 的磁盘MAP 分布图,在每次同步时间里把相应的物理磁盘变化量同步到虚拟磁盘上;CDAP软件同步技术基于全球唯一独创的卷有效空间备份技术,同步空间仅仅是卷的有效数据,备份卷时,不需要检索文件,绕过文件系统层,直接复制硬盘连续使用块,能获取最大的读写速度,能够大大简化数据同步操作。
3.3应急机制和预案建立应急预案是平台系统针对客户端业务服务器出现故障以后,信息化平台管理员能够通过应急预案快速实现业务服务器接管以保证业务服务器的正常运行。