XX财产保险股份有限公司信息系统灾难恢复预案2014-11目录1 目标与范围 (2)1.1 灾难的定义 ............................................................................ 错误 !未定义书签。
1.2 容灾目标 (4)1.3 容灾范围 (5)1.4 灾难恢复演习执行周期 (5)1.5 灾难恢复计划启动决策流程 (5)1.6 灾难声明的内容 (5)1.7 灾难恢复指挥中心和异地灾备中心 (5)2 组织与职责 (6)2.1 团队组织图 (6)2.2 灾难恢复团队 (6)2.3 全部成员通讯录 (17)3 紧急响应流程 (17)3.1 灾难预警 (17)3.2 人员疏散 (17)3.3 损害评估 (17)3.4 研判和灾难宣告 (17)4 恢复及重续运行流程 (18)4.1 恢复 (18)4.2 重续运行 (18)5 灾后重建和回退 (19)5.1 生产系统的重建工作流程 (19)5.2 专业技术保障 ........................................................................ 错误 !未定义书签。
5.3 通信保障 ................................................................................ 错误 !未定义书签。
第I页共20页1目标与范围1.1灾难恢复预案中的相关术语1)灾难备份中心backup center for disaster recovery用于灾难发生后接替主系统进行数据处理和支持关键业务功能运作的场所,可提供灾难备份系统、备用的基础设施和专业技术支持及运行维护管理能力,此场所内或周边可提供备用的生活设施。
2)灾难备份系统backup system for disaster recovery用于灾难恢复目的,由数据备份系统、备用数据处理系统和备用的网络系统组成的信息系统。
3)业务连续管理business continuity management为保护组织的利益、声誉、品牌和价值创造活动,找出对组织有潜在影响的威胁,提供建设组织有效反应恢复能力的框架的整体管理过程。
包括组织在面临灾难时对恢复或连续性的管理,以及为保证业务连续计划或灾难恢复预案的有效性的培训、演练和检查的全部过程。
4)业务影响分析business impact analysis分析业务功能及其相关信息系统资源、评估特定灾难对各种业务功能的影响的过程。
5)关键业务功能critical business functions如果中断一定时间,将显著影响组织运作的服务或职能。
6)数据备份策略data backup strategy为了达到数据恢复和重建目标所确定的备份步骤和行为。
通过确定备份时间、技术、介质和场外存放方式,以保证达到恢复时间目标(3.17)和恢复点目标 (3.18)。
7)灾难disaster由于人为或自然的原因,造成信息系统严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定的时间的突发性事件。
通常导致信息系统需要切换到灾难备份中心运行。
8)灾难恢复disaster recovery为了将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态、并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态,而设计的活动和流程。
9)灾难恢复预案disaster recovery plan定义信息系统灾难恢复过程中所需的任务、行动、数据和资源的文件。
用于指导相关人员在预定的灾难恢复目标内恢复信息系统支持的关键业务功能。
10)灾难恢复能力disaster recovery capability在灾难发生后利用灾难恢复资源和灾难恢复预案及时恢复和继续运作的能力。
11)演练exercise为训练人员和提高灾难恢复能力而根据灾难恢复预案进行活动的过程。
包括桌面演练、模拟演练、重点演练和完整演练等。
12)主中心/生产中心primary center / production center主系统所在的数据中心。
13)主系统/生产系统primary system/production system正常情况下支持组织日常运作的信息系统。
包括主数据、主数据处理系统和主网络。
14)区域性灾难regional disaster造成所在地区或有紧密联系的邻近地区的交通、通信、能源及其它关键基础设施受到严重破坏,或大规模人口疏散的事件。
15)恢复时间目标recovery time objective(RTO)灾难发生后,信息系统或业务功能从停顿到必须恢复的时间要求。
16)恢复点目标recovery point objective ( RPO)灾难发生后,系统和数据必须恢复到的时间点要求。
17)重续resumption灾难备份中心替代主中心,支持关键业务功能重新运作的过程。
18)回退/复原return/ restoration支持业务运作的信息系统从灾难备份中心重新回到主中心运行的过程。
1.2容灾目标遵照保监会《保险业信息系统灾难恢复管理指引》的规定,保险机构应根据风险分析和业务影响分析的结论,将直接或间接支持关键业务功能的信息系统分成三种类别:第一类:信息系统短时间中断会造成重大社会影响;或影响保险机构关键业务功能,并造成重大经济损失。
第二类:信息系统短时间中断会造成较大社会影响;或影响保险机构部分关键业务功能,并造成较大经济损失。
第三类:信息系统间接支持关键业务功能;或保险机构对系统中断具有一定容忍度的系统。
针对以上三类信息系统设定了最低灾难恢复能力等级要求:第一类:1)第 4级电子传输及完整设备支持;2) RTO <= 36小时; RPO <= 8小时。
第二类:1)第 4级电子传输及部分设备支持;2) RTO <= 72小时; RPO <= 24小时。
第三类::1)第 2级备用场地支持;2) RTO <= 7天; RPO <= 36小时。
XX财险灾备系统的技术指标设计如下:场景名称RTO RPO 说明主机房故障场景小于36 小时小于8 小时人工切换1.3容灾范围本次项目主要针对针对天财动力核心系统、财务 SAP系统二套 XX 财险的第一类核心信息系统,建设异地应用级灾难备份与恢复系统。
1.4灾难恢复演习执行周期公司级别灾难切换 /恢复演习每年进行一次,具体时间由管理恢复小组确定。
1.5灾难恢复计划启动决策流程灾难恢复计划属于公司应急处置预案,由公司应急处置领导小组决策,并统一领导指挥公司各相关部门按照应急预案进行处置。
具体流程参见《XX财产保险有限公司网络与信息安全事件应急预案》。
1.6灾难声明的内容集中交易生产系统因 __________原因,目前无法正常提供服务。
经过应急处置领导小组决定,现在启动公司应急处置预案。
预计生产恢复时间为 _________。
请各单位启动相应应急预案。
1.7 灾难恢复指挥中心和异地灾备中心灾难恢复指挥中心:上海市浦东新区异地灾备中心:广东省佛山市顺德区永丰工业南路联通公司2组织与职责2.1团队组织图信息化管理委员会灾难恢复管理小组机房基础环境后勤保障小组主机恢复小组网络恢复小组数据库恢复小组应用系统恢复小组2.2灾难恢复团队3.2.1 管理恢复小组由信管会下设灾难恢复管理小组,负责灾难恢复实施过程中的具体工作,及相关资源的协调,小组负责人信息技术总监杨茁总、信息技术管理部运维负责人黄伟,下设主机、网络、数据库、应用 4 个职能组,必要时可包括其他核心管理人员。
姓名(联系信息请填写通讯录)团队领导杨茁后备领导黄伟其它成员各恢复小组负责人后勤接口人员授权:全盘监视 IT 和应用系统恢复程序能力:管理、组织、财务灾难前职责领导职责知道并理解灾难发生时的工作程序。
了解灾难恢复计划书的整体内容。
监督灾难恢复计划相关培训。
协调 XX 财险各部门,取得信息系统灾难切换 /回切任务所需的基金和资源支持。
组织灾难恢复计划周期性审查和复核。
监督灾难恢复计划测试。
成员职责知道并理解灾难发生时的工作程序。
了解灾难恢复计划书的整体内容。
对相关人员进行灾难恢复计划培训。
审查和复核灾难恢复计划。
组织和实施灾难恢复计划测试。
灾难职责领导职责公布或授权公布灾难发生。
组织灾难损失评估。
必要时协调公司各部门,为灾难恢复人员提供生活资源支持。
在灾难指挥中心对所有灾难恢复团队提供全局领导。
确保小组成员正确肩负职责。
成员职责进行灾难损失评估。
联系必要的专职部门。
(如消防队、警察等)。
通告公司各部门负责人。
建立电话公告机制,向其他员工提供情况报告。
必要时协助公关部门准备新闻公告。
准备异地灾备中心的个人开支。
准备替换设备和物资的开支。
必要时雇用临时人员。
灾难后职责领导职责组织评估灾难处理过程中各小组的整体表现。
组织评估灾难恢复计划的整体效力。
必要时授权修改或更新现有灾难恢复计划。
成员职责评估灾难处理过程中各小组的整体表现。
评估灾难恢复计划的整体效力。
必要时修改或更新现有灾难恢复计划。
复核、批准和整体监管所有设备修缮和重建。
订购替换设备、服务等。
3.2.2 机房基础环境姓名(联系信息请填写通讯录)团队领导夏征宇后备领导周永毅其它成员各机房管理员机房基础环境的主要职责是机房的运行支持,生产中心与异地灾备中心的运行管理等。
主要职责如下:授权:机房运行监控,故障汇报能力:支撑设备知识,机房环境管理灾难前职责了解灾难恢复计划书的整体内容。
熟悉灾难真实公告发生时,小组的通告计划和预定集会地点。
对小组工作进行文本化记录,妥善保存该记录并不断更新。
通览机房设备(如空调、 UPS、电源、发电机等),消除机房运行危险。
监控机房物理环境。
保持各种设备(如应急电源、手电筒、设计图和设备布局图等)的供应供紧急情况下使用。
灾难职责在预先确定地点集会,根据管理恢复小组的指导组织灾难恢复工作。
研究和评估机房设备的损失程度,撰写损失报告。
将损失报告与上报建议一并提交管理恢复小组。
确定区域对人员是否安全。
在损坏设备附近建立安全带。
恢复可继续使用的设备和物资。
灾难后职责制定机房修缮 /重建工作计划并提交管理恢复管理小组进行复核和审批。
与机房设备和服务供应商合作设计和实施必要的安装工作。
整体监管新装和修复设备的重建、安装和检验。
协助系统的回切工作3.2.3 主机恢复小组姓名(联系信息请填写通讯录)团队领导夏征宇后备领导严孙军其它成员系统管理员服务器厂商工程师或热线存储设备厂商工程师或热线授权:在异地灾备中心恢复服务器、存储能力:熟悉操作系统及存储的操作,熟知相关系统文档及知识灾难前职责领导职责明确并文本化记录重要恢复流程,确保灾难恢复计划书反映这些流程。