应急响应管理制度山西精英科技股份有限公司版本记录目录1 目的 (5)2 术语定义与引用标准 (5)2.1 术语定义 . (5)2.2 引用标准 . (5)3 适用范围 (5)4 工作原则 (6)4.1 统一指挥、有效组织 . (6)4.2 突出重点,加强演练 . (6)4.3 技术支撑,健全机制 . (6)5 风险评估 (6)5.1 系统重要性评估 . (7)5.2 影响度评估 . (7)5.3 发生几率评估 . (7)5.4 发生时段评估 . (8)5.5 风险等级评估 . (8)5.6 进行风险评估 . (9)6 事件分级 (9)6.1 信息系统重要性 . (9)6.2 信息系统服务时段 . (10)6.3 事件定级 . (10)7 组织机构和职责 (11)7.1 公司内部组织 . (11)7.1.1 总负责人 (11)7.1.2 应急指挥小组 (11)7.1.3 应急工作小组 (11)7.1.4 相关外部角色 (12)8 应急要素与体系 (12)8.1 事件处置要素 . (12)8.1.1 管理层面 (12)8.1.2 技术层面 (12)8.1.3 事件归口 (13)8.1.4 分级响应 (13)8.2 指挥和协调 . (13)8.3 信息共享和处理 . (13)8.4 通讯 . (14)8.5 外部沟通 . (14)8.6 服务需方 . (14)8.7 供应商 . (14)9 运行机制 (15)9.1 日常监测和预警 . (15)9.2 应急启动 . (15)9.3 事件报告 . (15)9.4 应急调度 . (16)9.5 排查和诊断 . (16)9.6 处理和恢复 . (16)9.7 事件升级 . (17)9.8 持续服务 . (17)9.9 应急事件关闭 . (17)9.9.1 申请 (17)9.9.2 核实 (18)9.9.3 事件通报 (18)9.10 总结改进 (18)9.10.1应急工作总结 (18)9.10.2应急工作审核 (19)10 保障措施 (19)10.1通信保障 (19)10.2物资保障 (19)10.3技术保障 (20)10.4经费保障 (20)10.5人员保障 (20)11 宣传、培训和演练 (20)11.1宣传 (20)11.2培训 (20)11.3演练 (21)12 应急响应管理关键指标 (23)1目的为了规范客户的各类信息系统应急事件的应急管理,提高应对应急事件的管理水平和应急处理能力,有效防范信息系统风险,减少信息系统故障对生产业务造成的影响,确保信息系统运行的连续性,特制定本预案2术语定义与引用标准2.1术语定义服务级别管理术语定义如下:术语缩略词定义important 提升服务级别以确保某一时间段内重要活动或重点时段保障period assurance 重点业务的开展所采取的措施和活动。
emergency 导致或即将导致运行维护服务对象运行中断、应急事件event 运行质量降低,以及需要实施重点时段保障的事件。
emergency 组织为预防、监控、处置和管理应急事件所采应急响应response 取的措施和活动。
2.2引用标准GB/T 28827.1 —2012 信息技术服务运行维护第1部分:通用要求;GB/T 28827.2 —2012 信息技术服务运行维护第2部分:交付规范;GB/T 28827.3 —2012 信息技术服务运行维护第3部分:应急响应规范;ITSS 1-2015信息技术服务运行维护服务能力成熟度模型V1.0;ISO/IEC 27001:2013 信息技术 - 安全技术 - 信息安全管理体系要求。
3适用范围本制度适用于公司运维业务范围内的信息系统、网络系统、数据中心等应急事件。
本制度用于指导和规范公司运维业务范围的信息系统、网络系统、数据中心等应急预案,建立自上而下、分级负责应急事件应急处置体系,规范处理突发事件的逐级汇报流程。
本制度适用于应急预案编制、预案评审、预案实施、应急队伍、培训教育、应急装备、应急演练等工作。
4工作原则4.1统一指挥、有效组织成立应急总负责人,由公司总经理担任;应急指挥小组,由公司副经理,技术骨干等组成;并成立应急工作小组。
组织开展事件预防、应急处置、恢复运行、事件通报等各项应急工作。
相关部门要主动协调有关各方面,参与实施部门听从指挥、步调一致。
4.2突出重点,加强演练对关键信息系统加大监控和应急处理力度,确保应急信息及时准确传递。
每年开展应急演练工作,确保应急措施合理、有效。
4.3技术支撑,健全机制在充分利用客户现有的信息资源、系统和设备基础上,采用先进适用的预测、预防、预警和应急处置技术,改进和完善应急处理的装备、设施和手段,提高应对信息系统应急事件的技术支撑。
建立健全应对信息系统应急事件的有效机制。
5风险评估应急响应小组每年对重要信息系统进行一次风险评估,并根据风险评估结果来制定或更新应急预案。
风险评估方法如下:5.1系统重要性评估等级描述赋值1 级将对客户造成极严重的或灾难性的损失 42 级将对客户造成较重要的损失 33 级将对客户造成一定损失 24 级将对客户造成有限损失 1根据上表对信息系统以及相关外部环境进行重要性评估。
5.2影响度评估等级赋值影响度描述高 3 核心业务全面中断;影响大面积用户正常使用;中 2 部分核心业务中断;影响一定范围内用户的正常使用;低 1 单一业务中断;影响个别用户正常使用;根据上表对信息系统以及相关外部环境进行影响度评估。
5.3发生几率评估等级可能性取值可能性描述(威胁发生的频率)经常 3 可能每个季度发生一次或者以上偶尔 2 可能每半年会发生一次极少 1 可能每年发生一次或更少根据上表对风险发生几率进行评估。
5.4发生时段评估等级赋值时段程度描述高 3 核心业务并发高峰期;核心业务关键程序执行期;中 2 部分核心业务并发高峰期;部分核心程序执行期;低 1 非核心业务并发期;非核心程序执行期;5.5风险等级评估按照重要性、影响度、发生几率赋值相乘,得出信息系统以及相关环境的风险等级。
等级描述如下:可能性 1 2 3影响度 1 2 3 1 2 3 1 2 31 123 24 6 3 6 92 2 4 6 4 8 12 6 2 8重要性3 3 6 9 6 12 18 9 8 74 4 8 12 8 16 24 2 4 6 风险值=重要性×风险发生可能性× 风险发生的严重性风险等级风险值 n高( H)n>=12中( M)12>n>4低( L)n<=45.6进行风险评估按照风险等级评估,列出信息系统以及相关外部环境,描述可能发生的风险,针对每一个风险制定控制措施,并明确相应责任人,形成《风险评估表》,撰写风险评估报告。
6事件分级根据信息系统事件的分级考虑要素,将信息系统事件划分为三个级别:I 级事件、II级事件、 III 级事件。
一般( III级):综合分值在1-4 分;较大( II 级):综合分值在5-12 分;重大( I 级):综合分值在大于12 分;6.1信息系统重要性信息系统的重要性由以下要素决定:1)信息系统所属类型,即信息系统资产的安全利益主体。
2)信息系统主要处理的业务信息类别。
3)信息系统服务范围,包括服务对象和服务网络覆盖范围。
4)业务对信息系统的依赖程度。
其中第 1)与 2 )个要素决定信息系统内信息资产的重要性,第3)与第 4)个要素决定信息系统所提供服务的重要性,而信息资产及信息系统服务的重要性决定了信息系统的重要性。
信息系统分级及赋值如下:赋值描述1 4 级信息系统2 3 级信息系统3 2 级信息系统赋值描述4 1 级信息系统6.2信息系统服务时段信息系统服务时段划分为 3 级。
依据应急事件发生的不同时间,对信息系统恢复正常服务所需的时间要求而确定。
赋值描述1 非系统服务时段(不含系统服务时段即将开始)2 系统服务时段或系统服务时段即将开始3 系统处于重点时段保障(业务必须正常运行时间)或处于服务高峰时段信息系统损失程度赋值应急事件造成的信息系统损失程度划分为 3 级。
依据故障发生对信息系统提供的服务能力的下降程度而确定。
系统功能系统性能功能无损部分损失全部损失小于阈值— 1 3大于或等于阈值 1 2 3重点时段保障的损失程度赋值为 36.3事件定级将以上应急事件三个要素的赋值相乘,事件级别如下表所示:范围级别1~6 III 事件8~18 II 事件26~36 I 事件7组织机构和职责7.1公司内部组织公司内成立应急处置领导小组、指挥小组、工作小组。
应急组织设置根据实际项目的应急组织管理机制,受客户的应急组织领导。
7.1.1总负责人总负责人的主要职责:统一领导信息系统的应急事件的公司内部应急处理工作,发起研究重大应急决策和部署,决定实施和终止应急预案。
7.1.2应急指挥小组应急指挥小组的主要职责:接受应急总负责人的领导,传达和落实应急总负责人的各项指令,汇总和上报应急信息,负责应急工作小组成员的协调沟通,协调应急事件处置工作中的重大问题。
7.1.3应急工作小组应急工作小组主要职责:落实应急总负责人及应急指挥小组布置的各项任务;组织制定应急预案,并监督执行情况;掌握应急事件处理情况,及时向应急总负责人和应急指挥小组报告应急过程中的重大问题。
角色角色匹配总负责人总经理、工程运维中心总监(副总经理)应急指挥小组运维部经理、技术支持部经理、运维项目经理、综合管理部、质量管理部经理应急工作小组技术支撑主管、研发主管、运维主管、运维工程师、备件管理员等运维团队成员、质量管理员7.1.4相关外部角色服务需方应急响应责任人与供应商等外部联络人及相关人员。
8应急要素与体系8.1事件处置要素8.1.1管理层面1)启动指挥体系: I 级事件的启动和指挥由应急总负责人负责, II 、III 级事件的启动应急指挥小组负责。
2)掌握事件动态:事件动态由应急工作小组人员收集并及时反馈给应急指挥小组,应急指挥小组决定信息的共享、沟通、处置。
3)处置实施:控制事态防止蔓延做好处置消除隐患4)后期处置:事件调查报告和经验教训总结及改进建议。
5)保障措施:包括通讯与信息保障,应急支援与设备保障,技术储备与保障,宣传、培训和演练,监督检查等。
8.1.2技术层面信息系统事件发生后,事发部门应立即启动相关应急预案,实施处置并及时报送信息。
1)控制事态发展,防控蔓延。
事发部门先期处置,采取各种技术措施,及时控制事态发展,最大限度地防止事件蔓延。
2)快速判断事件性质和危害程度。
尽快分析事件发生原因,根据信息系统运行和承载业务情况,初步判断事件的影响、危害和可能涉及的范围,提出应对措施建议。