当前位置:文档之家› 银行系统故障技术应急预案

银行系统故障技术应急预案

银行系统故障技术应急预案一、总则1.1目的本预案旨在全面提高应对金融生产系统中各种突发事件的能力,提供科学的指挥方案,最大限度地减少突发事件所造成的业务停顿时间。

力争在最短的时间内恢复系统运行,保证生产系统的稳定、安全运行。

1.2工作原则1.2.1 贯彻统一领导,分级负责,反应及时,措施果断,依靠科学,加强合作的原则。

邮政金融系统故障具有突发性强、影响大、范围广的特点,一旦出现重大故障必须在行领导的统一指挥下,以省级运行维护部门为中心,相关部门积极配合,协同作战,迅速反应,最大限度地保证业务的连续性和安全性。

1.2.2 遵循预防为主,常备不懈的方针。

做好应对突发事件的思想准备和思想教育;加强生产系统的日常监控;通过技术创新和技术进步完善监控和预警手段;加强专业队伍建设和培训;制定完善的单项应急处理流程,提高处理速度。

定期进行预演。

二、组织结构与职责金融技术应急组织机构由突发事件领导小组,突发事件应急办公室和各技术应急小组构成。

2.1应急领导小组应急领导小组由相关技术领导组成,负责重大故障应急对应的决策。

2.2 应急办公室2.2.1应急办公室由市局信息技术中心和市行渠道与科技部。

2.2.2应急办公室工作职责。

1)贯彻执行上级领导部门的工作部署。

2)进行生产环境安全教育,定期演练。

3)组织安全检查;监督应急措施的落实和整改。

4)遇到故障发生,协调相关各部门、厂商和省分行相关部门,行使指挥职能。

2.3技术应急小组。

2.3.1技术应急小组由省分行技术部门的运行维护技术人员组成。

2.3.2技术应急小组职能。

1)制定具体的应急措施,不断完善应急措施。

2)24小时监控系统运行,发生故障及时预警、上报。

3)执行上级制定的应急措施。

技术应急小组由市局信息技术中心和市行渠道与科技部组成。

三、监测和预警3.1故障监测与预警发布3.1.1 监控。

省级维护部门建立了网络和主要设备、系统的运行监控系统,一旦发生故障,会产生声音报警。

其他设备和系统采用设备巡检制度,定时对设备运行状态进行记录。

3.1.2监控部门一旦发现故障报警,要及时应急办公室。

应急办公室按上报的故障分类和级别,组织应急处理。

预警级别在二级(含二级)以上报应急办公室,由应急办公室上报应急领导小组。

当故障预警的应急处理在规定的时限内没有处理完成,或故障预警级别上升,则由应急办公室启动相应级别的应急处理,超过二级预警上报应急领导小组。

3.2预警级别3.2.1网络一般预警:预警级别为四级。

部分支行线路发生故障,导致业务无法进行。

预警信息用蓝色表示。

较重预警:预警级别为三级。

地市对省中心的主干线路发生故障,或地市中心网络汇接设备发生故障,导致一个地区的业务全部瘫痪。

预警信息用黄色表示。

严重预警:预警级别为二级。

省中心一条骨干线路或部分网络设备发生故障,导致全省业务停顿1小时以上或国家局线路或设备出现故障导致省际业务无法进行。

预警信息用橙色表示。

特别严重预警:预警级别为一级。

省中心全部骨干线路;主、备网络设备设备出现故障,导致全省和省际业务在短时间内无法进行。

预警信息用红色表示。

3.2.2 设备一般预警:预警级别为四级。

外围系统硬件设备或核心系统硬件设备只是产生硬件故障报警,出现了设备故障的提示。

预警信息用蓝色表示。

较重预警:预警级别为三级。

外围系统硬件发生故障,但业务仍可维持进行。

预警信息用黄色表示。

严重预警:预警级别为二级。

核心系统一台主机出现重大故障,无法运行;或部分外围系统出现严重硬件故障而导致业务停止。

预警信息用橙色表示。

特别严重预警:预警级别为一级。

发生不可预测性自然灾害,导致省中心机房严重破坏;或核心主机、存储等出现重大故障,无法运行(主、备机均无法运行)。

预警信息用红色表示。

3.2.3 系统一般预警:预警级别为四级。

外围系统cpu、内存、网络和存储等资源占用较大,导致网点交易缓慢。

预警信息用蓝色表示。

较重预警:预警级别为三级。

储蓄主机系统cpu、内存、网络和存储等资源占用较大,导致网点储蓄等主要交易缓慢;外围系统cpu、内存、网络、存储等资源占用严重,导致部分或全部前端交易无法进行,并且故障在1小时内无法解决的。

预警信息用黄色表示。

严重预警:预警级别为二级。

储蓄系统出现严重的交易堵塞现象,网点业务无法正常开展,并且在1小时内没有解决;外围系统出现严重故障,无法开展业务,在2小时内无法解决的。

预警信息用橙色表示。

特别严重预警:预警级别为一级。

出现严重的系统故障,导致全省无法开展业务,并且在2小时内无法解决的(外围系统时限为1天);或结息没有结束,导致业务停顿。

预警信息用红色表示。

四、应急响应4.1网络应急响应4.1.1蓝色预警-四级预警的应急响应。

分支机构操作发现故障后,应立刻通知分支行维护协调人,并由维护协调人通知本地区公司维护人员,由本地公司维护人员负责故障的处理和与相关线路运营商的协调。

如果本地区50%以上网点出现线路故障,并且在4小时内无法修复的,升级为黄色警告。

4.1.2 黄色预警-三级预警的应急响应。

分行维护协调人上报省行应急办公室,同时通知本地区维护负责人,由本地区负责人启动相关网络应急流程。

应急办公室上报省分行应急领导小组。

应急办公室及时与故障地区维护单位沟通故障处理情况,并上报给应急领导小组。

故障在24小时内无法解决的,升级为橙色预警。

4.1.3 橙色预警-二级预警的应急响应。

机房值班人员发现故障后,立刻通知省中心网络维护员和维护部门负责人,在半小时内到达现场,确定故障情况后,上报省分行应急办公室,应急办公室上报省分行应急领导小组,并向相关部门发布故障警报和预警级别。

应急办公室到大省中心机房,组织技术应急,提出技术应急方案,经应急办公室上报应急领导小组批准后实施。

应急办公室及时掌握故障处理进展,并及时汇报。

应急领导小组在1小时内到达现场,指挥应急处理。

4.1.4 红色预警-一级预警的应急响应。

机房值班人员发现故障后,立刻通知省中心网络维护员和维护部门负责人,在半小时内到达现场,确定故障情况后,上报省分行应急办公室,应急办公室上报省分行应急领导小组,并向相关部门发布故障警报和预警级别。

应急办公室和应急领导小组在半小时内到达现场,由应急领导小组组织应急处理,提出整体应急方案,由技术应急领导小组上报分行主要领导,待应急方案批准后实施。

4.2设备应急响应4.2.1 蓝色预警-四级预警的应急响应。

机房值班人员发现故障后,立刻通知相关系统的维护技术人员,维护人员通过远程或到达现场的方式,经一步确定故障的程度,并执行一般故障处理流程。

4.2.2 黄色预警-三级预警的应急响应。

机房值班人员发现故障后,立刻通知相关系统的维护技术人员,维护人员和维护主管等半小时内到达现场,执行应急处理流程,同时报告应急办公室。

应急处理完成后,维护人员和维护主管监控系统运行情况,确认系统运行平稳后,方可离开现场,并上报应急办公室,应急办公室上报应急领导小组。

4.2.3 橙色预警-二级预警的应急响应。

机房值班人员发现故障后,立刻通知相关系统的维护技术人员,维护人员和维护主管等半小时内到达现场,确认故障情况,报应急办公室,办公室成员1小时内到达现场,指挥应急处理,并上报应急领导小组。

如果是主机故障,启动主机应急流程。

其他故障,办公室协同技术应急小组,制定应急方案,上报领导小组,并及时通知相关业务部门。

必要时应急领导小组到达现场指挥应急处理。

4.2.4 红色预警-一级预警的应急响应。

机房值班人员立刻上报应急办公室和应急领导小组,各技术应急小组、应急办公室、领导小组成员半小时内到达现场。

应急办公室通知相关业务部门,应急领导小组上报省分行主要领导。

应急领导小组组织应急方案,上报省分行主要领导,待方案批准后,领导小组统一指挥应急处理的实施。

4.3系统应急响应4.3.1 蓝色预警-四级预警的应急响应。

相关系统的技术维护人员在发现故障后,向运维主管报告故障情况,维护主管组织技术人员登陆故障系统查找、分析故障原因,制定故障处理方案并实施。

如果故障在48小时内无法解决或情况迅速恶化,升级为黄色预警。

4.3.2 黄色预警-三级预警的应急响应。

相关系统的技术维护人员在发现故障后,向运维主管报告故障情况,维护主管上报应急办公室,并在1小时内到达现场,组织技术人员登陆故障系统查找、分析故障原因,制定故障处理方案并实施,处理情况报应急办公室。

应急办公室及时汇总情况,并上报应急领导小组。

如果故障在2小时内没有得到解决,或情况进一步恶化,则升级到橙色预警。

4.3.3 橙色预警-二级预警的应急响应。

机房值机人员或相关系统的技术维护人员在发现故障后,通知运维主管,维护主管上报应急办公室。

运维主管组织技术人员半小时内到达现场登陆故障系统进行故障分析、诊断。

应急办公室上报应急领导小组,并发布故障预警级别,应急办公室和领导小组人员在半小时内到达现场。

应急领导小组组织应急方案的制定,并上报分行主要领导。

由应急办公室组织应急方案的实施,并及时向应急领导小组和分行领导汇报应急进展情况。

4.3.4 红色预警-一级预警的应急响应。

发生故障后,立刻报应急办公室和应急领导小组,由应急办公室发布红色预警。

相关应急小组尽快赶到现场。

由应急领导小组组织应急处理。

应急领导小组及时向分行主要领导上报应急处理情况。

五、后期处理在应急处理完成后,应急办公室要及时组织人员做好后期现场的整理、恢复工作,及时会同相关设备、系统厂商完成设备、系统的善后处理;总结应急过程中的问题,完善应急预案和应急处理流程,并及时整理、归档。

六、宣传、培训和演练应急办公室要定期组织相关的应急宣传和培训,不断加强安全意识。

定期组织应急演练,使相关人员熟悉应急流程。

加强技术培训,增强应急处理能力。

相关主题