当前位置:文档之家› LIMS系统应急方案

LIMS系统应急方案

有色金属研究总院测试中心实验室信息管理系统应急方案北京XX天地科技有限公司20XX年11月第 1 页共29 页文档说明本文档是有色金属研究总院测试中心LIMS项目应急预案。

文档控制文档作者:XX创建日期:20XX年11月确认日期:控制编码:GRINM-RM-01当前版本:1.0更改记录:文件归档:目录目录 (3)1.1.目的 (4)1.2.前提条件 (4)2.紧急情况的发现与应急方案的启动 (4)2.1.紧急情况的发现 (4)2.2.应急方案的启动 (5)2.2.1.启动的条件 (5)2.2.2.应急启动的发布 (5)2.3.各类实验室负责人 (5)3.应急措施 (5)3.1.生产服务器发生故障 (5)3.2.实验室同步故障 (6)3.3.网络故障 (6)3.4.数据库故障 (6)4.操作系统相关维护 (8)4.1.数据库安装与配置 (9)4.2.数据库日志检查 (21)4.3.性能优化与配置 (22)4.4.数据库备份与恢复 (24)5.数据库备份与恢复方案 (25)5.1.备份方案 (25)5.2.恢复方案 (28)总体介绍1.1.目的有色院STARLIMS系统作为实验室信息方面的企业级管理系统,一旦因各种原因意外中断,对有色院其他的信息系统影响重大。

本文档的目的在说明如何应对系统的意外中断以及如何在系统恢复后保证数据的完整性。

另外讲明了STARLIMS系统的基本维护方式方法。

本文主要涉及的问题如下:⏹一旦发现不能进行系统的正常操作,最终用户首先应该如何操作?⏹根据业务处理的连续性要求,在有色院实验室信息管理系统中断的情况下,如何处理业务?⏹在有色院实验室信息管理系统恢复运行以后,最终用户应该如何操作以保证系统中数据的准确和完整?⏹数据库应该如何进行日常维护与备份数据采用哪种策略?1.2.前提条件本文档所述应急方案针对有色院实验室信息管理系统因意外原因不能被最终用户正常使用的情况,即有色院实验室信息管理系统服务器系统停机/中断或网络中断的情况,并且该情况持续超过业务连续性所允许的范围,如超过1个工作日,或者有色院实验室信息管理系统不能顺利地支持实验室管理业务,如不能完成实验室审核、同步等业务。

同时,本方案也可作为计划停机情况下或意外情况持续不超过1个工作日时,给与最终用户作为参考。

2.紧急情况的发现与应急方案的启动2.1.紧急情况的发现有色院实验室信息管理系统最终用户在发现不能正常申请、提报实验室时,首先请求所属单位现场技术支持人员,由现场技术支持人员将问题进行分析整理后,直接将问题提报有色院实验室信息管理系统维护人员。

有色院实验室信息管理系统维护人员在确认问题是由系统故障或者是外部环境故障所引发但又不能及时解决的前提下,应根据技术支持人员提供的预计问题持续时间,提交启动应急申请。

2.2.应急方案的启动2.2.1.启动的条件1)停电造成有色院实验室信息管理系统瘫痪超过4个小时;2)局域网的网络中断使有色院实验室信息管理系统瘫痪超过4个小时;3)有色院实验室信息管理系统应用出现故障,使系统停运超过4个小时;4)有色院测试中心STARLIMS系统应用出现故障,无法正常使用;5)大量的实验室提报、审批业务,超越了有色院实验室信息管理系统的工作负荷,系统无法正常运行超过4小时。

6)影响生产企业紧急提报实验室数据1小时以上;2.2.2.应急启动的发布由实验室管理系统项目组根据故障现象确认系统是否需要进行入应急状态,并报实验室管理办公室,由测试所领导批准。

实验室管理办公室下达应急方案启动令,业务支持人员指导整体业务应急方案的工作部署,各相关部门无条件配合做好应急工作。

各级管理组织从上到下协调一致确保系统恢复后及时和正确地将实验室补充录到系统中。

2.3.各类实验室负责人应急方案启动后,各类实验室由专人管理,负责协调与之相关实验室的各种情况处理。

3.应急措施本方案针对不同的情况,给出相应的应急措施,分述如下:3.1.生产服务器发生故障当系统运行的环境出现崩溃时,如服务器宕机,首先应有有色院实验室信息管理系统业务支持人员发出应急预警,然后针对不同的紧急事件,具体的应对策略如下:在生产服务器故障无法及时排除的情况下,可临时利用测试系统做为临时生产服务器。

由实验室项目组将最近的备份数据恢复到测试系统,实验室项目组检查日志服务器,从恢复点到系统故障点发生的实验室提报、审核、同步情况。

根据日志在测试系统中恢复相关实验室的提报。

通知各所属单位启用测试做为临时生产系统,应急期间通过测试系统提报实验室。

考虑到测试系统性能问题,在通知注明,如果所属单位有大批量数据提交时,需避开系统高峰使用期,以保证系统的稳定运行。

待生产服务器恢复后,将测试系统数据导出,并恢复到生产服务器中。

同时修改测试系统接口策略,指向相关系统的测试系统。

并及时通知各所属单位实验室提报人员。

在准备测试系统过程中,企业有紧急实验室需提报,经过与最终用户沟通不能等待情况下,由各类实验室负责人,通过手工方式在MYLIMS系统中或EXCEL数据文件将数据进行录入,待系统正常运行后,由系统维护人员将数据同步到实验室系统中。

3.2.实验室同步故障实验室在同步过程中,如果同步不成功,首先由有色院实验室信息管理系统项目组人员导出同步数据,然后将同步数据转交STARLIMS系统运维负责人,由STARLIMS系统运维人员手动导入同步数据。

针对不同的目标系统,具体的应急方案如下:3.3.网络故障当由于有色院测试中心网络故障,导致无法访问实验室管理系统时,实验室管理系统项目组可协调服务器管理人员,通过服务器本机登录系统,查询各类实验室的同步情况,并未同步的实验室导出。

当有色院实验室信息管理系统恢复后,清理系统通过手工方式同步的实验室,全部将同步标记标识为已同步。

3.4.数据库故障系统管理人员要关注Oracle数据库经常可能发生的故障,未雨绸缪。

Oracle经常的故障有数据文件误删除、磁盘损坏、操作系统故障等。

对于经常发生的故障,可参考以下应急预案。

1、做好数据备份2、检查数据库文件的状态DBA要及时查看数据库中数据文件的状态(如被误删除),根据实际情况决定如何进行处理,检查数据文件的状态的SQL如下:selectfile_name,status, fromdba_data_files;如果数据文件的STATUS列不是AVAILABLE,那么就要采取相应的措施,如对该数据文件进行恢复操作,或重建该数据文件所在的表空间。

3、数据库坏块的处理当Oracle数据库出现坏块时,Oracle会在警告日志文件(alert_SID.log)中记录坏块的信息:ORA-01578: ORACLE data block corrupted (file # 7, block # <BLOCK>)ORA-01110: data file <AFN>: '/oracle1/oradata/V920XXradata/V816/users01.dbf' 其中,<AFN>代表坏块所在数据文件的绝对文件号,<BLOCK>代表坏块是数据文件上的第几个数据块出现这种情况时,应该首先检查是否是硬件及操作系统上的故障导致Oracle数据库出现坏块。

在排除了数据库以外的原因后,再对发生坏块的数据库对象进行处理。

确定发生坏块的数据库对象SELECT tablespace_name,segment_type,owner,segment_nameFROMdba_extentsWHERE file_id = <AFN>AND<BLOCK> between block_id AND block_id+blocks-1;决定修复方法:如果发生坏块的对象是一个索引,那么可以直接把索引DROP掉后,再根据表里的记录进行重建;如果发生坏块的表的记录可以根据其它表的记录生成的话,那么可以直接把这个表DROP掉后重建;如果有数据库的备份,则恢复数据库的方法来进行修复;如果表里的记录没有其它办法恢复,那么坏块上的记录就丢失了,只能把表中其它数据块上的记录取出来,然后对这个表进行重建。

用Oracle提供的DBMS_REPAIR包标记出坏块exec DBMS_REPAIR.SKIP_CORRUPT_BLOCKS('<schema>','<tablename>');使用Create table as select命令将表中其它块上的记录保存到另一张表上create table corrupt_table_bakasselect * from corrupt_table;用DROP TABLE命令删除有坏块的表drop table corrupt_table;用alter table rename命令恢复原来的表alter table corrupt_table_bakrename to corrupt_table;如果表上存在索引,则要重建表上的索引4.操作系统相关维护4.1.数据库安装与配置oracle数据库的安装,首先要安装服务端在这里一般不勾选创建启动数据库,而在后面的DBCA里再创建数据库选择安装路径,建议安装在C盘根目录下,这样做了ghost以后,能够很快的恢复回来。

然后选择安装版本,默认选择安装企业版,安装全部组件。

检查安装信息,确认无误后点击确定,安装过程略过,进度条100%则安装成功。

安装完成以后,在程序菜单下有Oracle的菜单,找到并打开配置DBCA。

按照安装提示,下一步选择一般用途,下一步给数据库起一个全局数据库名,SID号和全局数据库名保持一致,下一步选择管理数据库的方法,默认即可设置默认的账号和密码默认使用文件系统来作为存储机制指定创建数据库的位置,即是存放你数据库文件的物理路径。

下一步选择数据库的恢复选项,也是默认就可以,不指定快速恢复区选择是否需要安装实例方案,不需要,所以不用勾选,下一步是初始化参数。

在这注意一点,内存选择自定义,共享内存管理也是自动,这样它就能根据物理上的内存容量,自行分配,不需手动修改,后面三个页签就不用修改参数,全部都是默认即可。

检查数据文件存放路径,没问题后下一步确认之前配置的各种参数,确认无误后点击确定下面oracle开始创建数据库,进度条100%后安装完毕。

安装完毕后,在程序下Oracle的菜单下,可见到NETCA的选项,点击进入里面四个选项,上面三个是需要配置的,首先从监听程序配置开始,为Oracle配置一个监听。

添加一个监听,然后为监听起一个名字。

下一步通过TCP协议来配置监听,选择此协议到右边的窗口。

相关主题