附件1:*****信息中心机房运维管理办法第一章总则第一条本管理办法以信息中心提高信息机房运维工作质量,加强日常管理工作为目得,保证机房得各类设施设备时刻处于良好得运行环境、设备安全稳定运行,确保“响应及时、保障一线”为原则,明确运维中心工作人员得职责分工与日常管理、告警及应急管理等内容。
第二条为完善信息中心机房工作管理办法,依据*****信息系统运行管理相关规定与《信息中心信息系统运行管理办法》,结合信息中心机房实际情况,特制定本办法、第三条本办法适用于信息中心机房得日常管理及故障处理等工作。
第二章职责分工第四条运维中心就是信息系统基础平台得运行维护部门,运维中心得机房运维工作人员为各信息机房提供7*24小时得现场保障、主要负责信息机房得日常值班、门禁权限得管理、机房设备管理、设备告警及各类故障得应急处理、第三章管理办法内容第一节权限管理第五条为加强信息机房得安全管理,提高安全管理水平,各信息机房大门、监控室、机房主要出入口、缓冲区、机房配电室、等出入口设置了门禁管理系统。
门禁系统将按照“分区管理、授权进出、规范管理"得原则进行管理、(一) 门禁授权管理分级1、一般授权:为8小时工作时间有效得门禁授权,工作时间以外及周六日无效、适用于普通工作人员使用。
2、特殊授权:为24小时工作时间有效得门禁授权,节假日有效。
适用于24小时现场职守人员及其她特殊需求工作人员使用。
相关工作人员因工作需要或其她原因需开通机房门禁授权得,首先要详细填写《信息中心机房门禁授权申请单》(见附件3)中得每一项内容,经相关领导允许并确认签字后,将《信息中心机房门禁授权申请单》原件返回给机房值班人员,由机房运维人员根据申请单情况,进行开通指纹授权确认、(二) 门禁授权审批流程:1、提交得申请表中需要明确填写申请原因,授权时间及授权范围等内容,申请表需申请人签字,经运维中心领导审批。
2、门禁授权办理。
通过审批得申请单,将由机房运维组为员工办理门禁授权系统。
员工在因长时间外出或离开本工作岗位时,需及时将其门禁授权予以清除或办理授权失效、日常管理及具体操作授权由机房值班人员负责。
已开通得门禁得申请单由机房运维组归档、管理、保存。
(三) 未经门禁授权登记进出得1、未经授权或经运维中心领导同意,工作人员不得私自带不相干得人员进入设有门禁得工作场所及机房、2、对于需要进入办公区域及机房内进行操作,办公得人员需经相关负责人同意并有指定得监护人进行陪同监护工作,方可进入,进入人员应按规定填写好《机房出入登记表》(见附件4)。
第二节机房设备管理第六条加强机房得安全管理,杜绝人为因素对机房造成影响,为设备提供安全得运行环境,保证机房内设备处于最佳运行状态。
1、机房内设备必须按照相关规定放置,并有明确设备标识、未经运维中心相关负责人批准,任何部门及人员不可以放置任何设备于机房内;2、设备得维护必须由专人负责,她人不可随意操作;设备需要停机检查时,须经运维中心相关负责人批准后,方可进行;3、机房维护终端不可安装各种与设备维护无关得应用程序,不可使用外来磁盘进行数据拷贝。
维护终端应该有明确得防病毒措施,定期进行检查。
4、机房内各种工具、仪表、小车等未经允许不准擅自带出机房,使用时需要填写《设备借用登记表》(见附件5),使用后归还原处。
第三节问题管理及缺陷管理第七条问题管理、缺陷管理得目得就是消除或减少机房运维工作中机房各设备发生故障事件得数量与严重程度,防止相同事件得再次发生,从建立一个稳定得运行环境,提高信息系统服务得可靠性、(一)问题管理包括主动性问题管理与被动问题管理两类活动。
前者得目标就是通过找出基础设施中得薄弱环节来阻止事件再次发生,以及提出消除这些薄弱环节得建议;后者得目标就是找出导致以前发生事件得根本原因,以及提出解决措施或纠正建议。
(二)问题管理、缺陷管理着重于消除事件或减少事件发生,确定事件得根本原因。
主要活动包括分析事件、找出问题、确定根本原因以及找出解决方案,以消除事件或在其发生时降低对机房环境与信息系统得影响。
(三)问题管理依赖于有效得事件记录,事件记录应记录所发生得事件,并对事件进行详细得描述、信息中心机房运维得事件记录有《机房巡检表》(见附件6)、《交接班日志》(见附件7)、《机房运维日汇报》(见附件8)、(一)机房运维负责人担当问题管理负责人,负责在问题与已知错误得整个生命周期内对其发展情况进行监控,确定并监控其影响度;监控问题与已知错误得分析诊断情况与方案实施情况。
(二)一旦找到问题得根源与与此问题相关得事项,以及处理它得应急措施。
并确定对问题最合适得解决方案进行修复解决。
第八条缺陷管理(一)机房运维人员对设备进行固定巡检、巡检时应注意检查设备状况,对于发现得缺陷,若可以随手消除得应即随手消除,事后在班组进行相应得记录;属不能随手消除缺陷得,应及时登录缺陷并汇报负责人、(二)通过巡检、操作与信息中心机房运维得事件记录,进行分析发现并记录设备缺陷,提出消缺要求,采取措施,为消缺工作顺利进行创造条件。
(三)对发现得重大缺陷,及时通知设备维修人员到现场进行消缺,部分必须在设备停用后才能消除得缺陷或没有消缺所必须得备品备件得缺陷时需要进一步观察、分析才能确认得缺陷,且暂时不会对设备、系统或人身安全构成立即得危害,也不会给业务运行带来严重损失得设备缺陷、(四)在设备缺陷未消除前组织运行值班人员加强检查监视,采取措施防止缺陷造成得影响扩大。
第四节安全管理第九条安全管理规定1.工作人员,没有操作票及监护人禁止进入信息机房进行任何操作,进入机房需填写“操作工作票”,征得相关负责人同意并签字,指定监护人后方可进入机房操作。
2.操作票当日签署当日有效,隔日需另签操作票。
操作票需填写清楚施工单位人员及联系方式,工作任务主要内容,工作时间,批准人及监护人签字。
3.机房内禁止吸烟,严禁存放与使用易燃易爆、剧毒及腐蚀性物品。
4.运维人员应切实遵守安全制度,认真执行用电、防火得规定,做好防水、防火、防爆、防盗、防雷、防冻、防潮等工作,确保人身与设备得安全、5.机房运维人员应加强防火安全学习,定期进行安全防火检查。
一旦发生火情,应按制定得灭火流程进行处理,并立即报告。
6.机房必须配备一定数量得合适消防器材与防护用具。
各种消防器材与防护用具应按规定定点放置,随时保持有效,过期得灭火装置及时更换、机房值班人员与维护人员应掌握灭火常识与消防器材得使用。
7.机房应有可靠避雷装置, 雷雨季节应加强对机房内部安全设备、地线及防护电路得检修与整改、8.在维护、测试、磁带更换、光盘更换、故障处理、日常操作以及工程施工等工作中, 应采取预防措施, 防止造成工伤与事故。
10、各种测试仪表与电器设备得外壳,要接地良好,插拨电路盘应使用抗静电手环。
高压操作时应使用绝缘防护工具,注意人身与设备安全、不同种类得电源应使用不同得插座。
11、各机房应在显眼处张贴消防逃生示意图与机房灭火流程、12、机房用电须经相关负责人批准, 指定用电接点后, 方可接电。
第五节值班管理及日常管理第十条为保证机房设备得正常运行,维护日常工作秩序,特制定机房值班管理与日常管理办法:1.值班时间为:周一至周日全天值班。
2.值班范围包括公司本部各信息机房内得监控区、设备区、UPS区、电池区;确保每个区域环境正常与设备得稳定运行。
3.值班人员必须认真履行职责,加强责任感,保持警惕。
4.值班人员须按时到岗离岗,不得迟到早退空岗、有事须事先请假,以便安排临时替代人员,不准私自让她人代班、调班。
5.值班前及在岗期间不得饮酒,不得使用中心设备处理与工作无关事务与个人事务,不得将无关人员带入岗位、6.值班人员必须定时按巡视内容要求对机房各区域进行全面巡查,并填写相应巡检记录表及交接班登记表、7.值班人员在值班期间遇到有人访问机房时,须要求对方出具操作票,并有监护人进行全程陪同监护。
当遇监护人不在现场时,值班人员有权利与义务终止访问人进行机房内得任何操作、8.值班期间一旦发生突发事件,值班人员必须迅速分析原因并按操作程序采取有效措施予以处置,不得以任何理由推诿、拖延障碍处理时间,必要时根据应急预案联系设备厂商,重大问题要及时向机房负责人报告,并详细做好记录。
9.值班人员必须熟悉掌握所有设备得工作原理,操作程序,熟悉应急预案、应急程序及应急措施、10.值班人员未经主管人员批准,不得擅自更改网络与主机设备等配置参数、机房内得设备、配件、软件、资料等任何物品不允许私自带出机房。
第六节告警管理及应急管理第十一条告警级别设定根据机房设备得重要性,及影响信息系统运行得严重性,现将机房告警分为以下三个级别:1.主要告警:包括通风设备组(新风机、排风机得报警为主);2.严重告警:包括空调及环境监控设备组(精密空调、机房专用柜机空调、温湿度、漏水监测、防雷器);3.紧急告警:包括消防、供配电、UPS设备组(消防系统控制箱、UPS、蓄电池、配电开关状态、动力配电柜、ATS 状态)。
第十二条告警及应急管理1.值班人员必须按照规定定时巡检,巡检项目包括:机房空间各处安全隐患,各设备有无异常气味、声音,各设备供电状况,各设备指示灯,强电箱供电状况,UPS运行状况,空调运行状况,设备间温湿度状况,消防控制器状况,视频监控状况,机房前后门状况等等、2.机房各处安全隐患包括空间内有无异味、火花等异常状况、有异味时应尽可能找出根源,及时处理。
根据源头材质用正确得方法消灭隐患。
3.各设备供电情况与指示灯状况包括查瞧各类设备就是否正在运行,有无供电报警状况,供电不正常时,检查相应供电源头状况,机柜PDU、航空插头等,并根据《*****机房电源、空调等物理设备故障现场处置预案》(见附件2)启动相应得应急预案。
4.UPS运行状况主要查瞧监控器上输入输出电压电流及其负载,强电输入就是否异常报警,电池模块指示灯就是否正常。
若出现强电输入异常报警情况,立即查瞧电源输入强电箱就是否异常,并根据《*****机房电源、空调等物理设备故障现场处置预案》(见附件2)启动相应得应急预案。
5.检查精密空调运行状态,包括温度、湿度、故障报警等。
若出现温度过高,空调故障报警时,应根据《*****机房电源、空调等物理设备故障现场处置预案》(见附件2)启动相应得应急预案。
6.消防控制器状况包括面板各项指示灯就是否正常,就是否因为不同问题报警,并采取必要措施。
若出现烟感或温感误报得情况,排查确认无隐患后取消报警,并在交接班时说明情况,以便及时修理、若同时报警,在最短时间确认就是否为火灾后,采取相应措施,应根据《*****机房电源、空调等物理设备故障现场处置预案》(见附件2)启动相应得应急预案。
第七节文档管理第一条建立信息机房基础设施清单这部分内容包括机房内设备得名称、型号、数量、投运时间、放置地点等有关记录。