服务事件管理1目的事件管理流程的目的是尽快解决IT环境中的突发事件,保障IT系统的稳定性,提高服务质量,为业务的发展提供更优质的IT服务,并且可以有效实施其他相关ITSM 管理流程,如问题管理流程。
通过本文档的定义,建立一个完整的事件管理系统,从而实现:1)减小突发事件对业务的影响●在成本允许的范围内尽快恢复IT服务●快速响应服务请求(电话/Web/邮件等)2)提高用户工作效率3)提升客户满意度4)进行事件有效控制●按规范记录事件,避免事件丢失●就事件的优先级,影响度进行分类●分析,诊断,必要时进行升级●监视并结束事件●进行定期服务流程回顾5)提供IT管理信息●人力资源利用情况,从而更好使用人力●支持效率●IT系统故障处理情况●给准确信息至配置管理数据库(CMDB)●服务报告2适用范围事件管理的范围包括ABC软件股份有限公司合同范围内的客户的IT生产和运行环境中发生的故障事件、用户的服务请求,具体如下:1)故障申告●用户报告的故障事件●监控系统的报警事件●IT服务人员监测、检测的故障事件●其他人员转告的用户故障事件2)服务请求●信息咨询,主要包括:客户在IT信息系统建设,运维管理,IT产品,系统使用等方面提出的咨询请求●业务支持请求,主要包括:会议支持请求,庭审支持请求,远程提讯支持请求,系统培训支持请求●辅助配合,主要包括:领导交办任务及第三方配合的服务请求事件管理的范围不包括客户提出的、合同范围之外的相关请求,以及投诉事件和ABC软件股份有限公司内其他部门的工作任务。
3术语定义3.1事件用户在信息系统使用过程中,在合同范围内可能导致这个服务的中断或服务质量下降的任何事件,包括故障申告,服务请求等。
3.2事件管理降低或消除正常提供IT服务时产生的干扰因素,通过一些变通方案,降低影响,尽快恢复客户业务应用,保障用户能够尽快重新工作。
3.3服务请求服务请求类事件是指客户希望从服务台得到的业务支持、信息咨询、辅助配合或者文档方面的请求。
3.4事件升级当某一事件不能在规定时间内解决,那么就需要更多经验、更高权限人员和资源参与解决,从而确保事件得到解决。
3.5同一事件同一事件是指在单一客户申告的统一来源(IT系统、应用系统)同一个配置项上相同事件现象的已创建且尚未解决的事件。
4岗位与职责4.1事件经理●通过服务台来确保客户满意;●确保事件快速解决;●出现紧急、重大事件时,负责协调外部资源尽快解决;●当事件优先级为紧急或者事件将超过规定的时限,负责按照升级方法对事件进行处理确保有效协调资源,促进各类角色小组(如一线支持、二线支持)快速恢复正常服务;●确保正确和广泛地收集和分析事件数据,发现IT和业务相关的问题;●确保与问题管理、外部供应商等部门的有效合作。
4.2一线工程师●作为客户事件沟通的唯一联系点;●在指定的响应时间内响应所有服务台热线电话、邮件、工单等事件报告;●正确、完整记录所有接收的事件信息,包括:记录事件报告人的详细联系方式、事件特征表现、描述、发生时间等;●为事件进行适当的分类、为事件分配优先级等属性;● 进行初步支持;● 检查事件记录的处理进度,保持与用户的联系,适时通知事件处理进展; ● 在事件处理过程中,催办事件处理进度;● 与用户确认事件解决方案及用户满意度反馈,关闭事件; ● 结束事件,更新信息;● 把事件的影响降低到最小,并确保快速回复到正常服务水平; ● 尝试使用知识库、初步诊断、分析相关信息等方式解决事件; ● 根据解决方案进行IT 服务的解决与恢复;● 如事件无法解决,将事件进行升级,并寻求事件经理的支持;4.3 二线工程师● 接收和处理升级事件;● 把事件的影响降低到最小,并确保快速回复到正常服务水平; ● 及时提供有效解决方案;● 与其他二线小组合作,确定解决方案;● 如果事件无法解决,将事件升级,寻求事件经理的支持; ● 已解决的事件转回服务台,由服务台关闭事件;● 进行问题的深入调查研究,找到问题根本原因,并提出解决方案;● 收集有关事件解决方案,并将事件、问题解决步骤文档化,并录入知识库系统。
5 程序准则5.1 执行准则5.1.1 常规原则● 服务台作为事件总负责人,监督事件的处理,负责事件的提起与关闭;进行事件的深入调查研究;确定事件的分类、分级和关联配置项;● 根据经验和专业技能,决定需要采取何种措施恢复服务并实施有效的行动; ● 必要时引入供应商的支持;● 根据解决方案进行IT 服务恢复;●从事件记录时起至事件关闭时结束,事件全生命周期监控事件的影响及处理情况;●所有事件都应该被记录在紫光华宇业务系统中,记录的信息应足够详细,包括事件处理交互过程,详细的解决方案和相应的信息;●所有IT支持人员按照服务级别协议规定时限对事件进行处理,当事件冲突时,对优先级为重大紧急的事件所采取的服务恢复行动,在比对其它行动的时候,将拥有优先处理级别,如果优先级别相同,则优先处理相对简单事件;●安全事件发生时,严格遵循服务安全管理程序的原则,通过事件管理流程进行事件管理;●事件处理过程中,应持续保持与客户的沟通,通知客户事件处理进展;●应该每月产生事件管理报表,对重复发生的事件和变通方法解决的事件,应该举行定期的事件管理会议对这些事件进行评估;●应该半年对流程进行回顾,回顾内容包括流程关键衡量指标、流程执行效率和流程支持工具的有效性,以改进事件管理流程。
5.1.2升级原则制定升级原则的目的是确保事件在规定的解决时限内能够及时通知相关技术人员和领导,引起更多的重视,提供合适的资源,从而快速找到解决事件的方案。
●优先级为紧急的事件,由一线工程师确认,如果确认了优先级为重大、紧急,则立即升级到事件经理,并通知相应的管理层(通过IT服务管理平台),由事件经理启动紧急事件处理流程●各支持人员应及时响应和处理分配到本组或自己的事件单,如果超出规定的解决时限,服务台应将事件信息升级至二线工程师进行支持,如果二线工程师超过解决时限,则通报事件经理,事件经理负责协调资源,并督促事件能够及时被响应和处理●服务台应及时将不能解决的事件升级到下一级,若未及时升级,事件经理应及时介入,负责协调升级处理5.1.3关闭原则由IT用户申报的事件单,关闭必须由服务台完成。
●已关闭的事件单不允许重开,如果事件重复发生,则创建一个新的事件单。
●事件处理人员在解决完成事件时,根据实际解决情况填写事件的结束代码,采用临时措施恢复服务时,结束代码为"变通关闭";由IT用户认可获得关闭的事件单的结束代码为"成功关闭";●监控平台产生的事件发送到服务台,由服务台分派处理人员解决并关单。
5.1.4流程关联原则事件管理与问题管理、变更管理、发布管理、配置管理存在以下关联原则:●和问题管理的关联通过临时解决方法解决的事件在恢复客户IT服务后,都应该创建问题单,问题单需和事件单建立关联。
●和变更管理的关联事件处理过程中,如果需要对系统进行变更,必须按照变更管理的定义,提交变更请求单(变更单必须和事件单建立关联),变更完成后,继续事件单的处理。
紧急事件(优先级为紧急的事件,下同)的处理过程中,如果需要对系统进行变更,必须按照变更管理的定义,提出紧急变更请求,变更完成后,补录紧急变更单,并和紧急事件单建立关联。
●和配置管理的关联事件处理过程中,可以通过配置管理查询相关的配置项信息以及该配置项历史上发生的事件或变更,来帮助故障的定位。
事件处理过程中,如果可以将故障定位到某个配置项,则必须将事件单与该配置项关联。
和发布管理的关联发布工作结束后,可能触发新事件的产生。
发布管理应向事件管理提供发布相关信息,包括:年度发布计划,发布信息等。
5.2输入及入口准则5.2.1入口准则ABC软件股份有限公司合同范围内,用户通过电话、邮件、传真、企业cocall协作系统等方式进行的事件请求、IT环境中监控系统告警、服务人员巡检过程中发现或其他人员转告的事件请求。
5.2.2输入5.3输出及出口准则5.3.1出口准则由客户提出的事件,关闭时必须通知IT客户。
5.3.2输出此为事件管理主流程。
事件管理流程帮助迅速解决用户事件,并最小化事件对于业务的不利影响。
流程始于事件的接收和报告,结束于经过用户确认的事件解决。
1)服务台(一线工程师)接收用户事件请求并记录事件信息,根据事件信息对事件进行分类,标识事件的紧急度、影响度和优先级;2)服务台(一线工程师)查看知识库对事件进行匹配,对事件进行调查与分析,尝试解决,并根据实际情况决定是否要升级为问题;3)当超过时限内无法解决则分配给二线工程师进行处理,二线工程师引用知识库,调查并诊断事件,并根据实际情况决定是否要升级为问题;4)事件解决完成后,记录详细的分析、诊断过程和解决方案;5)通告用户问题解决,关闭事件并选择性更新知识库和提起新问题;6)服务台(一线工程师)判定事件的紧急度、影响度和优先级高,提交至事件经理协调相关资源进行处理;7)服务台(一线工程师)判定事件为服务请求类事件,进行服务请求的支持活动8)服务台(一线工程师)判定事件为变更请求类事件,提交变更流程进行管理;9)服务台(一线工程师)判定事件为客户投诉,合同外的新增请求,安全事件,其他部门任务等事件,转交其他流程进行管理;10)事件全生命周期监控对整个事件处理过程进行监控。
6工作程序6.1事件管理流程6.1.1流程描述6.1.2错误!未指定书签。
流程图6.1.3流程说明6.1.4裁剪说明6.2子流程1:事件记录与分类6.2.1流程图6.2.2流程说明6.2.3裁剪说明6.3子流程2:一线尝试解决6.3.1流程图6.3.2流程说明6.3.3裁剪说明6.4子流程3:二线尝试解决6.4.1流程图6.4.2流程说明6.4.3裁剪说明6.5子流程4:记录详细解决方案6.5.1流程图6.5.2流程说明6.5.3裁剪说明6.6子流程5:服务请求管理6.6.1流程图6.6.2流程说明6.6.3裁剪说明6.7子流程6:紧急、重大事件管理6.7.1流程图6.7.2流程说明6.7.3裁剪说明6.8子流程7:事件关闭6.8.1流程图6.8.2流程说明6.8.3裁剪说明7相关二级文件Q2-CS-02《服务问题管理》Q2-CS-03《服务配置管理》Q2-CS-04《服务变更管理》Q2-CS-05《服务发布管理》8三级文件8.1质量记录模板8.2文档模板Q3-CS-01-01《服务事件单》Q3-CS-01-02《服务工作记录》Q3-CS-01-03《服务事件故障报告》Q3-CS-01-04《服务事件统计分析报表》8.3规则、惯例和约定Q3-CS-01-11《事件分类规则》Q3-CS-01-12《事件分级规则》Q3-CS-01-21《服务行为规范》Q3-CS-01-22《生产系统操作规范》Q3-CS-01-23《ABC应急预案》8.4检查单。