当前位置:文档之家› 业务系统运维服务水平协议(SLA上传)

业务系统运维服务水平协议(SLA上传)

附件三YYYY系统运维服务水平协议(SLA)XXX公司名称约定XXX公司,以下简称“XXXX”;深圳市YYY公司,以下简称“YYYY”。

专有信息声明本文件属于商业机密文件,书中的所有信息均为机密信息。

务必妥善保管并且仅在与合同、项目有关人员范围内使用,未经明确做出的书面许可,不得为任何目的、以任何形式或手段(包括电子或机械复印、录音或其他形式)对本文档的任何部分进行复制、存储、引入检索系统或者传播。

本文件包括YYYY服务工作详细内容和方法。

如果工作内容或者需求有所变化,则需要双方签署内容变更协议或说明,并在本文件未来版本中体现。

版权说明本文件中出现的任何文字叙述、文档格式、插图、照片、方法、过程等内容,除另有特别注明,版权均属XXXX所有,受到有关产权及版权法保护。

任何个人、机构未经XXXX的书面授权许可,不得复制或引用本文件的任何片断,无论通过电子形式或其他任何形式。

本文档提及的其他公司、产品和服务的名称,各自是其所属公司的商标或服务的标志。

目录1.概述 (5)1.1目的 (5)1.2协议期限 (5)1.3范围 (5)2.定义 (6)2.1通用概念 (6)2.2可用性 (6)2.3交易成功率 (7)2.4服务等级 (7)2.5问题等级 (8)2.6问题上报及处理等级 (9)2.7系统监控 (10)2.8监控提前率 (10)2.9监控准确率 (10)3.服务的管理 (11)3.1服务监督委员会 (11)3.2服务审核联席会议 (11)3.3每日生产运行报告 (11)4.服务水平 (12)4.1问题与故障跟踪 (12)4.2应用管理服务 (12)4.2.1 需求响应服务时间 (12)4.2.2 应用程序补丁 (13)4.2.3 应用系统功能指标 (13)4.2.4 应用系统指标 (14)4.3网络管理服务 (15)4.4主机管理服务 (16)4.5技术支持服务 (17)4.6机房监控服务 (18)4.7终端维护服务(可选) (19)4.8数据容灾服务(可选) (19)5.罚则 (20)1.概述1.1 目的XXXX在服务方面拥有完善的人员、技术及流程,能保障客户企业系统环境的稳定性、可用性及连续性,并能及时反映和衡量所有关键服务指标或服务水平。

XXXX通过在服务方面所采取的先进技术、工具和一系列的服务管理标准与流程,能最大限度实现并保障客户在服务后的需求和利益。

服务水平协议(Service Level Agreement: SLA)对所有相关的服务单元提供了一个可见的和可衡量的控制机制,同时清晰界定了相关的责任和目标。

本文档是基于XXXX与YYYY之间制订的IT系统整体服务工作说明书,对XXXX所能提供的服务水平及内容进行描述和定义。

本文档所描述的内容在双方商讨后将会被进一步完善,并最终由YYYY和XXXX共同签署确认。

此外,需要注意的是,在整个YYYYIT系统整体服务过程中将会定期审核一些关键指标和服务内容,具体的审核日期由双方共同商定,同时会根据审核情况进行完善与修订。

1.2 协议期限本服务水平协议将在双方确认并签署后生效。

在协议签订后,对服务水平的任何改变须经双方同意,并通过变更管理程序付诸实施。

服务水平协议期限为双方签署的服务合同期限。

1.3 范围本服务水平协议涵盖YYYY IT系统整体服务的管理,包括以下8个核心内容:(1) 问题与故障跟踪(2) 应用管理服务(3) 网络管理服务(4) 主机管理服务(5) 技术支持服务(6) 机房监控服务(7) 终端维护服务(8) 数据容灾服务2.定义2.1 通用概念(1)计划服务时间:指根据设备或者服务本身所界定的合理工作时间,通常指有效营业时间,没有特殊所指,也称为服务时间。

(2)计划外故障时间:指不能为用户提供服务的时间,如主机或网络故障,但不包括单个的终端故障时间。

(3)计划内维护时间:指暂停服务来调整系统的运转状况,如进行硬件和软件的更换、升级、维护等活动。

除非有紧急境况(如设备损坏需要更换),至少需要提前3天通知用户并得到用户许可后才能暂停服务。

(4)交易响应时间:指一笔业务从开始办理到办理完毕所花费的时间。

2.2 可用性定义:指系统在有效营业时间内能够提供正常服务时间的百分比,也叫可用率。

计算方法:可用性 = 计划内维护时间计划服务时间计划内维护时间计划外故障时间计划服务时间--- ×100%备注:a) 系统服务性能的部分下降不计算在内(如用户设备或本地控制器的故障影响了部分用户的操作)。

b) 延长服务时间请求必须通过服务热线进行(22:00点之前),该请求将会提交给服务提供方进行确认。

c) 该服务时间的延长将不参与原定的服务水平衡量。

d) 根据可用性所计算出来的时间,一定要根据实际情况进行统计,不能是一次性集中发生在一起的情况。

2.3 交易成功率交易成功率将依据交易等级进行划分,每一等级交易的响应时间都将被记录,交易响应时间正是基于上述统计数据进行计算。

定义:指金融交易成功完成的百分比。

计算方法:可用性 =交易总笔数交易总成功笔数 ×100% 备注:由于第三方或者外联单位的问题导致的失败交易笔数不累计在交易总笔数内。

2.4 服务等级表格 1 服务等级分类说明表2.5 问题等级表格 2 问题等级分类说明表2.6 问题上报及处理等级表格 3 问题上报矩阵示意表格 4 问题上报等级时间与范围分类说明2.7 系统监控系统监控是指使用监控软件(包括网管软件、安全软件、数据库监控软件、主机监控软件、应用监控软件等),对操作系统、数据库、中间件和网络等进行定期监控,并收集相关数据。

大部分的监控指标可以用于衡量或者测算系统运行状况。

2.8 监控提前率定义:使用监控软件,对各类系统进行监控,所能够提前发现问题的百分比概率。

计算方法:监控提前率 =总监控报警数量未能及时报警数量总监控报警数量- ×100% 备注:由于监控软件出现停止运行或者错误报警的情况也需要计算在内。

2.9 监控准确率定义:使用监控软件,对各类系统进行监控,所能够提前发现报警是合理正常的报警的概率。

计算方法:监控准确率 =总监控报警数量错误报警数量总监控报警数量- ×100% 备注:由于监控软件出现停止运行或者错误报警的情况也需要计算在内。

3.服务的管理3.1 服务监督委员会YYYY与XXXX将统一建立起联合的服务监督委员会(以下简称“服务监督委员会”),用来推进长期的服务规划,并定期对向YYYY客户所提供各项服务的优先级、目标和实现情况进行审核。

服务监督委员会由YYYY指定的高级管理层和XXXX管理层组成,服务监督委员会每季度至少组织一次会议。

服务监督委员会针对XXXX的服务支持和工作情况,制定并通过一个长期的策略和一份覆盖12个月的滚动计划。

XXXX会通过年度审核来协助服务监督委员会对计划的执行和实施情况进行评估。

服务监督委员会构成:YYYY 5席,XXXX4席。

委员会以投票方式确定季度服务评估报告。

3.2 服务审核联席会议在检测相关系统运行情况时,XXXX员工应遵照标准流程记录并报告错误。

XXXX和YYYY每月将联席召开服务审核联席会议,该会议用来审核前一月的服务执行情况以及下一个月的计划活动,还将讨论上一次服务审核联席会议中未解决的事宜。

服务审核联席会议每年应不少于6次。

YYYY需要指派一位高级管理人员主持服务审核联席会议,在此期间,XXXX 将准备每月的服务报告,该报告将在当月的服务审核联席会议上提交。

根据YYYY业务需要的变化,或者为了更好地进行管理,YYYY和XXXX在双方达成一致的情况下,修改每月的产品支持服务报告内容与格式。

3.3 每日生产运行报告XXXX需每日提交上一日的生产报告,以严格记录服务交付中遇到的问题和相关事宜,包括但不限于以下信息:(1)生产异常终止的次数和原因(2)硬件故障(3)输入/输出的延迟交付(4)电信故障(5)物理环境故障(6)应用软件平衡问题(7)重新运行和重启4.服务水平4.1 问题与故障跟踪在XXXX向YYYY提供IT系统整体服务的整个服务周期内,所有报告的故障、事故将被登记到缺陷/变更管理软件中,以便记录和跟踪。

在与YYYY进行充分的沟通并确认后,XXXX数据中心将把每个问题、故障分配给适当的部门,由他们来酌情解决问题。

所有的问题、故障都将被予以保留,直到YYYY管理部门认可该问题已经被解决,并签字确认。

4.2 应用管理服务4.2.1 需求响应服务时间备注:在向客户提交人天工作量及相关应用修改计划后,客户负责批准是否施行并下工作单。

表格 5 需求响应服务时间分类说明表4.2.2 应用程序补丁针对应用软件运行中出现的更新与相关问题,进行程序修正,使软件更健壮并符合新的业务和功能需求。

表格 6 应用程序补丁修正情况分类4.2.3 应用系统功能指标表格7 应用系统功能指标说明4.2.4 应用系统指标(可根据实际情况更改)表格8 应用系统指标分类说明4.3 网络管理服务网络管理服务包括所有数据中心与分支行及网点之间的通讯连接。

备注:电讯服务提供商不承诺对服务水平的提供,因此由于运营商的原因,或者由于线缆原因产生的故障不计算在内。

表格9 网络管理服务分类说明4.4 主机管理服务(可根据实际情况更改)主机系统是指为各类应用提供运行环境的服务器及其配套或相关设备。

表格10 主机系统服务管理等级分类说明4.5 技术支持服务为客户提供一个集中的统一联络点,拥有一站式的技术支持服务中心,提供优质、高效的支持服务。

为了提供最好的服务,将设置热线支持中心。

对服务提出者提供建议和指导,以及按照商定的业务优先级和受理方式,以对客户产生最小的业务冲击的方式,为正常运营的恢复提供便利。

促使客户有效率地使用IT服务,帮助IT尽快恢复正常服务,以及主动地将潜在的服务中断告知用户。

服务热线支持范围:o记录每一问题的发生o对问题进行分派,由合适的专家进行解决o跟踪问题的状态o通知用户问题的解决方式o存档所发生的问题及解决方案表格11 技术支持服务分类说明4.6 机房监控服务表格12 机房监控服务分类说明4.7 终端维护服务(可选)表格13 终端维护服务分类说明4.8 数据容灾服务(可选)一个清晰完整的灾备恢复方案对于任何一个灾备系统的成功应用具有至关重要的作用。

数据容灾只针对生产系统,恢复后的系统可以达到原有系统70%的处理能力-即灾备恢复功能不等同于恢复100%系统处理能力。

恢复时间目标:Recovery Time Objective (RTO)恢复时间点目标:Recovery Point Objective (RPO)表格 14 数据容灾服务分类目标5.罚则(待定)执行以下罚则的条件:1. 乙方为甲方建设并运维的IT 系统,系统正式投产运行后开始执行该罚则。

相关主题