企业IT运维服务指标体系目录1概述 (1)2术语和定义 (1)3指标体系表 (2)4指标模板 (4)5附则 (4)附录A 指标要求及计算公式 (5)I公司IT运维服务指标体系1概述1.1编制目的为推动公司IT运维服务的“一体化、规范化”管理,实现管控模式的转变,确保公司IT战略目标落地,构建科学统一的IT运维指标体系,特制定本指标体系。
1.2适用范围本指标体系适用于公司总部、各分子公司以及各分子公司下属单位。
1.3编制原则IT运维服务指标体系应当涵盖促进企业IT运维服务成功的关键因素,并进行定量的测量与分析。
1.4规范性引用文件下列文件中的条款通过本部分的引用而成为本部分的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本部分,凡是不注日期的引用文件,其最新版本适用于本部分。
Q/CSG11801.2-2008 公司信息分类和编码第2分册:公共信息分类和编码GB/T24405.1信息技术服务管理第1部分:规范GB/T24405.2信息技术服务管理第2部分:实践规则GB/T16680-1996 软件文档管理指南2术语和定义2.1指标是指对特定对象的目标进行衡量的单位和方法。
2.2KPI全称为关键绩效指标,是指为了衡量特定对象的关键成功因素而设定的衡量单位和方法。
2.3决策层本文所指的决策层是指对IT运维、服务战略进行决策的群体。
2.4管理层本文所指的管理层是指对日常IT运维、服务进行管理并提出决策建议的群体。
2.5执行层本文所指的执行层是指日常IT运维、服务过程中执行具体运维或服务任务的群体。
2.6周期指对指标进行分析的间隔时间,周期分七种:日、周、月、季度、半年、年、投运至今。
MTBF 计算周期默认为自投运累计至今,其他指标计算周期默认为月。
2.7权重指该指标在同类指标中的比重。
3指标体系表3.1运行指标3.2服务指标4指标模板5附则5.1本指标体系由公司信息部负责解释。
5.2本指标体系自2012年1月1日起执行。
附录A 指标要求及计算公式A.1 运行指标A.1.1 网络安全运行状况A.1.1.1 关键网络安全设备MTBFA.1.1.1.1 关键路由器MTBFA.1.1.1.1.1 单台路由器指标注:中断时长通过累加计算,同一采集周期内发生下列一种或多种情况,中断时长累加一次采集周期。
1) SNMP协议采集设备的当前正常运行时间(UPTIME)值小于上一次采集值;2) SNMP/SSH采集设备引擎/模块状态异常;3) 通过Ping测试,Ping超时或失败。
A.1.1.1.2 关键交换机MTBFA.1.1.1.2.1 单台交换机MTBF注:中断时长通过累加计算,同一采集周期内发生下列一种或多种情况,中断时长累加一次采集周期。
1) SNMP协议采集设备的当前正常运行时间(UPTIME)值小于上一次采集值;2) SNMP/SSH采集设备引擎/模块状态异常;3) 通过Ping测试,Ping超时或失败。
A.1.1.1.3 关键负载均衡设备MTBFA.1.1.1.3.1 单台负载均衡设备MTBF注:中断时长通过累加计算,同一采集周期内发生下列一种或多种情况,中断时长累加一次采集周期。
1) SNMP协议采集设备的当前正常运行时间(UPTIME)值小于上一次采集值;2) SNMP/SSH采集设备引擎/模块状态异常;3) 通过Ping测试,Ping超时或失败。
A.1.1.1.4 关键防火墙MTBFA.1.1.1.4.1 单台防火墙MTBF注:中断时长通过累加计算,同一采集周期内发生下列一种或多种情况,中断时长累加一次采集周期。
1) SNMP协议采集设备的当前正常运行时间(UPTIME)值小于上一次采集值;2) SNMP/SSH采集设备引擎/模块状态异常;3) 通过Ping测试,Ping超时或失败。
A.1.1.1.5 关键IPS/IDS MTBFA.1.1.1.5.1 单台IPS/IDS MTBF注:中断时长通过累加计算,同一采集周期内发生下列一种或多种情况,中断时长累加一次采集周期。
1) SNMP协议采集设备的当前正常运行时间(UPTIME)值小于上一次采集值;2) SNMP/SSH采集设备引擎/模块状态异常;3) 通过Ping测试,Ping超时或失败。
A.1.1.2 关键网络安全设备平均可用率A.1.1.2.1 关键路由器可用率A.1.1.2.1.1 单台路由器可用率注:中断时长通过累加计算,同一采集周期内发生下列一种或多种情况,中断时长累加一次采集周期。
1) SNMP协议采集设备的当前正常运行时间(UPTIME)值小于上一次采集值;2) SNMP/SSH采集设备引擎/模块状态异常;3) 通过Ping测试,Ping超时或失败。
A.1.1.2.2 关键交换机可用率A.1.1.2.2.1 单台交换机可用率注:中断时长通过累加计算,同一采集周期内发生下列一种或多种情况,中断时长累加一次采集周期。
1) SNMP协议采集设备的当前正常运行时间(UPTIME)值小于上一次采集值;2) SNMP/SSH采集设备引擎/模块状态异常;3) 通过Ping测试,Ping超时或失败。
A.1.1.2.3 关键负载均衡设备可用率A.1.1.2.3.1 单台负载均衡设备可用率注:中断时长通过累加计算,同一采集周期内发生下列一种或多种情况,中断时长累加一次采集周期。
1) SNMP协议采集设备的当前正常运行时间(UPTIME)值小于上一次采集值;2) SNMP/SSH采集设备引擎/模块状态异常;3) 通过Ping测试,Ping超时或失败。
A.1.1.2.4 关键防火墙可用率A.1.1.2.4.1 单台防火墙可用率注:中断时长通过累加计算,同一采集周期内发生下列一种或多种情况,中断时长累加一次采集周期。
1) SNMP协议采集设备的当前正常运行时间(UPTIME)值小于上一次采集值;2) SNMP/SSH采集设备引擎/模块状态异常;3) 通过Ping测试,Ping超时或失败。
A.1.1.2.5 关键IPS/IDS 可用率A.1.1.2.5.1 单台IPS/IDS可用率注:中断时长通过累加计算,同一采集周期内发生下列一种或多种情况,中断时长累加一次采集周期。
1) SNMP协议采集设备的当前正常运行时间(UPTIME)值小于上一次采集值;2) SNMP/SSH采集设备引擎/模块状态异常;3) 通过Ping测试,Ping超时或失败。
A.1.1.3 关键网络安全设备平均运行率A.1.1.3.1 关键路由器运行率A.1.1.3.1.1 单台路由器运行率注:中断时长通过累加计算,同一采集周期内发生下列一种或多种情况,中断时长累加一次采集周期。
1) SNMP协议采集设备的当前正常运行时间(UPTIME)值小于上一次采集值;2) SNMP/SSH采集设备引擎/模块状态异常;3) 通过Ping测试,Ping超时或失败。
A.1.1.3.2 关键交换机运行率A.1.1.3.2.1 单台交换机运行率注:中断时长通过累加计算,同一采集周期内发生下列一种或多种情况,中断时长累加一次采集周期。
1) SNMP协议采集设备的当前正常运行时间(UPTIME)值小于上一次采集值;2) SNMP/SSH采集设备引擎/模块状态异常;3) 通过Ping测试,Ping超时或失败。
A.1.1.3.3 关键负载均衡设备运行率A.1.1.3.3.1 单台负载均衡设备运行率注:中断时长通过累加计算,同一采集周期内发生下列一种或多种情况,中断时长累加一次采集周期。
1) SNMP协议采集设备的当前正常运行时间(UPTIME)值小于上一次采集值;2) SNMP/SSH采集设备引擎/模块状态异常;3) 通过Ping测试,Ping超时或失败。
A.1.1.3.4 关键防火墙运行率A.1.1.3.4.1 单台防火墙运行率注:中断时长通过累加计算,同一采集周期内发生下列一种或多种情况,中断时长累加一次采集周期。
1) SNMP协议采集设备的当前正常运行时间(UPTIME)值小于上一次采集值;2) SNMP/SSH采集设备引擎/模块状态异常;3) 通过Ping测试,Ping超时或失败。
A.1.1.3.5 关键IPS/IDS 运行率A.1.1.3.5.1 单台IPS/IDS运行率注:中断时长通过累加计算,同一采集周期内发生下列一种或多种情况,中断时长累加一次采集周期。
1) SNMP协议采集设备的当前正常运行时间(UPTIME)值小于上一次采集值;2) SNMP/SSH采集设备引擎/模块状态异常;3) 通过Ping测试,Ping超时或失败。
A.1.1.4 信息网络设备平均可用率A.1.1.4.1 局域网核心层网络设备可用率A.1.1.4.2 局域网汇聚层网络设备可用率A.1.1.4.3 综合数据网互联网络设备可用率A.1.1.4.4 互联网出口网络设备可用率A.1.1.5 信息网络设备平均运行率A.1.1.5.1 局域网核心层网络设备运行率A.1.1.5.2 局域网汇聚层网络设备运行率A.1.1.5.3 综合数据网互联网络设备运行率A.1.1.5.4 互联网出口网络设备运行率A.1.1.6 信息网络可用率A.1.1.7 信息网络运行率A.1.1.8 网络安全事件告警数A.1.1.8.1 状态类安全事件累计数A.1.1.8.2 网络攻击类安全事件累计数A.1.1.8.3 用户行为类安全事件累计数A.1.1.8.4 有害程序类安全事件累计数A.1.1.8.5 其他类安全事件累计数A.1.2 应用系统运行状况A.1.2.1 关键应用系统MTBFA.1.2.1.1 单个应用系统的MTBF注:1) 中断时长通过累加计算,故障通过用户模拟体验(如访问首页)探测,若响应时间超过阈值,中断时长累加一次采集周期。
A.1.2.2 关键应用系统平均可用率A.1.2.2.1 综合管理信息系统可用率注:1) 中断时长通过累加计算,故障通过用户模拟体验(如访问首页)探测,若响应时间超过阈值,中断时长累加一次采集周期。
A.1.2.2.2 营销管理信息系统可用率。