当前位置:文档之家› 智慧IT运维管理体系总体设计

智慧IT运维管理体系总体设计

智慧IT运维管理体系总体方案目录1项目需求分析 (5)1.1项目预期与目标 (5)1.2对项目的解读与理解 (6)1.2.1强化主动监控,实现集中管理 (7)1.2.2快速定位故障,减少维护成本 (7)1.2.3提升主动管理、辅助分析决策 (7)1.2.4直观运行展现,快速指挥调度 (8)1.2.5规范日常流程,有序高效协作 (8)1.3主要问题、重点及难点的阐述 (8)1.3.1实现统一监控、处置及展现 (8)1.3.2完整、有效、统一的配置管理库 (9)1.3.3符合ITIL规范的基础服务流程 (10)1.3.4可灵活定制的运维流程引擎 (11)1.3.5通过服务目录、服务级别管理提升运维服务质量 (11)1.3.6简单易用的报表设计器 (12)1.3.7统一的运维服务门户 (12)1.3.8面向不同运维视角的个人工作台 (13)1.3.9完善、严格的权限和认证管理 (13)1.3.10标准、灵活的开放接口和扩展需求 (14)2体系及制度建设 (16)2.1参考标准与方法论 (16)2.1.1运维体系参考标准规范 (16)2.1.2IT运维管理成熟度分析 (17)2.1.3运维体系建设方法论 (20)2.2运维管理体系规划 (23)2.2.1运维管理规划目标 (23)2.2.2运维管理总体规划 (24)2.3运维管理管理制度建设 (25)2.3.1运维流程管理规范 (26)2.3.2IT运维操作管理规范 (26)2.3.3进行运维服务提升评估 (26)3技术方案 (28)3.1总体设计方案 (28)3.1.1总体设计技术路线 (28)3.1.2系统总体功能架构 (29)4合理化建议 (32)4.1配套流程规范制度是IT服务平台有效运转的基石 (32)4.2面向最终用户的对外运维门户实现IT服务能力的延伸及自助服务模式的培养 (33)4.3基于知识库实现运维工作的自助化与智能化 (35)1项目需求分析1.1项目预期与目标通过本次项目建设,将实现以下建设目标与成果:(1)体系及制度建设协助用户建立公司信息化建设的运维管理体系,基于云南财政信息化的具体情况,结合国家的相关标准,制定行之有效的管理规范和制度,并与运维管理系统相结合,落实IT运维管理的信息化系统建设,实现运维管理工作的规范化、体系化。

(2)设备及网络监控确保公司数据中心IT基础设施和应用系统正常、安全、高效运行,方便科技信息处随时了解各个系统的运行情况,从应用角度实现对各个关键系统的实时监测,在系统发生故障时能够迅速反应,相关人员能够及时获取相关的预警信息,定位异常发生的位置和可能的原因,以便快速响应和处置;(3)业务系统监控实现公司业务系统运维管理的主动化和体系化,以预防为主,通过实时的监测和分析发现系统潜在的问题和风险,实现主动式运维管理,最大程度减少事故的发生,为实现运维管理的流程化奠定基础;通过定制化接口开发,实现对系统稳定性、性能、数据准确性的实时监控,并将运维管理的监控数据、流程数据导出到财政数据仓库;基于堡垒机完成运维审计;(4)标准化运维服务为保障公司一体化系统对财政业务的支撑,需要建立标准的系统运维的日常管理流程,借助运维服务系统,提升一体化系统运维管理的有效性、及时性、可跟踪性,满足财政、预算单位、银行等一体化系统用户的日常服务要求,并满足未来扩展到其他业务系统的管理要求;通过集成方式,实现客户端机器的远程托管服务,通过在线分析客户端系统环境与操作表现,快速定位、解决用户提交的问题;(5)厅内信息化事务管理科技信息处人员编制偏少,需要通过实现部分日常服务工作信息化建设,提升工作质量与工作效率,最急迫的工作事项包括电子设备资产管理以及信息化建设项目的全流程管理。

(6)呼叫中心建设针对当前固定客服电话呼损率比较高的情况,需建立标准化的呼叫中心,在前端完成对用户日常服务请求呼入的响应、记录、处理及转发工作。

呼叫中心暂时仅需支持一体化系统的服务请求,需要满足未来的扩展要求。

1.2对项目的解读与理解结合信息化建设现状,借鉴科学的运维体系建设方法论,通过建立基本符合ITIL规范的事件管理流程和问题管理流程提升运维过程的故障申告、处理的质量和效率,增强故障处理的透明性和可控性,实现运维过程中的事件管理和问题管理的流程化、可视化,提高整体运行维护水平。

树立面向业务服务的IT服务管理理念,实行集中统一的IT服务管理模式,由分散管理向集中管理转变;建立统一高效灵敏的综合运维管理平台,由无序服务向有序服务转变;建立规范标准的IT服务管理流程,由职能管理向流程管理转变;应用先进、实用、高效的IT服务管理工具,由被动管理向主动管理转变;建立科学合理的绩效考核指标,由粗放管理向精细管理转变。

因此项目的核心需求包括:1.2.1强化主动监控,实现集中管理将根据现状和需求进行统筹规划,本着“从实际需要出发,保护已有投资”的原则,将目前已有的、针对网络、服务器、安全、数据库、中间件的分散式监控管理系统,以及数据处理中心的动力与设备环境监控系统、视频监控系统整合、集中到一个统一的监控系统平台进行监控、告警、性能、展现管理,实现网络、业务资源、业务应用的全面集中监控,构建统一集成的系统资源监控平台,主动、及时地发现问题,解决被动服务的局面。

1.2.2快速定位故障,减少维护成本通过统一事件处理平台,收集全部的监控和状态信息,建立集中的告警分析处理机制和故障预警机制,提供自动化的事件处理能力,当故障产生时,可以快速定位故障,很快发现问题根源并找到相应的解决方案,从而缩短故障解决时间,减少维护成本。

另外,通过可灵活设置各事件的关联和互动关系,按照应用系统进行划分处理,建立“五位一体”的综合监控平台。

1.2.3提升主动管理、辅助分析决策利用IT系统集中监控管理平台综合监控管理系统全面主动反映信息系统的运行健康情况,通过多种分析手段为合理有效地分配各运维人员和值班人员的人员调度,利用各类性能分析报表、资源统计报表和运维分析报表,从各个侧面、各个角度反映系统的运行情况、性能情况和人员工作情况,为系统升级、改造、扩容提供科学依据;也为员工的绩效考核提供电子依据。

1.2.4直观运行展现,快速指挥调度通过IT系统集中监控管理平台展示系统对业务核心数据进行分析和实时监控,丰富、科学、美观的展示IT 资源运行情况、性能状况、服务工单情况等,使领导、管理者、技术人员能迅速了解自己关心的问题。

对于IT运行的故障处理过程中,能够通过直观的运行展现,进行快速指挥调度。

1.2.5规范日常流程,有序高效协作参照ITIL规范,树立面向业务服务的IT服务理念,进一步理顺信息战信息中心内部各组关系,明确职责分工。

梳理当前的服务目录和服务级别协议,规范提供服务的内容。

建立集中的服务台,统一管理IT服务资源。

建立服务台、事件管理、问题管理、变更管理、配置管理等IT服务管理流程,初步实现面向流程的运维和服务管理模式,使运维人员具备更高的工作效率。

1.3主要问题、重点及难点的阐述根据对本项目的需求的理解,项目建设的主要问题、重点及难点主要包括:1.3.1实现统一监控、处置及展现面向网络及数据中心的各类IT资源实现统一监控,以资源配置信息、监控指标信息、告警信息等相关运维管理信息的全面采集、整合、抽取,并按照特定规则进行格式和内容等方面的处理,并按照特定规则进行格式和内容方面的整合处理,以便形成统一的监控信息、预/告警信息、展示信息。

在监控信息的展现方面,采用统一门户来规划展示的框架、风格及内容,通过灵活的可定制界面,实现各种监控和分析的需求,进一步提高监控工作的有效性和一致性;通过引入先进的技术分析手段,建立监控有效性分析评估机制,进一步保障应用系统安全、高效、持续、稳定的运行。

1.3.2完整、有效、统一的配置管理库在资源层面,将系统、网络、基础设施以及其他IT环境中存在的实体和虚拟资源进行统一、集中的管理,是实现统一运维的基础,在权限控制框架内,运维人员可以快速查询和调取资源的信息,能够快速实现事件、问题和变更的处理工作,极大的增加运维效率,并降低风险。

该需求关键要解决配置库管理中所管理的配置项及其关联关系的信息完整性、及时性及正确性,以为运维管理相关工作提供可靠有效的信息依据。

为了收集管理各配置项,真实地反映应用项目和IT资源的关联关系,首先要全面详细地了解应用系统和IT 基础设施的安装部署和配置情况。

在此基础上,通过配置发现工具,有必要时结合人工审核确认,并辅以配置审计等工具,对基础设施、网络线路和设备、主机、存储、数据库系统、应用中间件、业务应用系统等IT 资源和应用系统运维配置信息的采集、维护和管理,并使该模块与其他功能模块保持良好的集成接口关系。

同时,配置管理库应支持图形化的配置项、配置关系展现。

支持基于配置项之间的关联和影响关系,自动快速地确定、分析并展示告警事件、变更对其他IT资源或业务系统的影响范围和程度,从而将技术和业务有效的结合起来,转变传统的IT监控手段,不仅能及时发现故障,更能够快速分析故障的影响范围和程度,保障重要业务稳定运行。

1.3.3符合ITIL规范的基础服务流程符合ITIL的运维流程建设是本次项目的重点之一,通过建立标准、规范且灵活的管理历程,并在省厅层面进行部署应用,将能够在省厅这一层面实现运维工作的流程化化,通过流程的合理设置,真正实现省厅层面的各部门联动运维模式,各部门将依托省厅作为一个整体集中对外提供IT服务、对服务进行监督和改进、提升服务质量和水平。

此需求的实现,首先需要对省厅各部门现有管理流程进行重新梳理,我们了解到运行省厅下各部门已经建设并实施了事件管理、变更管理、问题管理、配置管理等流程。

经过多年的宣贯及应用,这些流程的应用已经成为省厅各部门运维工作中非常重要的一部分。

因此,需要结合当前管理需要,结合本次项目的建设目标,在现有流程的基础上,进行优化、完善。

在实现事件、问题、变更等管理流程的基础上,还需建立各流程之间的联动,实现相关流程之间的有机结合,为故障分析、变更评估等提供有效方法及可靠依据。

此外,还需要增加服务目录、服务级别和服务请求管理等流程的建设,进一步完善和优化流程体系,使省厅整个IT服务过程,包括服务请求、服务接受、服务处理、服务交付、服务质量控制整个过程均具备良好的流程化处理和控制手段,从而保障服务质量并持续提升。

1.3.4可灵活定制的运维流程引擎运维管理流程的建设除咨询设计外,还需要将设计好的流程落到实处,通过一个敏捷、可灵活定义的运维流程引擎进行运维流程的快速落地和电子化,是保障流程得以成功实施的重要手段。

该需求要求运维工作流程可采用客户化定制方式,按照用户的实际工作需要,方便的进行定制生成。

相关主题