当前位置:文档之家› 智能IT运维

智能IT运维


IT资源全生 命周期管理
变更风 险管控
资 源
应用服务资源监控
业务应用监控
网络监控
服务器
中间件
数据库
存储
业务卡片
层级管理
健康繁忙
业务关联
网络拓扑
网络性能
网络故障
自动发现
第一步:
建立自动化监控和管理平台 ,并展现信息化建设成果
数据库
存储
服务器
网络
中间件
机房
业务系统
IT基础设施
IT部门工作的未来蓝图
IP呼叫中心
IT基础管理——机房管理
机房监控管理:全面的机房动力环境元素的监控,形成多维汇总报表数据,通过Portal统一展现, 网络管理
1.温湿度、UPS、市电等统 一显示
主机系统管理
2.告警数据集成显示 3.机房管理系统页面集成
应用系统管理
4.统一事件管理
5.统一机房监控对比
6.实时机房性能数据展示
数据库管理
Page15
IT管理需要全局掌控——具体发生了什么
Page16
IT管理需要全局掌控——从整体到局部,从宏观到微观
Page17
问题高效解决
Page18
万一出了事要能快速定位,解决 异常事件即时告警,定位故障 看看设备之间的关联关系,追查故障,排除影响 查看维护记录,寻求相关知识帮助 排除问题,恢复业务
技术人员 变更实施及发布 通知
客户与IT主管
达成服务 级别协议
长周期变更任务
CMDB
资产配置管理员 更新配置信息 项目经理 更新
KPI与报表 管理
IT主管 决策、优化改进 报表输出,关 键绩效指标分 析
项目管理
开发及重大实施项目周期管理
计划任务管理
周期性任务提醒、执行、监督 技术人员 执行计划任务
配置管理


向导式配置管理,使无线方案的落地变 得轻松、简单; 多维度的无线资源统计报表,直观展示 无线设备总体健康状况和利用情况。
Page11
业务系统掌控
Page12
掌控的基础,是很清晰的知道IT资源支撑了哪些业务,哪些服务
Page13
IT需要全局掌控
Page14
IT需要全局掌控——哪个业务出现了问题
IT部门面临的“管理”难题
面对困难,如何找到解决办法?
1 业务运行环境越来越复杂,故障定位慢 3 运维工作没有流程化、规范化、电子化
支撑资源
2 运维工作繁重,缺少自动化工具和手段
4 信息化建设投入巨大,难以展现效果
IP承载网
IT部门运维管理解决思路
资源统一监控 问题高效解决
业务系统掌控 运维水平提升
巡检报告
自动巡检设置
Page22
掌控所有配置项信息,实现资产全生命周期管理
这台设备是谁负责?什么时候采购的?什么时候过保?如果对这台设备进行变更,会对其他设备及 业务造成什么影响?
1. 2. 3. 4. 5. 向导方式完成配置导入、自动发现、权限配置、关联关系设定等系列CMDB的 构建工作; 可自定义扩展配置项属性; 图形化设置并展示配置项间关系; 可定义配置项审计任务,并进行自动化审计操作,生成审计报告; 实现CMDB与资源管理的双向关联。
数据库管理
性能状态 应用监控管理
5.应用指标TOP10总结
中间件管理
告警事件管理:将IT环境中的事件统一搜集,经过智能分析与过滤,形成告警事件,并予以通知和展示 。
1.事件关联分析 2.根源性告警设置 3.智能化告警处理 • • 告警通知 智能告警处理,避免告
机房监控管理
警风暴 4.告警详细信息展示 5.经验知识库维护管理 统一告警平台 告警设置平台
电话受理,自 动识别来电用 户身份
事件管理
快速响应、 解决突发故 障及请求, 在最短时间 内恢复业务
告警通知 自动生成事件单 大屏幕
IT基础架构 监控系统
异常
服务器
存储
பைடு நூலகம்
应用
中间件
用户-电话 服务或故障报告
服务台座席 创建事件单
网络
数据库
知识库
解决方案入知识库 查询知识
自助服务台
用户WEB登录 ,提报服务或 故障请求 用户-客户端 服务或故障报告
建设成果可视化
资源统一监控
Page6
IT基础管理——网络管理
网络管理:通过多种协议的主动管理方式,实时监控网络设备性能参数,快速发现故障,及时发出告警 网络管理
1.网络自动发现 • 360度雷达扫描视图 •多协议多算法自动调整
主机系统管理
•自动发现详情 •多协议并发发现,效率高 •自动发现与建模 2.网络设备性能管理 •全局性能监测
资产配置全生命周期管理
第三步:
建立可量化的IT部门考核体 系,呈现IT部门业绩和价值
流 程
项目进 度、资 源管理
科技工 作管理 CMDB
事件管 理
快速响 应和恢 复故障 知识库 管理 知识积 累与共 享
周期性 工作值 班与巡 检
计划任 务
IT资源 的集中 管理 配置管 理 变更管 理
问题管 理
根源分 析和解 决
第二步:
建立故障与流程的自动触发 ,结合SLA提升人员服务效 率
知识一览及详情
添加知识
Page24
建设成果可视化
Page25
管理需要可视化
Page26
管理需要可视化
Page27
管理需要可视化
Page28
建设思路
Page29
集简约、高效、自动化IT运维体系建立的思路
业 务 用户
业务需求 达成IT交付 与业务需求 的平衡 服务级 别 服务承诺 报障请求 自助服 务台 获得反馈 登记、自助知识库、跟跟 进度
应用系统管理
数据库管理
自动发现
设备性能管理
•设备负荷TOPN排名
•实时性能监控
中间件管理
3.网络拓扑管理 •全局拓扑视图、拓扑分层视图
机房监控管理
•拓扑试图可自定义编辑 •分布式拓扑模式 •拓扑发现深入,2、3层拓扑
•4.网络流量管理
•全局流量监测 •链路流量TOPN排名 •重要链路流量信息 •应用流量分析 5.网络故障管理
网络拓扑管理
网络故障管理
IT基础管——应用管理
应用系统管理:对网络内的主机、操作系统、数据库、中间件等应用系统的故障检测和性能管理。 网络管理
1. 业务视图(以业务角度 管理IT) 2.非代理监控方式
服务器管理
3.实时性能分析 • 网络实时性能分析 主机性能实时分析
基础服务管理

4.关键进程监控管理
配置关系视图
配置项定义
Page23
技术储备,全面提升组织能力
人员的经验和技能该如何进行复制?如何形成知识库,达成经验积累?同类事件再次发生时,如何 找出历史的解决方法供参考?
1. 2. 3. 4.
实现知识在事件处理过程中积累,一步勾选添加知识库; 实现知识生命周期管理,包括新建、审批、发布等; 按照个人需要可自定义知识查询视图; 支持知识评级管理,价值排名,且与绩效挂钩。
问题管理
升级 根源分析, 找出根本原 因,避免故 障再次发生
机房监 控系统
机房
生成事件单
分派 技术人员 受理并尝试解决
解决,通知用户 获得满意度反馈
问题小组 分析并根源解决 申请变更 受理 指派
发现
同步
变更管理
申请 变更 控制变更可 能产生的风 险
服务级别管理
跟踪事件处理时效,达成与客户的服务约定
变更评审委员会 评估、制定变更计划
主动巡防能力,及早发现隐患
手工化的设备健康检查耗时费力,依赖命令检查技术门槛高,缺乏有效监督和提醒,问题发现不及 时,巡检记录难以统计、分析。
1. 2. 3. 4. 自定义设定自动巡检范围、指标、频度以及巡检报告表单; 自动、手动两种方式对设备的运行状况进行巡检; 自动生成巡检报告; 支持巡检报告自动发送功能。
Page19
IPAD移动终端,随身携带的IT管家
1. 2.
系统全面支持IOS平台移动终端iPad,通过移动终端随时随地了解IT资源运行情况; 终端支持事件、告警、资源一览,实现关键设备运行状态查询、告警处理等功能。 IPAD客户端-资源详情
IPAD客户端-资源一览
Page20
运维水平提升
Page21
中间件管理
机房监控管理
IT生存环境
Page10
无线管理

可视化无线热图,真实反映无线热点覆 盖情况,直观体现无线设备下用户连接 数量;

智能的无线障碍物信号衰减算法,真实 体现无线信号覆盖情况,为规划无线解 决解决方案提供依据;

无线AC、AP、Radio、在线用户、 WLAN服务的统一资源管理,可清晰 地建立各资源的关联关系,降低管理员 的管理难度;
IT部门面临的“技术”难题
信息化迅猛发展的同时,给IT部门带来了更大的压力……
3 运维工作没有流程化、规范化、电子化
日常运维工作流程混乱,或者没有标准流程,造成 工作效率低下,同时客户抱怨、投诉不减
员工干好干坏一个样,员工绩效无法体现
4 信息化建设投入巨大,难以展现效果
信息化投入了巨大资金,到底都花到哪了?花的钱 建设成了什么效果?对单位的信息化提升起到了什 么帮助?
智能IT运维管理 经验及分享
运维现状与困难
Page2
信息化迅猛发展的同时,给IT部门带来了更大的压力……
1 业务运行环境越来越复杂,故障定位慢
各种业务系统越来越多,系统对IT资源的依赖性高 ,系统一旦出现任何问题,需要逐个排查,故障定 位难。
相关主题