当前位置:文档之家› VMware监控运维项目解决方案

VMware监控运维项目解决方案


Operation Readiness 运营就绪服务
VMware建议的虚拟化管理内容之框架
技术架构规范
Service Strategy Service Design
战略 & 组织
可用性
连续性
财务&服务目录
容量
Service Transition Service Operation
变更
访问
配置
操作 监控和事件
面临的问题:
• 目前虚拟化团队仅一人,欠缺虚拟化管理职责,不利
于虚拟化推广
• 虚拟化团队与相关团队无清晰职责界面定义
方案:在虚拟化环境下明确团队岗位职责与工作内容,以 及和其他团队关系
• 为虚拟化团队设计架构 • 确定岗位职责,包括与传统岗位的对应 • 岗位技能要求及培训计划 • 和其他团队的关系
IVMS 一体化管理平台
▪ 这样的视图可
以有多份
▪ 该功能在高级
版中可以使用
帮助回收资源
▪ 通过将那些长
期使用率极低 的VM标识出来, 可以建立依据 和用户讨论是 否有系统资源 回收的可能。 如果没有 vCops,几乎 没有可能找出 这些使用率低 的VM
报告闲置虚拟机
预估资源耗尽时间,帮助评估未来需求容量
当前容量状态
虚拟机 计数容量
vCenter Chargeback Manager • 成本计量和报告
VC Ops Suite Standard
收费
VSOM vCloud Suite STD
VC Ops Suite Advanced
收费
vCloud Suite ADV
VC Ops Suite Enterprise
收费
vCloud Suite ENT
用户管理
策略管理
IT虚拟化环境
主机
网络 存储
IVMS运作管理平台功能示例—资源申请
业务用户
资源维护人员
资源管理人员
资源使用申请 资源调整申请 资源归还申请
服务目录
资源使用申请 资源调整申请 资源归还申请
资源容量管理
资源管理人员通过 资源容量管理查询 目前资源池情况, 然后给出审批结果
服务台
业务用户根据实际 资源使用情况提出 相应申请,并可以 通过资源模版选择 适合自己业务需求
的虚拟化资源
资源维护人员通过 管理人员给出的审批 结果,借助自动化工 具进行资源的自动部 署、调整、迁移、回
收、删除等
对服务过程进 行满意度评价
服务评价
资源部署 资源调整 资源迁移 资源回收
资源模版管理
自动化部署
资源审批管理
服务水平管理
关注业务用户的 评价结果,考核 内部服务质量
IVMS云数据中心一体化运维管理平台--- 示例
集成式性能、容量和配置管理
概述
• 智能化运营
• 获专利的分析方法和动态阈值 • 机器学习功能可以规避意外事故和解决问题 • 容量管理可优化资源使用
• 基于策略的自动化
• 自学式自动化引擎;监管和推动修补 • 强制实施自动化策略;持续保持合规
• 统一管理
• 聚合式管理 - 服务器、存储、网络 • 集成性能、容量和配置管理规程 • 扩展到混合云和异构云环境(包含虚拟云、物理云和公有云)
VMware的实时性能管理方式
灵活集成 来源于很多数据源
企业级扩展性
专利的性能分析器
强大的信息 仪表盘
我可以把所有的监控工具 整合起来,得到更好的性 能分析器。
面向管理目标的监控
▪ 与vCenter不同,
vCops是面向管理 目标的监控方式, 这些管理目标包括: 故障/告警/异常, 使用率/性能数据, 资源池容量,虚拟 机使用活跃度,资 源配置,计费等
方案:明确虚拟化变更与传统区别,建 立标准化的操作流程,明确职责分工, 提高管理质量,降低人为错误,规范操 作行为。
▪ 内容: • 确定变更分类,与传统变更的区别 • 确定日常操作的标准流程 • 确定流程触发、前提 • 确定输入输出、和影响 • 流程中按角色分配的操作内容 • 具体实施命令和步骤
团队与职责
发布
事件和问题
vSphere 规划设计文档一览
虚拟化运维流程——配置与合规
方案:形成准确的虚拟配置管理基线,为运行管理提供基础;提高变更 效率;降低合规检查成本,提高配置和变更管理效率。
• 确定虚拟配置管理中配置模型:配置项分类、
配置项及对应关系
• 实施配置管理工具,实现自动获取配置项、
变化审计及自动修复或拒绝的功能,以及进 行合规性检查
云数据中心的监控和运维
vCenter Operation Management Suite
© 2014 VMware Inc. All rights reserved.
议程
传统数据中心的管理平台回顾 云数据中心的管理运维的方案介绍 适用场景 方案收益 为什么使用vCenter Operation Management Suite
协助进行问题的整体诊断分析
1
管理员发现某个Oracle 虚机出现告警
交易延迟超过阀值
2 检查存储磁盘设备
(EMC VNX: LUN44)
Oracle虚机出现性 能问题
LUNS
4
某个存储磁盘设备出 现告警
VNX | Target HBA Resets
发现有大量的同时 发送的IO请求
IO OUTSTANDING DISK IO
▪ 通常的视图是先选
择一种管理目标, 再选择要查看的设 备
业务视角管理资源的视图
所有应用性能
底部的上下文 每个应用性能的健康
使用动态阀值的KPI表现
▪ 与过去单纯的接
收设备的消息不 同,vCops更多 得将设备和系统 的状态信息与其 支持的业务关联 分类,使得客户 可以清楚得了解 那块业务的后台 系统运行正常, 哪些则出现了问 题
vCenter Configuration Manager • vSphere 强化、变更、配置及合规性 • 操作系统级别的变更、配置和补丁程序管理 • 操作系统级别的合规性包(PCI、HIPAA、SOX) vCenter Infrastructure Navigator • 应用发现和依赖关系映射
▪ 监控管理软件产 品
▪ 50个VM以上, 1-2个管理员
云自动部署
▪无
Operation Readiness 运营就绪服务
▪ 专注流程规范和 设计的需求
▪ 咨询服务规划结 合技术产品
CONFIDENTIAL
2
传统四大管理厂商的局限
▪ 常见的特点
• 针对大型企业用户,成本门槛高 • 实施复杂难度大 • 技术架构不是专为云计算架构特点而设计 • 投资回报效果不明显
▪ 未来技术创新有限
• 管理软件业绩负增长(IBM除外) • 不稳定的业务状态
• BMC 私有化 • HP 业务重组 • CA 屡次退出中国市场
如果我新添加 10 个 虚拟机,则新容量不足
实际部署的 虚拟机
当前容量跨越点
大量性能数据可查询
▪ 这些性能数
据,从指标 数量上比 vCenter多, 查询阅读上, 在时间段选 择,易读性 上,也比 vCenter容易 很多
▪ 这些数据的
查询极大得 方便了对系 统情况的了 解
智能评估运行状态的好坏
▪ 与vCenter不同,
vCops不是简单的 显示数据及曲线, vCops是将数据进 行分析,纪录分析
系统常规行为特征,
从而评估任意时刻
下该系统是否在正 常状态运行的结论
17
vCenter Operation Manager 5.8
第 3 季度更新
vC Ops Mgr Foundation
(每组 25 个许可证)
• 没有清晰的市场发展战略 • 技术陈旧
虚拟化平台管理的难题
池化的资源 如何管理
© 2011 Enterprise Strategy Group
vCops套件 技术管理平台
IT管理模型(基于ITIL)
IT 客户关 系管理
服务级别管理 IT服务的财务管理
服务交付
版本管理 变更管理 配置管理
容量管理 IT服务连续性管理
✓ 问题诊断和协助分析
-
✓ 通过vCM建立CMDB,纪录变更
✓ 智能综合评分
✓ 可预估和回收资源

更多与架构设计有关 通过SRM灾备软件实现 系统层面在ESXi,网络层面在vCNS套件实现
vCenter Operations Management Suitenter Operations Management Suite
优势
• 提高服务质量,减少突发事件以及基础架构和应用服务停
机事件
• 通过简化性能、事件和变更管理任务,将 IT 工作效率提
高 67%*
• 通过适当调整规模和回收过度调配的容量,使服务器资金
开销减少 30%*
• 每位虚拟基础架构管理员可管理的虚拟机数量增加 60%**
资料来源:*Forrester,《VMware vCenter Operations Management Suite 的总体经济影响》(The Total Economic Impact of VMware vCenter Operations Management Suite),2012 年 12 月;**Management Insights 客户调查,2012 年 9 月
可用性管理
IT安全管理
服务支持
问题管理 事件管理
服务台
6
是协助实现ITIL管理制度的技术平台
▪ vCenter是架构配置部署工具服务器,不是监控管理平台
相关主题