云计算管理平台设计云管理的驱动力业务驱动力–云计算商业模式:•出现各种类型的云服务•按使用付费•自服务–超大规模数据中心–日益提高的运营成本技术驱动力–自主计算(Autonomic computing)–自动化云管理平台的必要性——一个类比基础设施运营支撑(OSS)业务支撑(BSS)服务消费者虚拟化本身并不是云计算123一个最简化的基础架构云+虚机部署系统监控OSS++服务目录用户管理BSS计量资源不足之处服务质量差:缺乏对性能、可靠性的管理,无法有效应对客户提出的问题 可用性差:没有故障修复机制,无法从错误中恢复 扩展性差:只能管理虚拟机服务,不支持其他服务可维护性差:系统规模增长时,无法对大规模的平台进行有效管理计费管理自服务门户云服务的完整生命周期需要什么样的管理能力监控备份实例生命周期实例操作高可用优化安全付款账户客户订购账单定价产品目录计量不同的云服务还需要特定的管理要素云管理云管理的目标,是实现IT 能力的服务化供应,并实现云计算的各种特性:资源共享、自动化、按使用付费、自服务、可扩展等等公共云:服务+客户+收益•用户及订单的生命周期管理•对不同用户的使用进行计费•经营状况分析•市场推广,分销,广告私有云:服务+业务•需要延续传统的IT 服务管理要求•不仅管服务不仅管服务,,还要管应用•需要对已有资源进行平滑接管SaaS:应用•统一认证•统一门户IaaS:服务器,网络,存储,软件•多种虚拟化引擎•异构的Unix 平台•新型的虚拟存储及网络技术PaaS:中间件中间件、、数据库•与开发工具的结合•从现有运行环境的无缝过渡•弹性伸缩弹性伸缩、、性能优化桌面云:桌面•桌面安全•终端理想的云计算平台应该能够管理各种资源,提供各种云计算服务,或者可以进行充分扩展Windows Linux PC 服务器小型机Unix 存储文件系统MySQLIBM DB2MS-SQLOracle.net VMware/Xen/KVM J2EE 中间件应用1应用2应用3小型机虚拟化存储虚拟化云计算管理平台要做到这一点,非常困难监控OSS 备份实例生命周期实例操作高可用SLA 管理CPU/内存虚拟机服务镜像备份创建/删除虚拟机启\停\快照虚拟机HA 虚拟机迁移安全OS 认证流量VPC 服务创建/删除VPC 虚拟机映射网络HA 流量优化访问控制IO/容量块存储服务磁盘快照创建/删除块设备虚拟机映射冗余存储碎片/性能加密、清洗TPS 中间件服务应用导出集群部署扩容/收缩集群弹性伸缩运行隔离TPS 数据存储服务数据导出创建存储库参数调优集群索引等访问控制计量时间*数量时间*数量大小*数量CPU*时间CPU*时间监控服务器监控–物理机监控–虚拟机监控存储监控–盘阵–SAN 网络–文件系统网络监控–可用性–流量–拓扑监控采集事件展示监控与报警策略,自动化响应 事件汇总、过滤关联分析统一展现面向用户 面向运营商 历史信息查询统一报表常见的云服务及计量形式云计算类别可配置参数计量单位SaaS-应用软件用户数及开通功能PaaS-运行环境请求次数、占用内存PaaS-数据库查询次数、数据量IaaS-虚拟机CPU、内存大小个数及时长IaaS-磁盘大小大小及时长IaaS-文件空间大小及时长IaaS-公网IP个数及时长IaaS-网络连接流量存储备份Business app 1Business app 2云的灾备App serverDB server App serverDB server 云环境存储Recovered appApp serverDB server 复制动态恢复OS 及数据集中存储生产中心灾备中心AMIs 镜像–CreateImage –DeregisterImage –DescribeImageAttribute –DescribeImages –ModifyImageAttribute –RegisterImage –ResetImageAttributeElastic IP Addresses IP 地址–AllocateAddress –AssociateAddress –DescribeAddresses –DisassociateAddress –ReleaseAddress Network ACLs 网络安全控制–CreateNetworkAcl –CreateNetworkAclEntry –DeleteNetworkAcl –DeleteNetworkAclEntry –DescribeNetworkAcls–ReplaceNetworkAclAssociation –ReplaceNetworkAclEntryInstances 虚拟机–DescribeInstanceAttribute –DescribeInstances –ImportInstance –ModifyInstanceAttribute –RebootInstances –ResetInstanceAttribute –RunInstances –StartInstances –StopInstances –TerminateInstancesElastic Block Store 存储–AttachVolume –CreateSnapshot –CreateVolume –DeleteSnapshot –DeleteVolume–DescribeSnapshotAttribute –DescribeSnapshots –DescribeVolumes –DetachVolume –ImportVolume–ModifySnapshotAttribute –ResetSnapshotAttribute实现管理功能的原子化、松耦合和可配置,是构建可扩展云管理平台的一种理想方式支持完整服务周期的可扩展BSS 框架自服务门户单点登陆服务目录管理服务开通服务台服务水平管理服务计费与账务服务操作服务目录统一服务交付平台分销渠道云管理与传统IT 管理传统管理云管理管理对象网络、存储、服务器、OS 、数据库、中间件、应用IaaS 、PaaS 、SaaS 等各种云服务管理目标实现IT 系统的正常运作实现云服务的端到端交付管理特色需要专业的管理技能手动管理竖井式管理通过封装屏蔽底层细节自服务多租户,共享管理平台管理平台易用性安装配置复杂自配置、自修复、自优化管理规模100节点10000节点+用户管理员分层管理,多租户整合基于事件、数据库、私有接口的整合面向服务的整合管理手段离散的工具充分自动化在大型企业看来,云管理与服务管理(ITSM)是一体的,其需求实际是让现有的ITSM/ITIL 工具延伸到虚拟化环境ITSM 平台的基本构成:三大平台+一个库+门户展现应用中间件数据库OS管理平台应用中间件数据库OS 物理机应用中间件数据库OS管理平台应用中间件数据库OS 演进大型企业的IT 部门承担企业各种信息化系统的建设、运营管理•传统ITSM 的管理对象,是所有的IT 系统•云平台建成后,IT 部门既是使用者,也是服务提供者,仍然要管理其承载的所有IT 系统•云计算对于这种企业来说云计算对于这种企业来说,,只是一种技术应用或工具种技术应用或工具,,不改变组织架构和管理模式和管理模式,,企业更强调自动化与虚拟化的应用未来可能出现的模式•建成企业统一的云平台,IT 运维团队分解为两个子部门分解为两个子部门,,分别负责业务系统和云平台的运作,前者负责ITSM 建设,后者负责云平台建设•应用系统针对IaaS/PaaS 模式进行开发和部署CMDB 的演进1人工配置目标系统2自动发现配置信息3提交变更申请4自动化执行变更CMDB 产生的背景•传统分布式系统不存在一个集中的配置信息库•配置信息与实际信息存在不一致•系统不存在自动配置收集能力IaaS 实现之后,CMDB 的一部分功能就融入IaaS 了•主动维护配置信息(节点数、OS 与物理机的对应)•中间件层面的配置还需外部工具维护•在PaaS 普及之前普及之前,,CMDB 还将继续存在PaaS 实现后实现后,,CMDB 就彻底融入云平台了•配置信息由PaaS 集中存放•PaaS 不提供操作系统接口,所有配置动作均通过云平台完成,不存在配置与实际系统不一致的问题实际应用中,1&2较为普及;部分实现了3;4很难实现对部门级、中小企业、公共IaaS 云服务提供商来说,云管理能具备vCenter/Amazon EC2能力即可部门级和中小企业:只需要IaaS 甚至只是虚拟化,不需要自动化管理–系统规模<50台服务器–IT 管理人员<5–业务系统数量<10应用中间件数据库OS应用中间件数据库OS IaaS 云云管理数据备份工具手动管理IaaS 服务提供商:只需要管好IaaS 层,不需要维护应用资源服务 安全服务需要一个服务台及BSS应用中间件数据库OS应用中间件数据库OSIaaS 云云管理用户运营商云平台对于SaaS 服务提供商来看,Salesforce 和AppStore 是理想模式应用开发应用发布利润分成应用商店ISV客户云计算时代下需要什么样的ITSM软件监控:去中心化、高度可扩展,支持上万服务器的管理自动化:支持拖拽方式生成服务实例、支持大规模并行执行CMDB: 逐步被PaaS取代流程:适用于云环境的最佳ITIL实践门户:自服务、易于定制业界的云管理平台基本可以划为三类虚拟化管理平台+IaaS基本运维功能:几乎所有厂商都有相应解决方案–vCloud, Redhat, SUSE, Citrix, MS–Openstack, Eucalyptus–IBM, Dell, HPITSM管理软件针对虚拟化进行增强:IBM、HP、CA、BMC软件商店((SaaS运营平台):多为服务提供商自行开发,复用性较差 软件商店PaaS:正在起步,市场尚未成熟–Vmware CloudFoundry–IBM Websphere Workload Deployer–MS Azure从实践来看,结合ITSM能力的云管理平台不成熟,且成本高、实施复杂、客户收益差ITSM实施一般按照如下顺序:监控->流程引擎->CMDB->自动化,国内绝大部分客户最多做到第二步ITSM本身的实施就是一个庞大工程,定制化程度高,服务复杂,项目周期长在云计算出现之前,业界就缺乏成功的ITSM完整实现,原因是:–没有标准,各厂商自行开发各模块,相互之间无法集成–软硬件环境复杂,没有软件能开箱即用–客户需求差异大,案例无法复制–对实施及运维人员技能要求高,见效周期长云的产生对原有的ITSM软件提出了新的要求,这对ITSM实施提出了更高的要求展望未来,如果云具备了充分的自主管理能力,ITSM的很多能力就不需要了IBM TSAM :基于企业级流程引擎Maximo 构建第三方门户用户自服务云管理员用户界面R E S T A P I服务自动化模板部署管理流程自动化引擎预订部署工作流服务器网络存储应用镜像管理VMWare, XEN, KVM, PowerVM, z/VM 。