IBM虚拟化基本概念(1)---设计前言为什么服务器需要虚拟化可以有效控制服务器数量,提高资源利用率。
利用IBM 的PowerVM 技术,我们实现了 1 台p570 划分20 个分区,如果实际购买机器,至少需要20 台p510。
节能减排,降低投资.显而易见,服务器虚拟化可以省电省散热省空间,大量减少PCI 卡等等投资。
拿宝信实验室举例,1 台p55A 能顶掉原来10 台p52A,空间节省75%,电节省80%,散热减少80%,投资也至少减少70%,长期下来节能效果相当惊人。
简化服务器的部署、管理利用IBM 的PowerVM 技术,可以使得服务器的环境完全一致,使得加上NIM 安装技术的成功率大大提高,可以在短短60 分钟内,部署8 台以上的虚拟服务器,由于APV 和IBM 硬件控制台(HMC)密不可分,也就可以很方便地实现了这些虚拟服务器远程管理,包括启停、调整系统资源等等。
模拟各类操作系统和各个资源不同的机器,实现良好的学习测试实验环境。
对于IBM 的PowerVM 技术,目前支持AIX5.3、AIX6.1,部分Linux,可以模拟多台从0.1CPU,128 MB 到小于物理机器资源的机器。
PowerVM 的主要组成部分及概念最新的PowerVM 是在基于IBM POWER 处理器的硬件平台上提供的具有行业领先水平的虚拟化技术家族。
它是IBM Power System 虚拟化技术全新和统一的品牌(逻辑分区,微分区,Hypervisor,虚拟I/O 服务器,APV,PowerVM Lx86,Live Partition Mobility)。
随着Power6 的推出和i 和p 系列的合并,APV 也发展成为PowerVM。
PowerVM 有三个版本,分别是PowerVM Express Edition,PowerVM Standard Edition,PowerVM Enterprise Edition。
对于Power6,PowerVM 新支持Multiple Shared Processor Pools 功能和Live Partition Mobility 功能。
下面就其主要部分介绍一下,以方便后面实战部分的阅读。
微分区(Micro-Partitioning)微分区改变了POWER 系列服务器的整个规划结构。
实施APV 后,可以在资源分配方面提供更大的灵活性和细分能力。
添加处理器的部分处理能力而不是整个处理器,还能够帮助客户更好地利用服务器。
使用工作负载管理器(WLM)和PLM 有助于更好地优化这些资源。
现在,分区要么是专用的处理器分区(按整个处理器的增量来分配处理能力),要么是共享的处理器分区(使用微分区);不会出现两者的组合。
使用微分区时,可以将一组处理器分配到共享处理器池(SPP),然后使LPAR 可以(根据在池中获得的容量和优先级)使用这些处理器。
此时,服务器上仅有一个SPP 可用,但多个LPAR 可以共享这些资源。
虚拟I/O 服务器APV 功能部件的关键组件之一是虚拟I/O 服务器。
该设施可以提供I/O 虚拟化和网络资源虚拟化。
虚拟I/O 服务器是一个分区,用于提供I/O 资源共享,还用于为一个或多个客户机LPAR 托管虚拟盘、光存储和SEA。
虚拟LAN虚拟LAN 不是APV 的一部分,它只需要POWER5 系统上有AIX 5L V5.3 或支持的Linux 版本。
HMC 用于定义虚拟LAN 设备,从而使LPAR 通过内存而非以太网卡连接。
一个LPAR 可支持多达256 个虚拟LAN,每个虚拟LAN 的传输速度都在1 到3 Gbps 之间。
在这里,性能是值得关注的一点。
如果在分区之间使用物理 LAN 连接,则适配器以 LAN 的传输速度运行,而不是以通常快许多的内存传输速度运行。
由于适配器能够自行处理其任务,所以需要的处理器开销非常少。
如果使用 VLAN ,数据传输/交换速度会更快,因为两个分区之间基本上是内存传送。
但是,这种传输需要处理器的参与。
这两种传输方式的速度可能各有不同,视具体情况而定。
但总的来说,VLAN 比物理互连要快。
共享以太网适配器SEA 是一种与 APV 一起提供的 POWER5 中的新服务,它支持多个分区共享虚拟 I/O 服务器上的物理适配器。
它实际上起着第 2 层网桥的作用,在客户机中的虚拟以太网适配器和主机服务器中的实际适配器之间路由数据。
网络适配器共享是通过虚拟 I/O 服务器上配置的 SEA 实现的。
通过虚拟 I/O 服务器,数据或者在实际网络中流动,或者经由 Hypervisor 流向实际分区。
虚拟 SCSI在 I/O 方面,使用虚拟 SCSI 服务器共享磁盘和适配器。
虚拟 SCSI 服务器运行在虚拟 I/O 服务器上,它能够支持您在一个物理磁盘上分配多个逻辑卷(LV )。
然后,您可以将每个 LV 导出到不同的客户机 LPAR 。
客户机 LPAR 会将这些 LV 视为常规 SCSI 磁盘,而它们实际上可能是通过光纤连接到服务器。
例如,您可以使用一个 146GB 磁盘驱动器,将它划分为 3 个 45 Gb LV 并将它们用作 3 个不同 LPAR 的引导磁盘。
总的来说,这些概念相互独立。
为便于后面阅读和实践,我们主要弄清 2 个大的概念:微分区和 VIO server 即可,以下是我个人的白话理解:微分区 可以理解成可以小于 1 个 CPU 并和其他分区充分共享 CPU 的 LPAR ,内存的使用和 LPAR 没有什么不同。
它可以使用 VIO server 共享出来的网卡和存储,也可以不用。
VIO server 是一个特殊的分区,负责共享 I/O( 网卡和存储 ) 供其他分区使用。
不仅仅是微分区,实际也可以供一般 LPAR 使用,只是考虑到性能的原因,一般不这么做。
其中网卡通过实际网卡通过 SEA 勾连转换为共享虚拟网卡,通过 虚拟 LAN 和各个分区连通,同时使得各个分区可以通过共享虚拟网卡的桥接与外界联系。
共享存储是通过设置虚拟 SCSI 卡 vhost ,可以把 VIO server 的 lv 或磁盘,(新 powerVM 还可以包括文件)映射给 vhost ,实际 vhost 对应到其他分区就是一块 SCSI 卡,可以供其他分区使用实验环境说明:机器一览表设备名 配置 备注ss55aa01 IBM P55A (机架式):4* 1.9GHz ,32GB 内存,底板集成双口双绞线网卡,1×双口千兆双绞线网卡,1×双口 4Gb HBA 卡,1×显卡,HDD :2*146GB 15Krpm ,DVD-ROM,内置 DAT72 带机,冗余电源,AIX 5.3,2×异步卡,HMC,虚拟分区 微分区主服务器sse4km300a01 Eternus 4000 Module 3000ET4K M300 rack mount;4GB Cache Memory (2x1GBx2CM);FC (4Gbp s) host interface (4-portx2CA) E4KM300;146GB/15Krpm disk drive siglex13;500GB/7.2Krpm(single)X4;磁盘阵列ss210ea01,ss210eb01 Brocade Silkworm 210E (机架式机箱,带快速上架导轨)SAN 交换16 块4G 短波光纤模块,16 口激活,带相应管理软件机实验环境示意图规划设计规划前的需求调研在做规划之前,或者说一个准备实施微分区的服务器来说,至少需要调查了解各个分区系统的以下相关情况,这些都可能影响到微分区的配置和划分。
各个微分区负载应用特点如CPU、内存、网络等特别是I/O 的负载的侧重。
各个微分区网络需求包括网段的划分、路由、网络设备的冗余等等在系统上线前的状况和可提供条件,以及实施运行过程中可能出现的变更。
各个微分区存储需求包括存储的大小,性能的要求,以后扩展的需要。
微分区的设计本文由于是实验室环境,性能要求不高,所以网卡和HBA 卡设备都由VIO server 共享出来。
实际使用时,对于性能要求较高的微分区,网卡和HBA 卡可以单独划分给某个分区。
当然需要设计和购买相应的卡。
分区规划考虑到实验室实际情况,本次实施只划分了10 个微分区,但实际可以更多,可以事后再追加。
分区名名称ss55aa01 v io serverss55aa11 微分区1ss55aa12 微分区2ss55aa13 微分区3ss55aa14 微分区4ss55aa15 微分区5ss55aa16 微分区6ss55aa17 微分区7ss55aa18 微分区8ss55aa19 微分区9ss55aa20 微分区10CPU 的设计这些微分区为开发测试分区,开发测试的人员为同一批人,所以不太可能所有的分区都同时繁忙,所以做了如下设计:分区名min d esire m ax v_min v_desire v_max share_mode 权重ss55aa01 0.3 0.5 1 1 2 4 uncapped 128ss55aa11 0.1 0.3 4 1 2 4 uncapped 64ss55aa12 0.1 0.3 4 1 2 4 uncapped 64ss55aa13 0.1 0.3 4 1 2 4 uncapped 64ss55aa14 0.1 0.3 4 1 2 4 uncapped 64ss55aa15 0.1 0.3 4 1 2 4 uncapped 64ss55aa16 0.1 0.3 4 1 2 4 uncapped 64ss55aa17 0.1 0.3 4 1 2 4 uncapped 64ss55aa18 0.1 0.3 4 1 2 4 uncapped 64ss55aa19 0.1 0.3 4 1 2 4 uncapped 2ss55aa20 0.1 0.3 4 1 2 4 uncapped 2权重越高,是当CPU 不够分配的时候,按此比例来分配,即 2 个学习分区的权重最低,分配的CPU 会最少。
注意,此处VIO server 的CPU 也为共享,优先级最高,基于以下原因:CPU 数量有限,专有CPU 至少为1 颗,有些浪费。
这是由于该机器为实验室用途,性能要求不高,对VIO server 的压力不大。
此powerVM 实际为power5 的APV,不能实现power6 的Multiple Shared Processor Pools 功能, 设为专有CPU 后,将不能自动调整实际CPU 的使用。
实际使用过程中,如果CPU 宽裕,对性能有要求,建议采用专有CPU 模式。