云计算的集群与分布式摘要尽管我们已经有了高速的个人计算机,尽管我们有了储存大量信息的网络,但是随着社会的发展我们对其的要求也越来越高,为了满足越来越高的需求水平并降低升级的成本,一个新的观念出现了,并为IT业的发展指明了方向,这就是“云计算”。
无疑,近年来,云计算已经成为最热门的技术话题之一,云计算技术已经成为了继个人计算机、互联网之后出现的第三次技术革命浪潮。
国家“十二五”规划纲要和《国务院关于培育和发展战略性新兴产业的决定》均把“云计算”作为新一代信息技术的重要组成部分。
由此可见“云计算”重要性和发展云计算的必要性。
本文将从云计算组成的角度来粗浅的介绍云计算的概念。
关键词集群技术与虚拟化,并行计算技术,分布式文件系统The Cluster and Distributed of Cloud ComputingAbstractAlthough we have a high-speed personal computer,although we have a network that can store a large amount of information network, but along with the social development,we requirements of its increasingly high ,in order to meet the increasingly high demand and reduce the cost of upgrading, a new concept emerged, and the development of IT industry specified the direction, this is the "cloud computing".Undoubtedly, in recent years, cloud computing has become one of the hottest topics in technology, cloud computing has become the following personal computers,the Internet of the third technology revolution. The national "The Plan of Twelfth Five Year" to "cloud computing" is an important part of a new generation of information technology. We can see the importance of cloud computing and the necessity for the development of cloud computing.This paper will describe the concept of cloud computing from the view of the component of cloud computing .Keywords Cluster and Virtualization technology Parallel computing technology Distributed file system目录摘要 (I)Abstract (II)第1章绪论 (5)1.1 课题背景 (5)1.2 什么是云计算 (5)1.3 云计算的基本技术 (5)第2章集群技术与虚拟化 (6)2.1 集群技术 (6)2.1.1 高可用性集群 (6)2.1.2 负载均衡性集群 (7)2.2 虚拟化技术 (9)2.2.1 CPU的虚拟化 (9)2.2.2 内存虚拟化 (12)2.2.3 I/O虚拟化 (13)2.3 虚拟化集群 (14)2.3.1 虚拟化集群总体框架 (14)2.3.2 vCenter (15)2.3.3 vServer (16)2.4 本章小结 (17)第3章分布式并行计算技术 (18)3.1 分布式并行计算概述 (18)3.2 OpenMP (19)3.3 MPI (20)3.4 Erlang (21)3.5 本章小结 (23)第4章分布式文件系统 (24)4.1 文件系统 (24)4.2 体系结构 (24)4.2.1 数据访问方式 (25)4.2.2 系统服务器的结构 (25)4.2.3 分布式文件系统关键技术 (26)致谢 (31)参考文献 (32)第1章绪论1.1课题背景技术是云计算发展的基础。
首先是云计算自身核心技术的发展,如:硬件技术,虚拟化技术,并行编程模型、海量数据分布存储技术、海量数据管理技术、云平台管理技术;其次是云计算赖以存在的移动互联网技术的发展,如:高速、大容量的网络,无处不在的接入,灵活多样的终端,集约化的数据中心,WEB技术。
可以将云计算理解为八个字"按需即用、随需应变",使之实现的各项技术已基本成熟。
1.2什么是云计算云计算是通过使计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,企业数据中心的运行将与互联网更相似。
这使得企业能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。
按照云计算的服务层次可以把云计算服务分为基础设施即服务(IaaS),平台即服务(PaaS)和软件即服务(SaaS)。
IaaS:基础设施即服务IaaS(Infrastructure-as-a- Service):基础设施即服务。
消费者通过Internet可以从完善的计算机基础设施获得服务。
PaaS:平台即服务PaaS(Platform-as-a- Service):平台即服务。
PaaS实际上是指将软件研发的平台作为一种服务,以SaaS的模式提交给用户。
因此,PaaS也是SaaS模式的一种应用。
但是,PaaS的出现可以加快SaaS的发展,尤其是加快SaaS应用的开发速度。
SaaS:软件即服务SaaS(Software-as-a- Service):软件即服务。
它是一种通过Internet提供软件的模式,用户无需购买软件,而是向提供商租用基于Web的软件,来管理企业经营活动。
1.3云计算的基本技术高可靠的集群技术与虚拟化,并行计算技术,分布式文件系统第2章集群技术与虚拟化2.1集群技术集群技术就是将多台服务器用集群软件连接在一起,组成一个高度透明的大型服务器群的计算机系统,作为一个整体为客户端提供服务,客户端能共享网络上的所有资源,如数据或应用软件等,同时客户端的用户并不关心其应用Server运行在那台服务器上,只关心其应用Server是否能连续工作。
当集群系统内某一台服务器出现故障时,其备援服务器便立即接管该故障服务器的应用服务,继续为前端的用户提供服务。
从客户端看来,集群中的所有服务器是一个系统,就像一台大型的计算机系统,其上运行着客户端需要的应用服务。
集群系统能够保证用户的业务是连续的并且具有持续可用的特性,即具有7x24 的可用性,从而将系统停止运行的时间降到了最低,提供了高可靠性的保障。
从客户端看来,集群中所有的服务器是一个整体,就像一台大型的计算机,为了完成一些普通计算机或服务器难以胜任的计算密集型应用,集群可以可以集中几十台甚至成百上千台计算机服务器的计算能力来提供更高的计算能力。
用户若想扩展系统能力性能,往往不得不购买更高性能的服务器并停止系统运行来更新设备,但是采用集群技术的话,只需将新的服务器加入集群中,并不需要停机和极其昂贵的服务器,通过大量性价比高的服务器的叠加和集合就可以做的更出色,大大提高了系统的可扩展性并大大降低了成本。
集群技术在提高性能、增强可靠性的同时提供了更好的可扩展能力和更低的成本。
2.1.1高可用性集群在一年之内可达99.99%可用性时,这样的集群系统我们称为高可用性的集群系统。
可用性:当用户需要数据和服务时,计算机能够根据请求完成响应则定义为可用性。
可用性是以百分比形式表示的一种系统正常工作的时间。
高可用性系统是由集群软件监控、具有多台服务器互相冗余的系统。
此系统通过集群软件提供的故障监测和故障处理能力,可提供业务连续性的能力。
高可用性系统的主要目的是将计划内及计划外宕机时间减少到最少;运行。
高可用性即确保计算机系统的运行时间达到99.99%。
容错系统:是由一台计算机系统采用专用的、昂贵的和有复制功能的设备组成的系统。
如计算机内部采用特殊的双主机板、CPU锁步运行、冗余磁盘、专有的操作系统等。
它是为防止系统出错、获得较高可用性的一种方法。
容错性是整个操作系统统筹设计的一个功能,系统完全自发、自动响应系统故障,并提供不问断服务。
高可用性的集群系统主要包括以下几方面硬件组件:(1)服务器组:在高可用性的集群系统中每个节点的服务器必须有自己的CPU、内存和磁盘。
每个服务器节点的磁盘是用于安装操作系统和集群软件程序。
(2)对外提供服务的网路:集群系统中的服务器一般采用TCP/IP网络协议与客户端相连。
每个服务器上都有自己的应用服务,客户端必须通过集群服务器中的网络通路来得到自己的服务。
(3)心跳信号通路:在高可用性的集群系统中每个节点必须有心跳接口,用于服务器节点之间互相监视和通信,以取得备援服务器的工作状态。
(4)数据共享磁盘:在高可用性的集群系统中由于运行的都是关键业务,故使用的存储服务器都应是企业级的存储服务器,这些存储服务器应具有先进技术来保障其数据安全。
一般数据放在企业级的存储服务器的共享磁盘的空间中,它是各服务器节点之间维持数据~致性的桥梁,各服务器节点在集群软件的控制下不会同时访问共享磁盘。
2.1.2负载均衡性集群当前,无论在局域网还是在广域网上,业务量的发展都超出了过去最乐观的估计,即使按照当时最优配置建设的网络,也很快会感到吃不消。
尤其是各个网络的核心部分,其数据流量和计算强度之大,使得单一设备根本无法承担,而如何在完成同样功能的多个设备之间实现合理的业务量分配,使之不致于出现一台设备过忙、而别的设备却未充分发挥处理能力的情况,负载均衡集群机制也因此应运而生。
负载均衡建立在现有网络结构之上,它提供了一种廉价有效的方法扩展服务器带宽和增加吞吐量,加强网络数据处理能力,提高网络的灵活性和可用性。
它为用户提供更好的访问质量;提高服务器响应速度;提高服务器及其他资源的利用效率避避,免了网络关键部位出现单点失效。
负载均衡又可以分为静态负载均衡和动态负载均衡。
静态负载均衡:它只是把有可能拥塞于一个服务器的负载交给多个服器超负荷运算。