当前位置:文档之家› 浅谈云计算的论文1

浅谈云计算的论文1

云计算是当前计算机领域的一个热点。

它的出现宣告了低成本提供超级计算时代的到来。

云计算将改变人们获取信息、分享内容和互相沟通的方式。

狭义云计算指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需资源;广义云计算指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需服务。

这种服务可以是IT和软件、互联网相关,也可是其他服务。

云计算(Cloud Computing)是网格计算(Grid Computing )、分布式计算(DistributedComputing)、并行计算(ParallelComputing)、效用计算(Utility Computing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机和网络技术发展融合的产物。

1.1云计算简史著名的美国计算机科学家、图灵奖 (Turing Award) 得主麦卡锡 (John McCarthy,1927-) 在半个世纪前就曾思考过这个问题。

1961 年,他在麻省理工学院 (MIT) 的百年纪念活动中做了一个演讲。

在那次演讲中,他提出了象使用其它资源一样使用计算资源的想法,这就是时下 IT 界的时髦术语“云计算” (Cloud Computing) 的核心想法。

云计算中的这个“云”字虽然是后人所用的词汇,但却颇有历史渊源。

早年的电信技术人员在画电话网络的示意图时,一涉及到不必交待细节的部分,就会画一团“云”来搪塞。

计算机网络的技术人员将这一偷懒的传统发扬光大,就成为了云计算中的这个“云”字,它泛指互联网上的某些“云深不知处”的部分,是云计算中“计算”的实现场所。

而云计算中的这个“计算”也是泛指,它几乎涵盖了计算机所能提供的一切资源。

麦卡锡的这种想法在提出之初曾经风靡过一阵,但真正的实现却是在互联网日益普及的上世纪末。

这其中一家具有先驱意义的公司是甲骨文 (Oracle) 前执行官贝尼奥夫 (Marc Benioff, 1964-) 创立的 Salesforce 公司。

1999 年,这家公司开始将一种客户关系管理软件作为服务提供给用户,很多用户在使用这项服务后提出了购买软件的意向,该公司却死活不干,坚持只作为服务提供,这是云计算的一种典型模式,叫做“软件即服务” (Software as a Service,简称 SaaS)。

这种模式的另一个例子,是我们熟悉的网络电子邮箱 (因此读者哪怕是第一次听到“云计算”这个术语,也不必有陌生感,因为您多半已是它的老客户了)。

除了“软件即服务”外,云计算还有其它几种典型模式,比如向用户提供开发平台的“平台即服务” (Platform as a Service,简称 PaaS),其典型例子是谷歌公司 (Google) 的应用程序引擎 (Google App Engine),它能让用户创建自己的网络程序。

还有一种模式更彻底,干脆向用户提供虚拟硬件,叫做“基础设施即服务” (Infrastructure as a Service,简称 IaaS),其典型例子是亚马逊公司 (Amazon) 的弹性计算云 (Amazon Elastic Compute Cloud,简称 EC2),它向用户提供虚拟主机,用户具有管理员权限,爱干啥就干啥,跟使用自家机器一样。

1.2云计算的概念狭义云计算是指计算机基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的资源(硬件、平台、软件)。

提供资源的网络被称为“云”。

“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。

广义云计算是指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的服务。

这种服务可以是计算机和软件、互联网相关的,也可以是其他的服务。

云计算是并行计算(Parallel Computing)、分布式计算(Distributed Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。

云计算是虚拟化(Virtualization)、效用计算(Utility Computing)、IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)等概念混合演进并跃升的结果。

1.3云计算的特点和优势(一)超大规模性。

“云”具有相当的规模,Google云计算已经拥有100多万台服务器,Amazon、IBM、微软、Yahoo等的“云”均拥有几十万台服务器。

企业私有云一般拥有数百上千台服务器。

“云”能赋予用户前所未有的计算能力。

(二)虚拟化。

云计算支持用户在任意位置、使用各种终端获取应用服务。

所请求的资源来自“云”,而不是固定的有形的实体。

应用在“云”中某处运行,但实际上用户无需了解、也不用担心应用运行的具体位置。

只需要一台笔记本或者一个手机,就可以通过网络服务来实现用户需要的一切,甚至包括超级计算这样的任务。

[2](三)高可靠性。

“云”使用了数据多副本容错、计算节点同构可互换等措施来保障服务的高可靠性,使用云计算比使用本地计算机可靠。

(四)通用性。

云计算不针对特定的应用,在“云”的支撑下可以构造出千变万化的应用,同一个“云”可以同时支撑不同的应用运行。

(五)高可扩展性。

“云”的规模可以动态伸缩,满足应用和用户规模增长的需要。

(六)价格合适。

由于“云”的特殊容错措施可以采用具有经济性的节点来构成“云”,“云”的自动化集中式管理使大量企业无需负担日益高昂的数据中心管理成本,“云”的通用性使资源的利用率较之传统系统大幅提升,因此用户可以充分享受“云”的低成本优势,经常只要花费几百美元、几天时间就能完成以前需要数万美元、数月时间才能完成的任务。

云计算作为一种技术,与其它一些依赖互联网的技术——比如网格计算 (Grid Computing)——有一定的相似之处,但不可混为一谈。

拿网格计算来说,科学爱好者比较熟悉的例子是 SETI@Home,那是一个利用互联网上计算机的冗余计算能力搜索地外文明的计算项目,目前约有来自两百多个国家和地区的两百多万台计算机参与。

它在 2009 年底的运算能力相当于当时全世界最快的超级计算机运算能力的三分之一。

有些读者可能还知道另外一个例子:ZetaGrid,那是一个研究黎曼ζ函数零点分布的计算项目,曾有过一万多台计算机参与 (但现在已经终止了,原因可参阅拙作超越 ZetaGrid)。

从这两个著名例子中我们可以看到网格计算的特点,那就是计算性质单一,但运算量巨大 (甚至永无尽头,比如 ZetaGrid)。

而云计算的特点恰好相反,是计算性质五花八门,但运算量不大[注三],这是它们的本质区别,也是云计算能够面向大众成为服务的根本原因。

云计算能够流行,它到底有什么优点呢?我们举个例子来说明,设想你要开一家网络公司。

按传统方法,你得有一大笔启动资金,因为你要购买计算机和软件,你要租用机房,你还要雇专人来管理和维护计算机。

当你的公司运作起来时,业务总难免会时好时坏,为了在业务好的时候也能正常运转,你的人力和硬件都要有一定的超前配置,这也要花钱。

更要命的是,无论硬件还是软件厂商都会频繁推出新版本,你若不想被技术前沿抛弃,就得花钱费力不断更新 (当然,也别怪人家,你的公司运作起来后没准也得这么赚别人的钱)。

如果用云计算,情况就不一样了:计算机和软件都可以用云计算,业务好的时候多用一点,业务坏的时候少用一点,费用就跟结算煤气费一样按实际用量来算,无需任何超前配置[注四]。

一台虚拟服务器只需鼠标轻点几下就能到位,不象实体机器,从下定单,到进货,再到调试,忙得四脚朝天不说,起码得好几天的时间。

虚拟服务器一旦不需要了,鼠标一点就可以让它从你眼前 (以及账单里)消失。

至于软硬件的升级换代,服务器的维护管理等,那都是云计算服务商的事,跟你没半毛钱的关系。

更重要的是,开公司总是有风险的,如果你试了一两个月后发现行不通,在关门大吉的时候,假如你用的是云计算,那你只需支付实际使用过的资源。

假如你走的是传统路子,买了硬件、软件,雇了专人,那很多投资可就打水漂了。

1.4浅谈云计算的一个核心理念大规模消息通信:云计算的一个核心理念就是资源和软件功能都是以服务的形式进行发布的,不同服务之间经常需要通过消息通信进行协助。

由于同步消息通信的低效率,我们只考虑异步通信。

如Java Message Service是J2EE平台上的一个消息通信标准,J2EE应用程序可以通过JMS来创建,发送,接收,阅读消息。

异步消息通信已经成为面向服务架构中组件解耦合及业务集成的重要技术。

大规模分布式存储:分布式存储的目标是利用多台服务器的存储资源来满足单台服务器所不能满足的存储需求。

分布式存储要求存储资源能够被抽象表示和统一管理,并且能够保证数据读写操作的安全性,可靠性,性能等各方面要求。

下面是几个典型的分布式文件系统:◆Frangipani是一个可伸缩性很好的高兴能分布式文件系统,采用两层的服务体系架构:底层是一个分布式存储服务,该服务能够自动管理可伸缩,高可用的虚拟磁盘;上层运行着Frangipani分布式文件系统。

◆JetFile是一个基于P2P的主播技术,支持在Internet这样的异构环境中分享文件的分布式文件系统。

◆Ceph是一个高性能并且可靠地分布式文件系统,它通过把数据和对数据的管理在最大程度上分开来获取极佳的I/O性能。

◆Google File System(GFS)是Google公司设计的可伸缩的分布式文件系统。

GFS能够很好的支持大规模海量数据处理应用程序。

在云计算环境中,数据的存储和操作都是以服务的形式提供的;数据的类型多种多样;必须满足数据操作对性能,可靠性,安全性和简单性的要求。

在云计算环境下的大规模分布式存储方向,BigTable是Google公司设计的用来存储海量结构化数据的分布式存储系统;Dynamo是Amazon公司设计的一种基于键值对的分布式存储系统,它能提供非常高的可用性;Amazon公司的Simple Storage Service(S3)是一个支持大规模存储多媒体这样的二进制文件的云计算存储服务;Amazon公司的SimpleDB是建立在S3和Amazon EC2之上的用来存储结构化数据的云计算服务。

许可证管理与计费:目前比较成熟的云环境计费模型是Amazon公司提供的Elastic Compute Cloud(EC2)和Simple Storage Service(S3)的按量计费模型,用户按占用的虚拟机单元,IP地址,带宽和存储空间付费。

1.5云计算的现状云计算是个热度很高的新名词。

相关主题