分布式与并行计算
Utility Computing Cloud Computing
SaaS
Cluster Computing
Virtualization
Grid Computing
使用模式
第一章 引论
基础设施
28
云计算的技术背景
火龙果整理
云计算是并行计算(Parallel Computing)、 分布式计算(Distributed Computing)和网格计算 (Grid Computing)的发展,或者说是这些计算 机科学概念的商业实现。
第一章 引论
24
Cloud Computing
火龙果整理
第一章 引论
25
25
User Centric
火龙果整理
preferences news contacts calendar investments maps photo mailing lists music e-mails messages
Locus V System Mach CORBA Distributed COM JINI
剑桥环
以太网 以太网 以太网 互联网 互联网 互联网
LSI-4
PC Sun Sun, PC 任何机器 PC 任何机器
1979
1980 1982 1985 1990 1996 2000
第一章 引论
9
火龙果整理
Data stored in the “Cloud” Data follows you & your devices Data accessible anywhere Data can be shared with others
phone numbers
第一章 引论
26
火龙果整理
新概念层出不穷
Grid Computing Virtualization Cluster Computing
?
SaaS
SaaS = Software as a Service
Utility Computing
?
Cloud Computing
第一章 引论
27
火龙果整理
可以分为两类
等各种资源; 思想:资源共享和协同,强调统一和横向设 计; 方法:建立广泛的资源共享标准和协议
第一章 引论
22
火龙果整理
第一章 引论
23
火龙果整理
云计算
Legend: Cluster computing, Grid computing, Cloud computing
第一章 引论
16
对 等 计 算
火龙果整理
第一章 引论
17
火龙果整理
第一章 引论
18
火龙果整理
CERN: 欧洲核研究组织
CERN 是世界上最大的核物理研究中心, 科学家们试图通过对粒子的研究寻找宇宙 的起源。 一台大型强子碰撞机: Large Hadron Collider 可能产生的数据: 10,000,000GB 需要20,000,000 张CD来存储 解决方法:网格计算,IBM分布式虚拟存 储和文件管理技术
Time or Traffic-based Scaling, Load testing, Simulation and Analysis, Rendering, Software as a Service Platform, Hosting
第一章 引论
$.10 per server hour
$.10 - $.18 per GB data transfer
32
另一个成功的例子:Google
管理
火龙果整理
交流
工作
共享
Google Charts
第一章 引论
33
Microsoft的云端计算
火龙果整理
Cloud(云)+Client(终端设备)
用户选择合理的计算资源分 布。有些计算资源应该放在 云上,有些应该放在用户终
第一章 引论
波多黎各
第一章 引论
15
RC5
火龙果整理
破译 RSA 实验室给出的密码,找出密钥 奖金: $10,000 美元 RC_56: 250 天破译 (1997) RC_64: 1,757 天破译 (2002) RC_72: ? 例如: RC_64采用64位密钥,一共有 18,446,744,073,709,551,616 可能的密钥组合 有上百万台计算机参与这个项目
云计算是虚拟化(Virtualization)、效用计算 (Utility Computing)、IaaS(基础设施即服务) 、PaaS(平台即服务)、SaaS(软件即服务)等概 念混合演进并跃升的结果。
第一章 引论
29
云计算的服务类型
火龙果整理
第一章 引论
30
Amazon Simple Storage Service
探索外星文明 射电天文望远镜: Arecibo (305m) 地理位置: Puerto Rico(波多黎各) 接收 4,000,000 无线电波段 下载屏保程序作数据分析 中央控制系统分布数据 UC Berkeley
第一章 引论
14
火龙果整理
射电望远镜: Arecibo (305m)
8
第一章 引论
火龙果整理
分布式系统的发展简史
系统名称 CM* 组织机构 卡内基.· 梅隆大 学 剑桥大学 加州大学 洛杉矶分校 斯坦福大学 卡内基.· 梅隆大 学 OMG 微软公司 Sun Microsystems 网络要求 层次总线 计算机 PDP 研制日期 1975
Cambridge DCS
1.
第一章 引论
11
火龙果整理
杀手应用:
以计算为主的问题 (分布式计算): 数学计算,环境 模拟,生物和仿生,经济和财政模型,气象预报,动画 制作, …
以数据为主的问题 (分布式数据): 数据挖掘, 信息 检索,保险分析,图像处理, … 以通信为主的问题 (网络应用): 事务处理,电子商 务,远程文件交换,电子信件, …
火龙果整理
分布式系统与并行计算
第一章 引论
1
参考书 (References)
火龙果整理
分布式系统
作者: 李西宁 出版: 科学出版社 分布式算法导论 作者:Gerard Tel 霍红卫译 出版:机械工业出版社 分布式系统原理与范型 作者:Andrew S Tanenbaum 杨剑锋等译 出版:清华大学出版社 并行计算—结构 算法 编程 作者:陈国良 2 第一章 引论 出版:高等教育出版社
第一章 引论
端,或混合方式
34
云计算的特点
超大规模 虚拟化
按需服务 高可靠性 极其廉价 通用性
第一章 引论
火龙果整理
高可扩展性
35
网格计算与云计算的比较
网格计算
• 异构资源
火龙果整理
云计算
• 同构资源
• 不同机构
• 虚拟组织 • 科学计算为主 • 高性能计算机 • 紧耦合问题 • 免费 • 标准化 • 科学界
第一章 引论
$.15 per GB per month storage
$.01 for 1000 to 10000 requests
$.10 - $.18 per GB data transfer
31
Amazon Elastic Compute Cloud
火龙果整理
• Virtual Compute Cloud • Elastic Capacity • 1.7 GHz x86 • 1.7 GB RAM • 160 GB Disk • 250 MB/Second Network • Network Security Model
火龙果整理
• Object-Based Storage
• 1 B – 5 GB / object • Fast, Reliable, Scalable • Redundant, Dispersed • 99.99% Availability Goal • Private or Public • Per-object URLs & ACLs • BitTorrent Support
19
第一章 引论
火龙果整理
第一章 引论
20
火龙果整理
第一章 引论
21
什么是网格
火龙果整理
通常讲,网格(Grid)将网络上地理分 布的各种资源聚合为一体,支持应用问 题合作求解系统的构造
集成计算、数据、存储、设备、软件和人员
分布式系统之定义(1):
一个分布式系统是一组由网络联接的具 有独立功能的计算机,在一套特殊软件 的管理下,整个系统在用户面前呈现为 一个透明的整体。 (Tanenbaum et al. 2002)
第一章 引论
5
火龙果整理
分布式系统之定义(2):
一个分布式系统是一组位于网络计算机 上的并发构件,这些构件之间的通信以 及任务协调都只能通过信件传递进行, 其目的是实现资源共享。 (Coulouris et al. 2005)
第一章 引论
6
火龙果整理
单机系统
用户共享一台计算机 可以访问所有资源 单一时钟 单一系统控制 单一地理位置 单一故障点
第一章 引论
7
火龙果整理
分布式系统
一组由网络互联的、自治的计算机和资源 资源为用户所共享 可以集中控制,也可以分布控制 计算机可以同构,也可以异构 分散的地理位置 分布式故障点 没有全局时钟 没有共享内存(大多数情况)