当前位置:文档之家› 2--如何用AWS云服务处理大数据与高性能计算代闻

2--如何用AWS云服务处理大数据与高性能计算代闻





“HPC in the cloud” a viable solution for many individual users and organizations.
面对大数据,我们需要一个足够大的集群
但太大的集群又会是浪费…
如果有一个大小刚好的集群…
而且是按需的、弹性的…
而且同时多个任务并行计算…
竞标实例
对AWS空闲计算 资源进行竞标, 有机会以极低价 格获得计算实例。 用于补充需要花 费大量时间的负 载的计算能力, 或提供临时的计 算能力。
专用实例
开启计算实例时要 求运行在给一个用 户专用的硬件设备 上
主要用于PoC或 对AWS环境的熟 悉过程
临时使用,应对突 发的负载。
适用于异常敏感或 对合规有要求的计 算负载。
cg1.8xlarge
g2.2xlarge
10Gbps 万兆低延迟网络(Network placement groups)
集群的计算实例部署在一个”Placement Group”中,通过
低延迟的万兆网络互联。
HPC支持服务
数据管理
关系型数据库服务(RDS)
(MySQL, Oracle, MSSQL, PostgreSQL, Aurora)
EC2 实例类型丰富,可以灵活支持不同场景和任务需求。
c3.8xlarge g2.medium rge
自动扩展(Auto Scaling Group) 根据计算实例的工作状态(如CPU、网络、存储IO等) 实现自动扩展和收缩,实现资源弹性和并行计算。
自动化控制
支持通过图形界面、命令行、SDK和API的方式控制资
大数据与高性能计算
Pfizer使用AWS处理HPC计算
高峰和激增需求.
HARVARD医学院通过使 用AWS,将HPC集群的成
Unilever通过使用AWS,

AWS enables Pfizer’s Worldwide Research and Development to explore specific difficult or deep scientific questions in a timely,

becoming the world’s greatest data
sandbox. And the staff is planning to use it to make the SEC a leader in its use of market data
Elisse B. Walter, Chairman of the SEC Tradeworx
2M transaction messages/sec; 20B records and 1TB/day

Bankinter: credit-risk simulation


With AWS, we now have the power to
Processing
results Amazon SQS
Processing task/processing trigger

1
工作流服务协调负载和任务集群 处理流程较长的任务,使用工作流服务
Task A
2
Task B
(Simple Workflow Service)按照步骤调
用各个节点,并定义不同的策略和工作 逻辑。
Computational Fluid Dynamics (CFD)
Genome Analysis
Transcoding and Encoding
Monte Carlo Simulations
High Energy Physics Reservoir Simulations, Modeling Finite Element Analysis (FEA) Geospatial applications Molecular Modeling DRM, Encryption Stochastic Modeling Portfolio, Credit Risk Analytics Wealth Management Simulations

TRADERWORX: Market Information Data Analytics System
• Powerful AWS-based system for market analytics
For the growing team of quant types now employed at the SEC, MIDAS is
Monte Carlo Simulations
Transcoding and Encoding
Computational Chemistry
同时,客户使用AWS处理越来越多的HPC负载
石油与天然气 制造工程 生命科学 媒体和娱乐 科学计算
Computational Chemistry
金融
Seismic Data Processing
Quantum Analysis
Wind Simulation Protein Docking Rendering Climate Models
Predictive Maintenance
High Frequency Trading Analytics
AWS的HPC合作伙伴
开始您的AWS HPC旅程!
源,最大程度实现自动化,以及平台整合。
紧耦合负载场景
计算优化以及集群计算实例(Cluster Compute)
Implement HVM process execution Intel® Xeon® processors 10 Gigabit Ethernet –c3 has Enhanced networking, SR-IOV
(Autoscaling)
Task C
3
HPC支持服务
当HPC遇到Big Data
收集
Direct Connect
Import/Export S3 DynamoDB
计算
EC2 GPUs Elastic MapReduce
协作
CloudFormation Simple Workflow
S3
典型架构一:
allowed us to focus our time and
energy on simulation development, rather than technology, to get results quickly. Without the benefits of AWS, we certainly would not be as far along
2 x 320 GB Local SSD 2 x 320 GB Local SSD 32 vCPUs 2.8 GHz Intel Xeon E5-2680v2 Ivy Bridge 60GB RAM
32 vCPUs 2.6 GHz Intel Xeon E5-2670 Sandy Bridge
60.5 GB RAM
c3.8xlarge
cc2.8xlarge
GPU运算实例
CG1 instances Intel® Xeon® X5570 processors
33.5 EC2 Compute Units 20GB RAM 2x NVIDIA GPU 448 Cores 3GB Mem
26 EC2 Compute Units
大规模计算和数据集 large scale computing and huge data sets
典型架构二:
面向金融服务的网格计算 financial services grid computing
如何节约HPC集群成本?
按需部署,弹性资源
Resources scaled to demand Actual Demand Predicted Demand Waste Actual demand
AWS定价模型
• • 自2006年成立以来,AWS宣布了47次降价 新功能往往会更强大,并且更低价
降价
基础架构 成本降低
更多客户
AWS 定价哲学
规模经济 更多 AWS用 量 更多基础 架构
在AWS上运行HPC的客户还有很多
常见的AWS HPC工作负载
Genome processing Modeling and Simulation Government and Educational Research
scalable manner and helps Pfizer
make better decisions more quickly.
as we are.
Dr. Michael Miller Head of HPC for R&D, Pfizer
Dr. Peter Tonellato, LPM, Center for Biomedical Informatics, Harvard Medical School
无限制的基础架构
低成本,计费灵活
资源利用更高
AWS远不止这些
更短的运行时间 按需启动并行集群 更多协作
能不能再具体点呢?
高性能计算需求分类
松耦合
支持服务
紧耦合
并行计算 资源弹性 批处理
数据管理 任务分发 工作流管理
任务互相关联 网络环境敏感 任务算法不同
松耦合负载场景
Elastic Compute Cloud (EC2)
/hpc contact us, we are here to help
Sales and Solutions Architects Enterprise Support
相关主题