企业上云异构计算解决方案
异构产品大图
F1
Intel
2*10AX115
F3
Xilinx 4*VU9P
GA1
AMD 4*S7150
GN5
NVIDIA 8*P100
GN5i
NVIDIA 2*P4
GN6v
NVIDIA 8*V100
vGN5i
NVIDIA 1/8*P4
SCCGN6
NVIDIA 8*V100
GN6i
NVIDIA 4*T4
最新的GPU技术
GPU资源伸缩更方便
稳定的基础设施
GPU资源监控更方便
更低的网络延时 更高的网络加速比
轻量级GPU实例vGN5i
阿里云智能异构产品团队
vGN5i实例 – 小身材大用途
云游戏
D L 推理
VR/AR 工业设计
虚拟化GPU设备 物理GPU 设备
GPU 虚拟化技术
超级GPU计算实例 – SCCGN6
企业上云异构计算解决方案
技术创新,变革未来
01
5G时代的 计算核动力
02
异构产品 大图
03
异构产品 新规格发布
04
异构产品 优势
5G时代 三大场景
可贴图或输入文字 内容
eMBB
• 大流量移动宽带场景
– 超高清视频 – 3D应用 – VR/AR
可贴图或输入文字 内容
可贴图或输入文字 内容
eMTC
• 大规模物联网场景
GPU 集群架构
高性能网络 • 低延时RDMA • VPC网络
弹性裸金属(神龙)虚拟化架构
弹性裸金属实例
CPU
GPU
RAM
VirtIO-NIC
VirtIO-Blk
外部设备
VPC/SLB E B S 云盘
X-Dragon Hypervisor
GPU 集群网络架构
阿里云产品簇
VPC 云盘 ECS NAS OSS RDS
阿里云智能异构产品团队
超级计算集群新规格SCCGN6 sccgn6.24xlarge
虚拟化 弹性裸金属
(神龙)
CPU 96核 Skylake
GPU 8 * V100
RDMA网络
50G 2 u s 延迟
VPC网络 30G
450万 PPS
云端多面手 – GN6i(Nvidia T4)
阿里云智能异构产品团队
传统虚拟化架构
图形图像
影视渲染 VR/AR 云游戏,视频直播 ……
机器学习
人脸识别,自动驾驶 语音识别,自然语言处理
CTR预估 ……
X-Dragon Hypervisor
科学计算
气象预测,油气勘探 分子动力学研究 ……
……
高性能存储 • CPFS • ESSD
裸金属服务器 • 8*V100 • S K L 9 6 核CPU
加速比
TensorFlow ResNet-50分布式计算加速
500.0
90%
461.8
450.0
400.0
350.0
300.0
93%
250.0
237.9
200.0
150.0
120.2
100.0 60.6
50.0
30.6
1.0
2.0
3.9
7.8
15.3
0.0
1
2
4
8
16
32
64
128
256
512
GPU卡数
GPU计算实例新规格 GN6i ecs.gn6i.xxx
虚拟化
弹性裸金属 (神龙)
CPU
96核 Skylake
GPU 4 * T4
深度学习
3 2 0 * Tensor Core
8.1 TFLOPS FP32
视频转码 4 * GN5i
异构计算产品优势
全面的场景覆盖
规模化的基础设施
持续的技术创新
完整的生态链条ຫໍສະໝຸດ RDMA网络VPC 网络
RDMA 网络
裸金属服务器
VPC 网络
RDMA 网络
裸金属服务器
VPC 网络
RDMA 网络
裸金属服务器
弹性的GPU 资源
GPU实例支持热迁移
数据安全
更小的算力
更高的算力
提升GPU节点分布式计算效率
GPU 客户的普遍诉求
更低的成本 提高GPU利用率
数据存储的高可用
更高的网络带宽
谢谢聆听!
– 城市大脑 – 工业互联网
URLLC
• 高可靠低延时场景
– 无人驾驶 – 工业自动化
数据!数据!数据!
后摩尔时代的计算体系
CPU
GPU
FPGA
ASIC
阿里云异构产品,5G时代的 计算核动力。
最高的性能 /最低的成本
斯坦福DAWNBench竞赛 阿里云推理性能第一,成本最低
最高的分布式计算效率