当前位置:
文档之家› 曙光超算推动气象模式应用发展
曙光超算推动气象模式应用发展
do lm=1,mlength m = locm(lm,iam) lmr = lnstart(lm) if (m .eq. 1) then
do lm=1,mlength m = locm(lm,iam) lmr = lnstart(lm) if (m .eq. 1) then lmwave0 = lm lmrwave0 = lmr endif do n=2,nlen(m), 2 dalpn(lmr+n) = ldalp(lmr+n,irow)*rsq(m+n-1)*ra end do
式
5000
0 GRAPES-GLOBAL(0.25) GRAPES-GLOBAL(0.125)
GRAPES-MESO
GRAPES-4DVAR
GRAPES-SVD
200000 150000
IBM PI-Sugon
Time(s)
100000
50000
0 BCC_CSM
BCC_AGCM
“派”系统运行业务模式
32,576.6 1,649
25,326.3 2,272 27,112.5 8,209 20,132.7 7,890 43,902.6 3,844
持续性能
• ECMWF模式发展(2025实现5km全球集合预报)
ExaFlops
(Schulthess et al, 2018)
特征
• 计算性能E级、高能效、多架构并存 • 计算复杂性增加,如何发挥能力 • 气象模式向着更高时空分辨率,更复杂物理过程、集合预
560,640
8
DOE/NNSA/LLNL United States
Sequoia - BlueGene/Q, Power BQC 16C 1.60 GHz, Custom , IBM
1,572,864
9
DOE/NNSA/LANL/SNL United States
Trinity - Cray XC40, Intel Xeon Phi 7250 68C 1.4GHz, Aries interconnect , Cray Inc.
IBM(北京局曙光) 曙光
1.7X
1200核 800核
北京局冬奥WRF
BCC_AGCM模式GPU计算
Inverse LT
>3X
Gaussian Quadrature
肖洒, 2017
do j=1,plat/2
ILT
call grcalcs(j, ztodt, grts(1,1,j), grths(1,1,j), grds(1,1,j), &
“派”曙光高性能计算机系统-绿色节能
众核(24节点,73.1TFlops) GPU(24节点,
289.5TFlops) 共享可用存储容量691.2TB
“派”曙光高性能计算机系统-能力规模
根据最新全球HPC TOP500排名,全球气象机构中,英国气象局共拥有3套P级高性 能计算机系统,总体能力最高,而中国气象局在引进“派”以后,总体系统规模将 超过欧洲中期气象中心ECMWF,跃居世界气象部门前列。
业务模式
主要天气/气候模式发展规划
“派”曙光高性能计算机系统-系统架构
与现有IBM系统架构相同:
两套互备子系统 通用Intel CPU处理器 Cluster架构 计算资源相对独立 共享存储资源,提高业务可靠性
比现有IBM系统新增:
小规模试验子系统
适应新技术发展,支持GPU/众核环境下 气象模式系统的研发及试验。
• 北京市气象局冬奥模式 • GRAPES_GFS 25km业务模式 • GRAPES_MESO 3km 业务模式
运行时间(秒)
12000 10000
8000
2048核
30小时
3.7X
1.87X
6000
48小时
4000
3840核
2000
0 GRAPES_GFS(25km)
GRAPES_MESO(3km)
1,572,480
National Super Computer Center in
Tianhe-2A - TH-IVB-FEP Cluster, Intel Xeon E5-
4
Guangzhou
2692v2 12C 2.2GHz, TH Express-2, Matrix-2000 ,
4,981,760
361,760
DOE/SC/Oak Ridge National
7
Laboratory
United States
Titan - Cray XK7, Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x , Cray Inc.
超级计算机“派”推动中国气象应用
高性能计算室 国家气象信息中心
内容
• 超算及气象模式发展 • CMA超算及气象模式发展 • CMA “派”曙光超级计算机介绍 • 气象模式异构计算
Rank
Site
System
Cores
DOE/SC/Oak Ridge National
1
Laboratory
United States
979,968
Rmax (TFlop/s) 122,300.0 93,014.6 71,610.0 61,444.5
19,880.0
19,590.0 17,590.0 17,173.2 14,137.3
Rpeak Power (TFlop/s) (kW) 187,659.3 8,806 125,435.9 15,371 119,193.6 100,678.7 18,482
grza, grua, gruha, grva, grvha, &
grpsa, grdpsa, grpma, grpla, tmpSPEcoef)
!$ACC END DATA
!$ACC DATA PRESENT(…) CREATE(…) !$ACC KERNELS !$acc loop do l=1, plat/2 !acc loop
grzs(1,1,j), grus(1,1,j), gruhs(1,1,j), grvs(1,1,j), grvhs(1,1,j), &
grpss(1,j), grdpss(1,j), grpms(1,j), grpls(1,j), tmpSPEcoef)
call grcalca(j, ztodt, grta(1,1,j), grtha(1,1,j), grda(1,1,j), &
谢谢
end do ...
Kernel codes
lmwave0 = lm lmrwave0 = lmr endif !$acc loop do n=2,nlen(m), 2 dalpn(lmr+n) = ldalp(lmr+n,irow)*rsq(m+n-1)* end do end do end do !$ACC END KERNELS … !ACC END DATA
“派”曙光高性能计算机系统-性能指标
总体能力:
计算能力:8,189.5TFLOPS 存储能力:23,088TB CPU总核数:98,432 内存容量:690,432GB 节点数量:3,076 硬盘数量:4,200 机柜数量:78 全年PUE:1.23
每个子系统包括:
1504*计算节点 24*前后处理节点 10*登录节点 8*管理节点 66*存储节点 3*648口核心IB交换机 102*36口接入IB交换机 17*以太网交换机
“派”高性能计算机系统
16000 14000
14166.8
Peak Performance(TFlops)
12000
计算能力 8,189.5 TFLOPS
10000
8000
为原有设计10倍、现有系统8倍; 6000
存储容量 23,088 TB
4000
11460
10010.8
8498.65
6835.9
Sunway TaihuLight - Sunway MPP, Sunway SW26010 260C 1.45GHz, Sunway , NRCPC
10,649,600
3
DOE/NNSA/LLNL United States
Sierra - IBM Power System S922LC, IBM POWER9 22C 3.1GHz, NVIDIA Volta GV100, Dualrail Mellanox EDR Infiniband , IBM
China
NUDT
National Institute of Advanced
AI Bridging Cloud Infrastructure (ABCI) -
5
Industrial Science and Technology (AIST)
PRIMERGY CX2550 M4, Xeon Gold 6148 20C 2.4GHz, NVIDIA Tesla V100 SXM2, Infiniband
Summit - IBM Power System AC922, IBM POWER9 22C 3.07GHz, NVIDIA Volta GV100, Dual-rail Mellanox EDR Infiniband, IBM
2,282,544
2
National Supercomputing Center in Wuxi China
Japan
EDR , Fujitsu
391,680
Swiss National Supercomputing
6
Centre (CSCS)