当前位置：文档之家› 超级计算机现状和我国发展规划

超级计算机现状和我国发展规划

12/4/2015
3
超级计算机现状和发展规划
天河二号 2013年，5.5万万亿次 2013年天河二号5.49万万亿次
TH-1A，2010年，
4.7PFlops
从 1.6亿次到5.49万万亿次； 1993, 19Gflops 38年性能提高了340000000倍
CrayT3D
Cray T3E-1200 1998年1Tflops
2015/12/4
% 100% 0.41% 10.33% 20.09% 59.73% 3.11% 6.33%
512 GPU 62.22 0.70 16.17 17.48 12.63 4.93 10.31
% 100% 1.13% 25.99% 28.10% 20.30% 7.92% 16.56%
speedup 2.5
航空航天
Aero and Space craft design
土木建筑设计分析
BIM
可控核聚变
Nuclear fusion
金融工程
Financial Engineering
气象预报
Weather forecast
基础科学研究等
Research on Basic sciences
超级计算的重要作用：提升国家创新能力，加速战略性新兴产业发展 Improve the national innovation ability and accelerate the development of
12/4/2015
5
超级计算机现状和发展规划

超级计算机是国家综合科技创新能力的基础支撑，全球各大国家均大力发展超级计算机中国近几年在大力发展超级计算机
12/4/2015
6
天河超级计算机发展
Development history of Tianhe supercomputer 1978年，由小平批准，国防科大开始研制“银河-1” 从此，开始了中国研制超级计算机的艰难和辉煌的历程
天河二号天河一号银河-2 银河-1 100Mflops,1983 12/4/2015 1Gflops,1990 银河-3 10Gflops,1997
7
55Pflops,2013
4.7Pflops,2010
科技部高性能计算计划 : 2016-2020
MOST projects on HPC: 2016-2020 高性能计算机 Supercomputer R&D
高性能计算的主要应用领域
The main application area of HPC
石油勘探
Oil Exploration

动漫设计
Animation Design
生物医药
Biological medicine
高端装备制造
The high-end equipment manufacturing
12% of pushe kernel time. 临时数组直接在GPU中分配使用GPU的寄存器来存放部分数组不变数组只在第一调用kernel时传递到GPU 算法优化（针对shifte）
分级并行紧致化：通过分级scan方法并发执行 SHIFTE gets ~1.8x speedup 串行代码与kernel并发执行在GPU内部使用多流，使kernel间并发执行
communication technology
“天河一号”的运算速度比橡树岭国家实验室的要快大约40%，这是运算速率的极大提升。中国同时研制了一种互联技术，让这些处理器相互联系，这不是美国的技术，而是中国自己的技术。这是一个创举。
The technology belongs to China, not U.S., it’s a pioneering work -- 美国田纳西大学教授杰克•唐加拉 Prof. Jack Dongarra, Tennessee University
157.79 0.64 16.30 31.70 94.25 4.90 10.00
1.8 7.5
20
聚变技术开发及相关合作
Weak Scaling Test
GTC总体性能有2~3倍的加速，同时程序具有良好的可扩展性。
2015/12/4
21
聚变技术开发及相关合作
合作单位：中科院等离子体所

边界湍流模拟程序BOUT++在天河上的扩展性测试及分析：将 BOUT++成功部署到天河系统，并进行多组扩展性测试。
建立协同研发的机制，集中优势力量，突破核关键技术研制Eflops超级计算系统（1000 Pflops)

高性能计算应用
HPC applications Support
建立适应不同行业的国家高性能计算应用软件中心部署行业能力型重大应用软件系统的研发，构建能力型行业重大应用数值模拟软件平台部署容量型普适推广应用课题，部署于国家超算中心等，培育、吸引和稳定一批自主应用软件系统的用户
2015/12/4 19
聚变技术开发及相关合作
以512个节点为例说明GPU对electron模块的加速
Profile of the CPU and GPU version for 512 MPI processes/6 openMP threads run
512 CPU total time field iron shifte pushe possion electron other
1997
4
1983
1992
超级计算机现状和发展规划
提高超级计算机性能的三驾马车
主频、指令级并行、并行度
足够宽（数万结点）足够深（核间、异构、SIMD、指令级）

并行度

“三驾马车”中两驾无力，只有靠扩大并行度
– “Performance = Parallelism”，Bill Dally
Remark from international academia
中国的“天河一号”采取的CPU与GPU融合的结构，代表了未来超级计算机的发展趋势。随着计算机规模的不断拓展，这种结构虽然不是唯一的解决方法，但目前看来是最好的。
The architecture is not the only solution, but the best so far -- 美国斯坦福大学计算机系主任比尔•戴利 Billy Daley, Computer Science College, Stanford University
CPU+GPU异构融合体系结构
CPU+GPU heterogeneous architecture
64位多核多线程自主飞腾1000 CPU
64 bits Multi-core and Multi-thread CPU
自主高速互连通信技术
Self-developed High-speed interconnect
2014年10月11日—31日的作业运行状况
2015/12/4
15
天津超算中心运营情况
“天河一号”系统稳定运行服务，支撑国家重大科研项目超过800项
国家自然科学基金项目超过600项 863和973项目超过100项其他重大项目（工信部、发改委、中石油、中海油等）超过40项国际和地区项目超过10项
2015/12/4
17
聚变技术开发及相关合作
实际操作
GTC程序移植到“天河一号” 程序部署热点分析 Pushe: 获得网格点上的场数据，根据作用力更新电子的位置 Shifte: 高度串行化计算 MPI操作
2015/12/4
18
聚变技术开发及相关合作程序的具体优化策略
存储器访问优化（针对pushe）
服务全国大部分省份（包含香港地区），2014年服务用户已经超过 600余家
2015/12/4
16
聚变领域研究合作
合作单位：北京大学、中国科学技术大学、浙江大学、nvidia

托卡马克“回旋环形等离子体代码”GTC程序的GPU开发与优化
模拟规模：~50,000 cores，每秒模拟的电子数达300多亿
IBM BlueGene/L 2005年，367Tflops 2007年，596Tflops
走鹃，2008年，
1千万亿次
Cray-YMP 1988年，2.3Gflops Cray-1 1976 160Mflops
IBM红色选择 1999年，3万亿次
39年前第一台商用巨型机问世
12/4/2015
日本地球模拟器 2002年，40Tflops

互联：

MPI实现：
2015/12/4
23
聚变技术开发及相关合作
在Edison和天河一号上的测试对比
9
NSCC-TJ
我国目前已投入运营的应用范围最广、
综合支撑能力最强的国家级超算中心
• 峰值4700万亿次的天河一号超级计算机； • 400台以上服务器的通用云计算系统；
• 容量超过10PB的海量存储系统；
• 多领域行业软件； • 完善的网络基础设施；
• 完善的机房、供电、制冷等基础设施。
主要业务为高性能计算、云计算和大数据服务，目前服务的政府、企业及科研院所用户数已达600余家
超级计算机现状和我国发展规划
汇报内容 Outline
超级计算机现状和我国发展规划国家超算天津中心及天河一号介绍未来国家超算天津中心重点研发方向与资源
更新规划
12/4/2015
2
第一部分
超级计算机现状和国内发展规划
HPC development strategy and situation

e商务文档

超级计算机现状和我国发展规划

相关文档推荐：