当前位置:文档之家› 天津大学并行计算1

天津大学并行计算1

ห้องสมุดไป่ตู้
17/2/21
/orgs/hpclab/
China Research Laboratory
FAST
§ 2007年立项,2016年竣工(国家大科学工程) § 1TB/天
15
17/2/21
/orgs/hpclab/
China Research Laboratory
China Research Laboratory
生命科学
§ DNA
9
17/2/21
/orgs/hpclab/
China Research Laboratory
天气预报
§ 由连续方程、热力学方程、 水汽方程、状态方程和 3个 运动方程(大气动力方程) 共 7个方程所构成的方程组。 § 网格点尺度决定预报精度
– 精度提高一倍,计算量提高 16倍
10
17/2/21
/orgs/hpclab/
China Research Laboratory
在线交易
§ 阿里,2016.11.11
– 成交1207亿元 – 物流定单数6.57亿 – 支付宝支撑12万笔/秒支付洪峰
11
17/2/21
并行计算概述
于策
17/2/21
/orgs/hpclab/
China Research Laboratory
Outline
§ 并行计算基本概念
– 应用需求 – 并行计算硬件 – 并行程序设计
§ 并行化方法
– 域分解(Domain decomposition) – 任务分解(Task decomposition) – 流水线(Pipelining)
5
17/2/21
/orgs/hpclab/
China Research Laboratory
为什么需要并行计算?
§ 单处理器性能提升受限
– 1986 – 2002,50%/年
• 每10年增长60倍
– 2002 以后,20%/年
• 每10年增长6倍
§ 存储、I/O
AST3
§ 10K*10K CCD § 200MB/2.4分钟 § 360GB/天 § 43.2TB/四个月
16
17/2/21
/orgs/hpclab/
CSTAR
China Research Laboratory
PLATO
Pre-HEAT HEAT
Quad cpu blade
FT-1000
On-line storage
Chips
30
17/2/21
/orgs/hpclab/
China Research Laboratory
天河一号计算系统
§ 计算处理系统:包含7168个计算结点和1024个服务结 点。
为什么需要并行计算?
§ 为满足不断增长的计算力需求 – 用速度更快的硬件,也就是减少每一条指令所需时间 – 优化算法(或者优化编译) – 用多个处理机(器)同时解决一个问题
• 并行计算
§ 计算机硬件及网络技术的发展 – 集群的广泛应用 – 多核处理器技术的驱动
• 并行计算环境无处不在,应用程序必须能够支持并行执行才能够充 分利用计算能力
Sparse Aperture Arra
Dense Aperture Arra
Radio Dishes
/orgs/hpclab/
China Research Laboratory
LAMOST
§ 同时观测4000个天体 § 3-5GB/天,1-2TB/年
14
/orgs/hpclab/
China Research Laboratory
12
数值模拟(Simulation)
§ Evolution of the universe, galaxy, star……
/orgs/hpclab/
China Research Laboratory
Observation data sources
§ Hubble Space Telescope
• 5GB/day
18 /orgs/hpclab/
China Research Laboratory
Observation data sources
7
17/2/21
/orgs/hpclab/
China Research Laboratory
应用需求
http://www.aics.riken.jp/en/kcomputer/what.html
8 17/2/21 /orgs/hpclab/
China Research Laboratory
并行计算硬件发展
§ 超级计算机
– Top500排名 – 我国的超级计算机
§ 多核处理器
– IBM、SUN、Intel、AMD。。。。。。
§ GPU/Cell BE
– Nvidia、AMD(ATI)、IBM
23
17/2/21
/orgs/hpclab/
Outline
§ 并行计算基本概念
– 应用需求 – 并行计算硬件 – 并行程序设计
§ 并行化方法
– 域分解(Domain decomposition) – 任务分解(Task decomposition) – 流水线(Pipelining)
22
17/2/21
/orgs/hpclab/
3
17/2/21
/orgs/hpclab/
China Research Laboratory
并行计算
任务队列 可分解的 计算任务
处理器
...
串串行行行

并行行行

4
17/2/21
/orgs/hpclab/
China Research Laboratory
§ LSST (under construction, Chile)
– Large Synoptic Survey Telescope – 18TB/day (estimation)
21 /orgs/hpclab/
China Research Laboratory
§ 首次完全用“中国芯”制造的中国最强大的超级计算机
/orgs/hpclab/
China Research Laboratory

26
17/2/21
/orgs/hpclab/
China Research Laboratory
AST3
FTS
2.5m optical/IR
6-8m Optical/IR
5m THz 15m THz
Extremely Large Optical/IR Telescope
17 17/2/21
FIR Interferometer
/orgs/hpclab/
§ 13.7m-aperture radio-telescope on the milimetre waveband
– China – 1TB/day
19 /orgs/hpclab/
China Research Laboratory
Observation data sources
31
17/2/21
/orgs/hpclab/
China Research Laboratory
天河:自主研发
§ 芯片:飞腾-1000 CPU,高阶路由芯片NRC ,高速网 络接口芯片NIC § 结点:计算、服务、I/O管理、I/O存储 § 网络:互联通信网、维护诊断网 § PCB板:15种
China Research Laboratory
Top500, 2016.11
/orgs/hpclab/
China Research Laboratory
神威-太湖之光
§ 全球第一台运行速度超过10亿亿次/秒的超级计算机
– 峰值性能高达12.5亿亿次/秒,持续性能达到9.3亿亿次 /秒,接近“天河二号”的3倍。
– 数据访问/传输的速度提升,远落后于处理器
6
17/2/21
/orgs/hpclab/
China Research Laboratory
Outline
§ 并行计算基本概念
– 应用需求 – 并行计算硬件 – 并行程序设计
§ 并行化方法
– 域分解(Domain decomposition) – 任务分解(Task decomposition) – 流水线(Pipelining)
China Research Laboratory
Square Kilometer Array (SKA) ~2024
§ 1 EB per day § 100 PFlop/s processing power § ~1 EB processed data/year § Headquarters in UK
28 17/2/21 /orgs/hpclab/
China Research Laboratory
天河一号
§ 一期系统于2009年9月研制成功,峰值性能为每秒1206 万亿次双精度浮点运算(TFlops),持续性能为 563.1TFlops(LINPACK实测值),2009年11月TOP 500排名,位列亚洲第一、世界第五。 § 二期系统于2010年8月在国家超级计算天津中心升级完 成,峰值性能提升为4700TFlops,持续性能提升为 2507TFlops(LINPACK实测值),部分采用了自主研 制的飞腾-1000中央处理器,2010年11月TOP 500排 名世界第1。
29
17/2/21
/orgs/hpclab/
China Research Laboratory
天河一号
Cabinet (4 x rack) rack Twin GPU blade Compute node
相关主题