当前位置:文档之家› 高性能并行计算基础架构知识讲解

高性能并行计算基础架构知识讲解

Datastream )
• 多指令流单数据流(MISD- Multiple Instruction stream Single
Datastream )
• 多指令流多数据流(MIMD- Multiple Instruction stream Multiple
Datastream )
自主创新★安全可控
并行计算机系统架构——结构分类
访问。 • 支持消息传递、共享存储模式的并行程序设计。
劣势
• 欠可靠:总线、存储器或操作系统失效可导致系统全部瘫痪。 • 可扩展性差:由于所有处理机共享同一个总线,而总线跟不上处理器速度和内存
容量的发展步伐。因此,SMP 并行计算机系统的处理机个数一般少于64 个。
自主创新★安全可控
并行计算机系统架构——结构分类-DSM
MB P/C
LM
DIR
NIC
定制网络 DSM
自主创新★安全可控
并行计算机系统架构——结构分类-DSM
• 普及时代
高性能计算机价格下降,应用门槛降低,应用开始普及。两个技术趋势起到重要作用。 商品化趋势使得大量生产的商品部件接近了高性能计算机专有部件 标准化趋势使得这些部件之间能够集成一个系统中,其中X86处理器、以太网、内存部 件、Linux都起到决定性作用。 机群系统是高性能计算机的一种,它的技术基础和工业基础都是商品化和标准化。
VP VP
VP
交叉开关
SM
SM
SM
PVP
MB P/C LM DIR NIC
P/C P/C
P/C
总线/交叉开关
SM
SM
IO
SMP
MB P/C LM DIR NIC
定制网络 DSM
MB P/C LM NIC
MB P/C LM NIC
定制网络 MPP
MB P/C
M
Bridge
LD
IOB
NIC
MB P/C
M
自主创新★安全可控
并行计算机系统架构——Flynn分类
根据指令流和数据流的不同,通常把计算机系统分为四类: • 单指令流单数据流(SISD -Single Instruction stream Single
Datastream)
• 单指令流多数据流(SIMD- Single Instruction stream Multiple
Bridge
LD
IOB
NIC
商品网络
COW 自主创新★安全可控
并行计算机系统架构——结构分类-SMP
• SMP对称多处理机系统
• 对称共享存储:系统中的任何处理机均可直接访问任何内存模块的存 储单元和I/O模块连接的I/O 设备,且访问的延迟、带宽和访问成功 率是一致的。所有内存模块的地址单元是统一编码的,各个处理机之 间的地位相同。操作系统可以运行在任意一个处理机上。
自主创新★安全可控
并行计算机基础——TOP10
no name information
1 天河二号 天河二号是由中国国防科技大学开发的超级计算机,今年以持续计算速度每秒3.39 亿亿次的优越性能位居榜首。天河二号有16,000个节点,每个节点两个Intel Xeon IvyBridge的处理器及合共3,120,000个计算核心的三个至强披处理器。
高性能并行计算架构
浪潮电子信息产业股份有限公司 2013-11-18
自主创新★安全可控
1
并行计算机基础
2
并行计算及系统架构
3
并行软件环境
4
高性能机群
自主创新★安全可控
自主创新★安全可控
并行计算机基础——发展历程
• 专用时代
包括向量机,MPP系统,SGI NUMA 系统,SUN大型SMP系统,也包括我国的神威, 银河,曙光1000等。 之所以称为“专用”,并不是说它们只能运行某种应用,是指它们的组成部件是专门 设计的,它们的CPU板,内存板,I/O板,甚至操作系统,都是不能在其它系统中使用 的。由于技术上桌面系统与高端系统的巨大差异,和用户群窄小。
自主创新★安全可控
1
并行计算机基础
2
并行计算及系统架构
3
并行软件环境
4
高性能机群
自主创新★安全可控
并行计算机系统架构——类型
• Flynn分类:
– SISD, SIMD, MIMD, MISD
• 结构模型:
– PVP, SMP, MPP, DSM, COW
• 访存模型:
– UMA, NUMA, COMA, CC-NUMA, NORMA
2 泰坦
泰坦是安装在美国能源部(DOE)的橡树岭国家实验室Cray XK7系统的超级计算机。 泰坦使用261,632其的NVIDIA K20x加速器核心,取得了持续计算速度每秒1.76亿 亿次的记录。泰坦是名单上最节能的系统之一,共消耗8.21兆瓦,并提供2,143 MFLOPS / W。
3 红杉
红杉是安装在美国能源部劳伦斯利弗莫尔国家实验室的一台IBM蓝色基因/ Q系统超 级计算机。红杉与2011出世,使用1572864核心并已取得了持续计算速度每秒1.72 亿次的性能记录。红杉也是名单上最节能的系统之一,共消耗7.84兆瓦,提供 2,031.6 MFLOPS / W
DSM分布式共享存储多处理机
分布共享存储: 内存模块物理上局部于各个处理器内部,但逻辑上(用户)是 共享存储的;这种结构也称为基于Cache目录的非一致内存访问(CCNUMA)结构; 与SMP的主要区别:DSM在物理上有分布在各个节点的局部内存从而形 成一个共享的存储器;
MB P/C
LM
DIR
NIC
4K
富士通的“K计算机”安装在日本神户的理化学研究所高级计算科学研究院( AICS ), 现在以持续计算速度每秒1.05亿亿次的记录位列第四,使用705,024 SPARC64处理 核心。
5 米拉
米拉是第二个蓝色基因/ Q系统的超级计算机,现在安装在阿尔贡国家实验室,名
列第五位。持续计算速度每秒8.59千
P/C
P/C
总线/交叉开关
SM
SM
IO
SMP
自主创新★安全可控
并行计算机系统架构——结构分类-SMP
优势
• 单一的操作系统映像:全系统只有一个操作系统,为每个处理器提供负载均衡。 • 局部高速缓存及其数据一致性:每个处理器均有自己的高速缓存,它们可以拥有
独立的局部数据,但是这些数据必须保持与存储器中的数据是一致的。 • 低通信延迟:通过共享数据缓存区来完成处理器的通信,延迟远小于网络通信。 • 共享总线的带宽:所有处理器通过一个总线完成对内存模块的数据和I/O设备的
相关主题