当前位置:文档之家› 计算机体系结构作业一

计算机体系结构作业一

计算机体系结构第一次报告
-----------计算机科学与技术S151000853 洪文杰
1. Brief of your research field
2. Name of the benchmarks in your research field
3. List of program of the benchmark and brief for each program
一、研究方向
我的研究方向是高性能计算(High Performance Compute),一般分为以下几个大方面:
1)并行计算(Parallel Computing)
2)高端计算(High-end Parallel Computing)
3)高性能计算(High Performance Computing)
4)超级计算(Super Computing)。

高性能计算(HPC) 指通常使用很多处理器(作为单个机器的一部分)或者某一集群中组织的几台计算机(作为单个计图1.HPC 总线网络拓扑算资源操作)的计算系统和环境。

有许多类型的HPC 系统,其范围从标准计算机的大型集群,到高度专用的硬件。

大多数基于集群的HPC系统使用高性能网络互连,比如那些来自InfiniBand 或Myrinet 的网络互连。

基本的网络拓扑和组织可以使用一个简单的总线拓扑,在性能很高的环境中,网状网络系统在主机之间提供较短的潜伏期,所以可改善总体网络性能和传输速率。

图(1)高性能计算结构模型
二、高性能计算的benchmarks
1)Linpack
高斯消元法求解线性代数方程组。

2)NPB(NAS Parallel Benchmark)
美国NAS项目开发,包含8个空气动力学计算类应用,测试范围从整数排序到复杂的数值计算。

3)LAPACK ScalLAPACK
稠密、带状矩阵之上的各类操作。

4)Perfect、SPLASH 、ParkBench
三、List of program of the benchmark and brief for each program
1)Linpack用于测试高性能计算机系统浮点性能的benchmark。

通过利用高性能计算机,用高斯消元法求解N元一次稠密线性代数方程组的测试,评价高性能计算机的浮点性能。

Linpack测试包括三类:
1、Linpack100求解规模为100阶的稠密线性代数方程组,它只允许采用编译优化选项进行优化,不得更改代码,甚至代码中的注释也不得修改。

2、Linpack1000要求求解规模为1000阶的线性代数方程组,达到指定的精度要求,可以在不改变计算量的前提下做算法和代码上做优化。

3、HPL即High Performance Linpack,也叫高度并行计算基准测试,它对数组大小N没有限制,求解问题的规模可以改变,除基本算法(计算量)不可改变外,可以采用其它任何优化方法。

HPL是针对现代并行计算机提出的测试
方式。

用户在不修改任意测试程序的基础上,可以调节问题规模大小N(矩阵大小)、使用到的CPU数目、使用各种优化方法等来执行该测试程序,以获取最佳的性能。

HPL采用高斯消元法求解线性方程组。

当求解问题规模为N时,浮点运算次数为(2/3 * N^3-2*N^2)。

因此,只要给出问题规模N,测得系统计算时间T,峰值=计算量(2/3 * N^3-2*N^2)/计算时间T,测试结果以浮点运算每秒(Flops)给出。

2)NPB
1、EP(Embarrassingly parallel)用于计算Gauss 伪随机数,因为它几乎不要求处理器之间相互通讯,所以很适合于并行计算,而所测得的结果往往可以作为一个特定并行系统浮点计算性能可能达到的上限;
2、MG(MultiGrid):用4个V循环多重网格算法求解三维波松方程的离散周期近似解;
3、CG (Conjugate Gradient):用于求解大型稀疏对称正定矩阵的最小特征值的近似值,它表征了非结构风格计算和非规整远程通信计算类问题:
4、FT(Fast Fourier Transformation):用于求解基于FFT谱分析法的三维偏微分方程,它也要求远程通信;
5、IS(Integer sort):用于基于桶排序的二维大整数排序,他要求大量的全交换通信。

另外还有计算流体力学中3个模拟程序:
1、LU(lower upper triangular):用于基于对称超松弛法求解块稀疏方程组;
2、SP(scalar penta-diagonal):用于求解5对角线方程组;
3、.BT(Block Tri-Diagonal): 用于求解3对角块方程组。

3)LAPACK ScalLAPACK
ScaLAPACK是LAPACK的增强版,主要为可扩放的,分布存储的并行计算机而设计的。

ScaLAPACK支持稠密和带状矩阵上各类操作,诸如乘法,转置和分解等。

4)PARKBENCH
目前,PARKBENCH包括4类:
1.底层基准程序:测试一些基本结构参数,诸如算数运算速度,高速缓存和存储器速度,通讯启动时间和带宽以及同步开销等;
2.核心基准程序:涉及到广泛的经常使用的科学计算子程序,诸如矩阵运算(稠密矩阵乘法,转置,LU分解,QR分解,矩阵三对角等),FFT运算,求解PDE和NPB核基准程序等;
3.密集应用基准程序:目前仅包括谱变换,浅水(shallow-water)模拟和3个NPB 模拟应用程序;
4.HPF编译基准序;测试HPF编译器性能,主要集中在显式并行HPF结构的并行实现上。

PARKBENCH是个正在研究的课题,测试程序的内容尚未完全定型。

目前所包含的核心测试程序主要来自PB。

相关主题