当前位置:
文档之家› 计算机高性能体系结构复习资料整理
计算机高性能体系结构复习资料整理
第二章高性能计算机性能测评
并行度:指令并行执行的最大条数。在指令流水中,同时执行多条指令称为指令 并行。 并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要 在时间上相互重叠,就存在并行性。它包括同时性与并发性两种含义。 加速比:(speedup),是同一个任务在单处理器系统和并行处理器系统中运行消 耗的时间的比率,用来衡量并行系统或程序并行化的性能和效果。 绝对加速比:
简述题
第一章高性能计算与高性能计算机
何为高性能计算,研究高性能计算有何意义? 高性能计算(英文 high performance computing, 缩写 HPC) 指通常使用很多处 理器(作为单个机器的一部分)或者某一集群中组织的几台计算机(作为单个计 算资源操作)的计算系统和环境。 意义:1)高性能计算的内在含义
与严格按照程序顺序执行时指令 i 的现场不同。反之,如果发生异常时,处理机的现场跟严 格按程序顺序执行时指令 i 的现场相同,则称为精确异常。)
VLIW:超长指令字(Very long instruction word)指的是一种被设计为可以利 用指令级并行(ILP)优势的 CPU 体系结构。一个按照顺序执行指令的非超标量处 理器不能充分的利用处理器的资源,有可能导致低性能。 超标量:一种多指令流出技术。它在每个时钟周期流出的指令条数不固定,依代 码的具体情况而定,但有个上限。 超流水:在一个时钟周期内分时流出多条指令。 超长指令字:一种多指令流出技术。VLIW 处理机在每个时钟周期流出的指令条 数是固定的,这些指令构成一条长指令或者一个指令包,在这个指令包中,指令 之间的并行性是通过指令显式地表示出来的。 全局指令调度:需要在多个基本块间移动指令的调度被称为全局指令调度。 路径(踪迹)调度:(trace scheduling),踪迹是程序执行的指令序列,通常有 一个或多个基本块组成,踪迹内可以有分支,但不一定包含循环。踪迹调度会优 化执行频率高的踪迹,减少其执行开销,踪迹调度包括踪迹选择和踪迹压缩两个 步骤。 关键路径:是指根据指令间相关关系构成的数据流图中延迟最长的一条路径。 循环展开:是一种增加指令间并行性最简单和最常用的方法。它将循环展开若干 遍后,通过重命名和指令调度来开发更多的并行性。 循环级并行:循环的不同叠代之间存在的并行性。 谓词执行:( predicated execution) 是显式并行技术( EPIC ) 的一个重要的 组成部分, 是条件执行技术的一种实现, 它为每条指令增加一个源操作数( 即 谓词) 作为指令执行条件, 当谓词为真时执行指令中的操作, 否则将其转换为 空操作处理。 软 件 流 水 : 软 件 流 水 是 一 种 重 组 循 环 体 的 技 术 , 在 软 件 流 水 循 环 ( Software pipeline loop)的每一次迭代(即新的重组后的循环)体是由原循环的不同迭 代中选出的指令组成的,可以达到消除相关性的目的。软件流水技术是通过对循 环重新进行建构,使得每次迭代执行的指令是属于原循环不同迭代过程的,是用 来安排循环指令,是这个循环的多次迭代并行执行的一种技术。 结构冒险(冲突 Hazard):在流水线处理机中,如果某种指令组合因为资源冲突 不能正常执行则称该处理机有结构冲突,这种情况发生在功能部件不是完全流水 或者资源份数不够时。
本资料是鹤鹤精心整理,仅限内部使用!!!
计算机高性能体系结构复习资料
名词解释
第一章高性能计算与高性能计算机
MPP:大规模并行处理计算机:Massive Parallel Processor。由大量通用微处 理器构成的多处理机系统,适合多指令流多数据流处理。 SMP:(Symmetric Multi-Processing)对称多处理结构的简称,是指在一个计 算机上汇集了一组处理器(多 CPU),各 CPU 之间共享内存子系统以及总线结构。 在这种技术的支持下,一个服务器系统可以同时运行多个处理器,并共享内存和 其他的主机资源。 DSM:分布共享存储,内存模块物理上局部于各个处理器内部,但逻辑上(用户) 是共享存储的;这种结构也称为基于 Cache 目录的非一致内存访问(CC-NUMA) 结构; 高性能计算机:(也称作巨型计算机、超级计算机)由多个计算单元组成,运算 速度快、存储容量大、可靠性高的计算机系统。 并行计算机:由多个处理单元组成的计算机系统,这些处理单元相互通讯和协助, 能够告诉、高效地求解大型复杂问题。 共享存储器多处理机码除了入口和出口以外,没有其他分支指令 和转入点,则称之为一个基本程序块。
指令相关:是指指令之间存在的相互依赖的关系,属于程序固有的属性。 指令级并行:简称 ILP。是指指令之间存在的一种并行性,利用它,计算机可以 并行执行两条或两条以上的指令。 指令调度:为了充分发挥流水线的作用,必须设法让它满负荷的工作,这就要求充分开发指
A. 指令 i 产生的结果被指令 j 使用;
B. 指令 j 与指令 k 数据相关,而指令 k 与指令 i 数据相关。 数据相关:考虑两条指令 i 和 j,i 在 j 的前面,如果下述条件之一成立,则称 指令 j 与指令 i 数据相关: (1)指令 j 使用指令 i 产生的结果; (2)指令 j 与指令 k 数据相关,而指令 k 又与指令 i 数据相关 精确异常:(所谓不精确异常,是指:当执行指令 i 导致发生异常时,处理机的现场(状态)
将最好的串行算法与并行算法相比较. 定义一(与具体机器有关)将最好的串行算法在一台处理机上的运行时间与 并行算法在 N 台处理机上运行的时间相比。 定义二(与具体机器无关)将最好的串行算法在最快的顺序机上的执行时 间与并行算法在并行机上的运行时间相比。 相对加速比:同一并行算法在单节点上运行时间与在多个相同节点构成的处理机 系统上的运行时间之比。这种定义侧重于描述算法和并行计算机本身的可扩展性。 并行机的可扩展性:对任意数量级的处理机和任意规模的问题,若所有算法的系 统效率都为 1,则系统是可扩展的。
令之间存在的并行性,找出不相关的指令序列,让它们在流水线上重叠并行执行,这一工作
就是指令调度。
指令的静态调度:是指依靠编译器对代码进行静态调度,以减少相关和冲突。它 不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。 指令的动态调度:是指在保持数据流和异常行为的情况下,通过硬件对指令执行 顺序进行重新安排,以提高流水线的利用率且减少停顿现象。是由硬件在程序实 际运行时实施的。 乱序执行技术:乱序执行(out-of-order execution)是指 CPU 采用了允许将多 条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。 推测执行:允许在处理器还未判断指令是否执行之前就提前执行。 分支预测:(Branch Prediction):从 P5 时代开始的一种先进的,解决处理分支 指令(if-then-else)导致流水线失败的数据处理方法,由 CPU 来判断程序分支 的进行方向,能够加快运算速度。 保留站:在采用 Tomasulo 算法的 MIPS 处理器浮点部件中,在运算部件的入口设 置的用来保存一条已经流出并等待到本功能部件执行的指令(相关信息)。 记分牌:是一集中控制部件,其功能是控制数据寄存器与处理部件之间的数据传 送。在记分牌中保存有与各个处理部件相联系的寄存器中的数据装载情况。当一 个处理部件所要求的数据都已就绪(装载完毕),记分牌允许处理部件开始执行。 当执行完成后,处理部件通知记分牌释放相关资源。所以在记分牌中记录了数据 寄存器和多个处理部件状态的变化情况,通过它来检测和消除或减少数据相关性, 加快程序执行速度。 流水线:是多条指令同时执行的一种实现技术,是一种在连续指令流中开发指令 级并行性的技术。 流水线技术:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程 都可有效地在其专用功能段上与其它子过程同时执行。 数据竞争:当指令在流水线中重叠执行时,因需要用到前面指令的执行结果而发 生的冲突。 控制竞争: 流水线遇到分支指令或其它会改变 PC 值的指令所引起的冲突。 结构竞争:因硬件资源满足不了指令重叠执行的要求而发生的冲突。 反相关:(Anti-dependence)(硬件出现冒险的 WAR) 指令 j 写入一个指令 I 将 读取的寄存器或存储器位置,并且指令 I 首先执行 名相关:(name dependence)两条指令使用相同名字(寄存器或存储器位置),但 是却不交换数据 输出相关:(Output dependence)(硬件出现冒险的 WAW) 指令 i 和指令 j 写入 相同的寄存器或存储器位置;必须保证指令的执行顺序 控制相关:是指由分支指令引起的相关。它需要根据分支指令的执行结果来确定 后面该执行哪个分支上的指令。 真数据相关:数据相关(真相关)。如果满足以下两个条件,则称指令 j 与指令 i 是数据相关的:
2)高性能计算的应用需求 3)高性能计算的战略地位 何为并行计算机?简述当代几种主流的并行计算机系统 并行计算机是由多个处理单元组成的计算机系统,这些处理单元相互通讯和协助, 能够高速、高效地求解大型复杂问题。 流行的并行计算机系统:对称多处理机系统(SMP)、分布式共享存储系统(DSM)、 大规模并行计算机系统(MPP)、集群系统(Cluster)、并行向量机(PVP)工作站 机群(COW)等。 何为 CMP?请简单说明 CMP 与 SMP 的关系 CMP:单芯片多处理器(Chip multiprocessors,简称 CMP),也指多核心。是由 美国斯坦福大学提出的,其思想是将大规模并行处理器中的 SMP(对称多处理器) 集成到同一芯片内,各个处理器并行执行不同的进程。CMP 相当于集成的 SMP。 简述 MPP 和集群系统之间的主要区别(异同点) MPP 系统多于 100 个 PE,消息传递、分布存储,峰值可达到 3Tperformance,可 扩展,价格昂贵,市场有限,可解决高难度问题,是国家综合实力的象征; Culster: 包括 NOW 和 COW 两种;其特点是:投资风险小,软件财富继承性好, 可构成异构系统,资源利用率高,通信开销大等特点 MPP(巨型并行处理):这种系统的节点都有自己的 CPU,并有自己的专有资源。 此种结构相对独立,但各个节点一般没有完全存取 I/O 的能力。 集群:集群系统是由独立的计算机组成,但有控制管理工具统一管理。 现有的高性能计算机有哪几种典型结构 对称多处理机系统(SMP)、分布式共享存储系统(DSM)、大规模并行计算机系统 (MPP) ,节点可以是单处理器的节点,也可以是 SMP、集群系统(Cluster)、并 行向量机(PVP)、Constellation 简述高性能计算机系统的应用领域以及几种典型的并行应用系统 生物医学:蛋白质电子态的计算、药物发明中的筛选过程、蛋白质折叠