当前位置:
文档之家› 并行算法第二章 并行计算性能测评..
并行算法第二章 并行计算性能测评..
S 1 1 T T P 1 o 1 o Te W
E
说明: 如果问题规模W 保持不变,处理器数 p增加,开 W随P按什么比例 增加 销T 增大,效率E下降。
o
为了维持一定的效率(介于0与1之间),当处理 数p增大时,需要相应地增大问题规模W的值。
39
等效率度量标准
曲线 3 曲线 2
第二章 并行计算性能测评
1
Questions
机器 性能
2
1
对自己的计算机(手机)有 没有不满意的地方?
有没有升过级?
3
有没有评价是否值得升级?
2
主要内容
1
2 3
什么是并行计算机的基本性能? 为什么要研究机器的性能测评? 如何测评计算机的性能?
4
如何提高并行系统的性能?
3
计算机的性能
Performance: 通常是指机器的速度,它是程 序执行时间的倒数 程序执行时间:是指用户的响应时间 (访问磁 盘和访问存储器的时间, CPU时间, I/O时 间以及操作系统的开销) CPU时间:它表示CPU的工作时间,不包括 I/O等待时间和运行其它任务的时间
paro
为并行开销
7
算法级性能评测
1
加速比性能定律
2
可扩放性测评标准
Amdahl定律
Gustafson定律 Sun和Ni定律
等效率测评标准
等速度测评标准 平均延迟度量标准
8
2.1 加速比定律
并行系统的加速比:对于一个给定的应用,并行算
法(或并行程序)的执行速度相对于串行算法(或
串行程序)的执行速度加快了多少倍。
加速比:由3个定律可知,增加PE和求解问题的
规模可以提高加速比
影响加速比的因素:处理器数与问题规模
求解问题中的串行分量 并行处理所引起的额外开销(通信、等待、 竞争、冗余操作和同步等) 加大的处理器数超过了算法中的并发程度
33
一、并行计算的可扩放性
增加规模有利于提高加速比的因素: 较大的问题规模可以提高较高的并发度 额外开销的增加可能慢于有效计算的增加 算法中的串行分量比例不是固定不变的(因 问题规模增加而缩小)
18
1. 加速比公式
Gustafson加速定律 :
WS pWp WS pWp S' WS p Wp / p WS WP
说明:
S' p (1-f) f
当f很小时,S’与P斜率为1-f
当p →∞ 时,S’随着PE的增加而增加,几乎与
处理器数成比例的线性增加,f不再是程序的
25
1. 加速比公式
G(p):存储容量增加到p倍时并行工作负载的增加 情况
扩大存储容量后的工作负载W =fw+(1-f)G(p)W
fW 1 f G p W f 1 f G p S fW 1 f G p W / p f 1 f G p / p
等速度度量标准
p 表示处理器个数
W表示要求解问题的工作量或称问题规模(在
此可指浮点操作个数)
T为并行执行时间
并行计算的速度V: V=W/T
p个处理器的并行系统的平均速度 V 定义为:
V V W p pT
44
等速度度量标准
W是使用p个处理器时算法的工作量,令W’表示当处理
4
为什么要进行并行机性能评测?
对管理人员来说: 发挥并行机长处,提高并行机的使用效率 对用户来说 减少用户购机盲目性,降低投资风险
对架构师和设计人员来说:
改进系统结构设计,提高机器的性能 促进软/硬件结合,合理功能划分 优化 “结构-算法-应用”的最佳组合 对市场人士来说:
工作负载W
曲线 1
处理器数 P
曲线1表示算法具有很好的扩放性; 曲线2表示算法是可扩放的; 曲线 3表示算法是不可扩放的。
40
等效率度量标准
优点:通过少量的参数可计算出等效率函数 缺点:如果To无法计算出(在共享存储并行机中)
41
2.2.2 等速度度量标准
等效率度量标准的缺点:T0不能方便地计算出来 1994年两位学者提出试验测试为主要手段的两种 标准:等速度、平均延迟
p→∞时,上式极限为
1 S f w0 / w
串行分量和并行额外开销的比例越大,则加速比越小。
16
例题
在不考虑通信开销的情况下,若达到(不小于) 50%的加速效率(加速比与p的比值),串行 计算部分f和所使用的处理器数目p之间应该存 在怎么样的不等式关系? 若 f=0.5,则p只能取多少?
W:串行算法所完成的计算量
Te
i t e i 0 p 1
To
i t o i 0
p 1
对于任意i,显然有T
p
= tie + t io ,且 T e+ T o=所完成的计算量W=Te
等效率度量标准
S Te Te p p Te To T T Tp 1 o 1 o p Te W
基本思想: 只要存储空间许可,应尽量增大问题规模以产生更好和 更精确的解(此时可能使执行时间略有增加)。 假定在单节点上使用了全部存储容量M并在相应于W的 时间内求解之,此时工作负载W= fW + (1-f)W。 在p 个节点的并行系统上,能够求解较大规模的问题是 因为存储容量可增加到pM。令因子G(p)反应存储容 量增加到p倍时并行工作负载的增加量,所以扩大后的 工作负载W = fW +(1-f)G(p)W。
和 N i 加速均比 Amdahl 加速和 Gustafson 加速为高。
27
Sun 和 Ni定律
28
Sun 和 Ni定律
29
修改后的加速比
并行开销W o:
fW 1 f WG p f 1 f G p S fW 1 f G p W / p WO f 1 f G p / p WO /W
42
为什么用等速度度量标准
速度是一个重要的参数,一般可以明确指出,单位 Mflops,因此用速度来度量可扩放性,应更加方便。 在并行系统中,增加P可以提高速度,如果速度能随着 P的增加而增加,即意味着平均速度不变 p个处理器的并行系统的平均速度定义为并行速度V除 以处理器个数 p:
43
两者可按不同比例进行调整,此比例关系
(可能是线性的,多项式的或指数的等)就
反映了可扩放的程度
36
可扩放性评测标准
可扩放性研究的主要目的: 确定解决某类问题用何种并行算法与何种并行体系 结构的组合,可以有效地利用大量的处理器; 对于运行于某种体系结构的并行机上的某种算法当 移植到大规模处理机上后运行的性能; 对固定的问题规模,确定在某类并行机上最优的处
34
可扩放性评测标准
增加处理器数,会增大额外开销和降低处理器 利用率,所以对于一个特定的并行系统(算法 或程序),它们能否有效利用不断增加的处理 器的能力应是受限的,而度量这种能力就是可 扩放性这一指标。
35
1.可扩放性的内涵
可扩放性:调整什么和按什么比例调整
并行计算要调整的是处理数p和问题规模W
12
3.Amdahl定律的几何意义
不论PE个数有多
少,可并行计算量
是不变的。
13
Amdahl定律的几何意义
随着PE的增大,Tp可能 会越来越小,但T1不会 改变
14
Amdahl定律的几何意义
15
4. 修改后的加速比—考虑额外开销
W o为额外开销
WS WP W p S WP W (1 f ) 1 f ( p 1 ) W p / W 0 WS W0 fW W0 p p
提供客观、公正的评价并行机的标准
5
如何进行并行机性能评测
机器级性 能测评 性能 测评 算法级性 能测评
·CPU与存储器 ·并行和通信开销 ·机器的性价比 ·加速比 ·效率 ·可扩放性
程序级性 能测评
Linpack测试标准
CPU的某些基本性能指标
工作负载 执行时间 浮点运算数 指令数目 并行执行时间 T comput 为计算时间,T 时间,T comm为相互通信时间 T n = T comput + T paro+ T comm
10
1.相关参数
P:处理器数
W:问题规模(计算负载、工作负载,给定问题的总计算量)
Ws:应用程序中的串行分量,f是串行分量比例(f =
Ws/W, Ws=W1) WP:应用程序中可并行化部分,1-f为并行分量比例 Ws+Wp=W Ts=T1 :串行执行时间,Tp :并行执行时间; S:加速比,E:效率;
'
30
四、加速比讨论
参考的加速经验公式: p/log p≤S≤P 线性加速比:很少通信开销的矩阵相加、内积运算等 p/log p的加速比:分治类的应用问题 通信密集类的应用问题 :S = 1 / C ( p )
超线性加速 :S>P
绝对加速:最佳并行算法与串行算法
科学研究 者使用
理器数与可获得的最大的加速比;
用于指导改进并行算法和并行机体系结构,以使并 行算法尽可能地充分利用可扩充的大量处理器。
37
2.2.1 等效率度量标准
令tie :并行系统上第i个处理器的有用计算时间
t io:第i个处理器的额外开销时间(包括通信、同步和空
闲等待时间等) T
p
:p个处理器系统上并行算法的运行时间
11
2.加速比公式
Ws Wp 固定负载的加速公式: S Ws WP / p 并行系统所能达到的