当前位置：文档之家› 并行算法第二章并行计算性能测评..

并行算法第二章并行计算性能测评..

S 1 1 T T P 1 o 1 o Te W
E
说明：如果问题规模W 保持不变，处理器数 p增加，开 W随P按什么比例增加销T 增大，效率E下降。
o
为了维持一定的效率（介于0与1之间），当处理数p增大时，需要相应地增大问题规模W的值。
39
等效率度量标准
曲线 3 曲线 2
第二章并行计算性能测评
1
Questions
机器性能
2
1
对自己的计算机(手机)有没有不满意的地方？
有没有升过级？
3
有没有评价是否值得升级？
2
主要内容
1
2 3
什么是并行计算机的基本性能？为什么要研究机器的性能测评？如何测评计算机的性能？
4
如何提高并行系统的性能？
3
计算机的性能
Performance: 通常是指机器的速度，它是程序执行时间的倒数程序执行时间：是指用户的响应时间 (访问磁盘和访问存储器的时间， CPU时间， I/O时间以及操作系统的开销) CPU时间：它表示CPU的工作时间，不包括 I/O等待时间和运行其它任务的时间
paro
为并行开销
7
算法级性能评测
1
加速比性能定律
2
可扩放性测评标准
Amdahl定律
Gustafson定律 Sun和Ni定律
等效率测评标准
等速度测评标准平均延迟度量标准
8
2.1 加速比定律
并行系统的加速比:对于一个给定的应用，并行算
法（或并行程序）的执行速度相对于串行算法（或
串行程序）的执行速度加快了多少倍。
加速比：由3个定律可知，增加PE和求解问题的
规模可以提高加速比
影响加速比的因素：处理器数与问题规模
求解问题中的串行分量并行处理所引起的额外开销（通信、等待、竞争、冗余操作和同步等）加大的处理器数超过了算法中的并发程度
33
一、并行计算的可扩放性
增加规模有利于提高加速比的因素：较大的问题规模可以提高较高的并发度额外开销的增加可能慢于有效计算的增加算法中的串行分量比例不是固定不变的（因问题规模增加而缩小）
18
1. 加速比公式
Gustafson加速定律 :
WS pWp WS pWp S' WS p Wp / p WS WP
说明：
S' p (1-f) f
当f很小时，S’与P斜率为1-f
当p →∞ 时，S’随着PE的增加而增加，几乎与
处理器数成比例的线性增加，f不再是程序的
25
1. 加速比公式
G（p）：存储容量增加到p倍时并行工作负载的增加情况
扩大存储容量后的工作负载W =fw+(1-f)G(p)W
fW 1 f G p W f 1 f G p S fW 1 f G p W / p f 1 f G p / p
等速度度量标准
p 表示处理器个数
W表示要求解问题的工作量或称问题规模（在
此可指浮点操作个数）
T为并行执行时间
并行计算的速度V: V=W/T
p个处理器的并行系统的平均速度 V 定义为:
V V W p pT
44
等速度度量标准
W是使用p个处理器时算法的工作量，令W’表示当处理
4
为什么要进行并行机性能评测？
对管理人员来说：发挥并行机长处，提高并行机的使用效率对用户来说减少用户购机盲目性，降低投资风险
对架构师和设计人员来说：
改进系统结构设计，提高机器的性能促进软/硬件结合，合理功能划分优化 “结构-算法-应用”的最佳组合对市场人士来说：
工作负载W
曲线 1
处理器数 P
曲线1表示算法具有很好的扩放性；曲线2表示算法是可扩放的；曲线 3表示算法是不可扩放的。
40
等效率度量标准
优点：通过少量的参数可计算出等效率函数缺点：如果To无法计算出（在共享存储并行机中）
41
2.2.2 等速度度量标准
等效率度量标准的缺点：T0不能方便地计算出来 1994年两位学者提出试验测试为主要手段的两种标准：等速度、平均延迟
p→∞时，上式极限为
1 S f w0 / w
串行分量和并行额外开销的比例越大，则加速比越小。
16
例题
在不考虑通信开销的情况下，若达到（不小于） 50%的加速效率（加速比与p的比值），串行计算部分f和所使用的处理器数目p之间应该存在怎么样的不等式关系？若 f=0.5,则p只能取多少？
W：串行算法所完成的计算量
Te
i t e i 0 p 1
To
i t o i 0
p 1
对于任意i，显然有T
p
= tie + t io ，且 T e+ T o=所完成的计算量W=Te
等效率度量标准
S Te Te p p Te To T T Tp 1 o 1 o p Te W
基本思想：只要存储空间许可，应尽量增大问题规模以产生更好和更精确的解（此时可能使执行时间略有增加）。假定在单节点上使用了全部存储容量M并在相应于W的时间内求解之，此时工作负载W= fW + （1-f）W。在p 个节点的并行系统上，能够求解较大规模的问题是因为存储容量可增加到pM。令因子G（p）反应存储容量增加到p倍时并行工作负载的增加量，所以扩大后的工作负载W = fW +（1-f）G（p）W。
和 N i 加速均比 Amdahl 加速和 Gustafson 加速为高。
27
Sun 和 Ni定律
28
Sun 和 Ni定律
29
修改后的加速比
并行开销W o:
fW 1 f WG p f 1 f G p S fW 1 f G p W / p WO f 1 f G p / p WO /W
42
为什么用等速度度量标准
速度是一个重要的参数，一般可以明确指出，单位 Mflops，因此用速度来度量可扩放性，应更加方便。在并行系统中，增加P可以提高速度，如果速度能随着 P的增加而增加，即意味着平均速度不变 p个处理器的并行系统的平均速度定义为并行速度V除以处理器个数 p：
43
两者可按不同比例进行调整，此比例关系
（可能是线性的，多项式的或指数的等）就
反映了可扩放的程度
36
可扩放性评测标准
可扩放性研究的主要目的：确定解决某类问题用何种并行算法与何种并行体系结构的组合，可以有效地利用大量的处理器；对于运行于某种体系结构的并行机上的某种算法当移植到大规模处理机上后运行的性能；对固定的问题规模，确定在某类并行机上最优的处
34
可扩放性评测标准
增加处理器数，会增大额外开销和降低处理器利用率，所以对于一个特定的并行系统（算法或程序），它们能否有效利用不断增加的处理器的能力应是受限的，而度量这种能力就是可扩放性这一指标。
35
1.可扩放性的内涵
可扩放性:调整什么和按什么比例调整
并行计算要调整的是处理数p和问题规模W
12
3.Amdahl定律的几何意义
不论PE个数有多
少，可并行计算量
是不变的。
13
Amdahl定律的几何意义
随着PE的增大，Tp可能会越来越小，但T1不会改变
14
Amdahl定律的几何意义
15
4. 修改后的加速比—考虑额外开销
W o为额外开销
WS WP W p S WP W (1 f ) 1 f ( p 1 ) W p / W 0 WS W0 fW W0 p p
提供客观、公正的评价并行机的标准
5
如何进行并行机性能评测
机器级性能测评性能测评算法级性能测评
·CPU与存储器 ·并行和通信开销 ·机器的性价比 ·加速比 ·效率 ·可扩放性
程序级性能测评
Linpack测试标准
CPU的某些基本性能指标
工作负载执行时间浮点运算数指令数目并行执行时间 T comput 为计算时间，T 时间，T comm为相互通信时间 T n = T comput + T paro+ T comm
10
1.相关参数
P：处理器数
W：问题规模（计算负载、工作负载，给定问题的总计算量）
Ws：应用程序中的串行分量，f是串行分量比例（f =
Ws/W， Ws=W1） WP：应用程序中可并行化部分，1-f为并行分量比例 Ws+Wp=W Ts=T1 ：串行执行时间，Tp ：并行执行时间； S：加速比，E：效率；
'
30
四、加速比讨论
参考的加速经验公式： p/log p≤S≤P 线性加速比：很少通信开销的矩阵相加、内积运算等 p/log p的加速比：分治类的应用问题通信密集类的应用问题：S = 1 / C （ p ）
超线性加速：S>P
绝对加速：最佳并行算法与串行算法
科学研究者使用
理器数与可获得的最大的加速比；
用于指导改进并行算法和并行机体系结构，以使并行算法尽可能地充分利用可扩充的大量处理器。
37
2.2.1 等效率度量标准
令tie ：并行系统上第i个处理器的有用计算时间
t io：第i个处理器的额外开销时间（包括通信、同步和空
闲等待时间等） T
p
：p个处理器系统上并行算法的运行时间
11
2.加速比公式
Ws Wp 固定负载的加速公式： S Ws WP / p 并行系统所能达到的

e商务文档

并行算法第二章并行计算性能测评..

相关文档推荐：

e商务文档

并行算法第二章 并行计算性能测评..

相关文档推荐：

并行算法第二章并行计算性能测评..