当前位置：文档之家› 并行算法

并行算法

并行性条件数据相关性：流相关、反相关、输出相关相关性判别条件输入集合I1,I2, 输出集合U1,U2,
I1Λ U2=Φ ; I2Λ U1=Φ ; U1Λ U2=Φ ;
数据相关
• P1： A＝B+C • P2: D＝A×B
其中变量A是导致P1和P2发生数据相关的原因。
P1和P2不能并行执行
1)可并发执行的任务放在不同的处理器上，增强并行度 2)需要频繁通信的任务置于同一处理器上以提高局部性。 3)采用域分解技术，当分解算法复杂，工作量不一样，通信也许是非结构化的，此时需要负载平衡算法。 4)基于功能分解，会产生一些由短暂任务组成的计算，它们在开始与结束时需与别的任务协调，此时可采用任务调度算法。
假设 F(x)是D R n到D的一个映射, 要求解x* , 使得x*是方程F(x)=0的一个解.记F(x)的Jacobi矩阵为G(x)=F' ( x ), 对给定的初始值x (0) , 则Newton迭代法如下 : x (k+1) x (k) G 1 ( x (k) ) F ( x (k) ), k 0,..........
并行算法简介
解决方案中心高性能计算部姜金良
目录
并行算法基本概念并行算法分类并行化方法并行算法的一般设计方法并行算法的基本设计技术并行算法的一般设计过程并行程序设计方法并行编程模型
并行算法的概念
• 并行算法：是一些可同时执行的诸进程的集合，这些进程相互作
用和协调动作从而达到给定问题的求解。
• 同步和异步并行算法
同步并行算法需要在某一时刻需要与其它的处理机进行数据交换,然后才能继续进行.异步并行算法进行数据交换不需要严格确定在某一时刻,每个处理机按照预定的计算任务持续执行,但通常需要在一定的时候必须进行一次数据交换,以保证算法的正确性例:
x ( k 1) b Ax ( k )
并行算法的一般设计方法
• 从问题描述开始设计并行算法
从问题的描述出发，寻求可能的新途径，设计出一个新的并行算法。不是完全排除串行算法设计的基本思想，而是更着重从并行化的具体实现上开辟新的设计方法 --设计全新的并行算法是一个挑战性和创新性的工作
并行算法的一般设计方法
• 借用已有算法解新问题：
PCAM方法设计
• PCAM分为四步
1) 2) 3) 4) 任务的划分通信任务组合处理器映射
并行算法的一般设计过程:划分
使用域分解或者功能分解将整个计算分解成一些小的任务，以便充分利用其潜在的并行性和可扩放性。先集中数据的分解（域分解），然后是计算功能的分解（功能分解），两者互为补充。要点：计算集、数据集互补相交，以避免数据和计算的复制
并行算法的一般设计过程:映射
• 标准
采用集中式负载平衡方案，管理者是否会成为瓶颈？动态平衡方案，是否衡量过不同策略的成本？采用概率或者循环法，是否有足够多的任务保证负载平衡？设计SPMD程序，是否考虑过基于动态任务创建和消除的算法？后者可以得到简单的算法，但性能可能有问题。
数据反相关
• P1： A＝B×C • P2： C＝E+D
P1通过变量C数据相关于P2。
不可以并行化
数据输出相关
• P1： A＝B+C • P2： A＝D×E
并行算法的分类
数值并行算法：数值计算非数值并行算法：符号运算同步并行算法：向量算法、SIMD、MIMD同步异步并行算法：不需相互等待独立并行算法：进程间完全独立细粒度并行算法：基于向量和循环系级并行中粒度并行算法：较大的循环级并行大粒度并行算法：任务级并行（区域分解）
并行程序设计方法
应用领域科学和工程计算，数据处理，商务应用等串行程序设计并行程序设计
算法范例
分而治之，分支界限动态规划，回，贪心
计算交互、工作池、异步迭代流水线、主-从，细胞子动机
编程模型
冯诺依曼
隐式并行、数据并行共享变量、消息传递
编程语言

Fortran,C,Cobol,4GL
并行算法的基本设计技术
• 流水线技术
流水线（pipelining)技术是一项重要的并行技术，基本思想：将一个任务t分成一系列子任务t1,t2,„,tm,使得一旦t1完成，后继的子任务就立即开始，并以同样的速率进行计算
以求解一簇递推问题为例:
a0, j 给定, ai, j F (ai 1, j ), i 1,....., n, j 1,......, m
数据并行
概况 1) SIMD的自然模型 2) 局部计算和数据选路操作特点 1) 单线程 2) 并行操作于聚合数据结构(数组) 3) 松散的同步 4) 单一地址空间 5) 隐式交互作用 6) 显示数据分布优点:编程相对简单,串并行程序一致缺点:程序的性能依赖于所用的编译系统及用户对编译系统的了解,并行粒度局限于数据级并行,粒度较小
并行算法的发展
• • • • • 基于向量运算的并行算法设计阶段基于多向量处理机的并行算法设计阶段 SIMD类并行机上的算法设计阶段 MIMD类并行机上的并行算法设计阶段现代并行算法设计——以MIMD为主，要求可扩展性、可移植性
并行化方法
• 分而治之模型并行、算法并行、程序并行自然并行：数据并行、功能分割任务主从型、SPMD型、管道型（流水线）、二叉树型（分解与递归）
分而治之
Y=(A+B(C+DEF))+G
Y=(A+G)+B(C+DEF)
6
5
Y=(A+G+BC)+BD*EF
3
并行化方法
红黑格法
P1 communication mem2 mem1
P2
并行化方法
• 并行二叉树技术：解决通信瓶颈问题，通信复杂度O(P)下降到O(log P)
0 0 0 1 0 2 2 4 6 0 4
并行算法的一般设计过程:划分
• 划分标准
任务数，是否至少高于目标机上处理器数的一个量级。（灵活性）是否避免了冗于的计算和存储要求。（扩放）划分的任务是否尺寸大致相当。（均衡）任务数是否与问题尺寸成比例。是否采用了几种不同的划分法，多考虑几种选择可提高灵活性，同时既考虑域分解，又要考虑功能分解。
并行算法的一般设计过程:组合
目的：合并小尺寸的任务以减少任务数，理想情况每个处理器一个任务，得到SPMD程序。增加粒度：在划分阶段,致力于尽可能多的任务以增大并行执行的机会.但定义大量的细粒度任务不一定产生一个有效的算法, 因为这有可能增加通信的代价和任务创建的代价表面-容积效应：通信量比例于子域的表面积，计算比例于容积，通信/计算之比随任务的尺寸的增加而减少->增加粒度重复计算（Replication Computation）,也叫冗余计算，有时可用冗余计算来减少通信。同时也要保持灵活性和减少软件成本,降低软件工程代价
借用已知的某类问题的求解算法求解另一问题。例：利用矩阵乘法求所有点对间最短路径。 n个顶点加权有向图G(V,E)，矩阵Wnxn,构造矩阵D,di,j 从vi到vj 的最短路径长度。 dkij表示vi到vi 的经过至多-1个点的最短路径长度Dkij=wi,j dkij=min{dk/2il,dk/2lj}。因此D可以经由D1逐次计算D2， D4，„ Dn-1，然后由D= Dn-1即可。由Dk/2求Dk ，可以使用标准矩阵乘法，只是将原改为‘+’；求和运算改为“min” 操作。
并行算法的一般设计过程:组合
• 组合标准
组合造成的重复计算，是否平衡了其收益？造成重复数据，是否已证实不会因限制问题尺寸和处理机数目而影响可扩放性？组合产生的任务是否具有类似的计算、通信代价？任务数目是否仍与问题尺寸成比例？
并行算法的一般设计过程:映射
• 指定每个任务到哪里执行，目的，减少算法的总的执行时间 • 策略
Fortran90,HPF,X3H5、PVM\MPI
体系结构
不同类型的单处理机
共享内存（PVP、SMP、DSM）数据并行(SIMD)、消息传递（MPP、Clusters）
并行程序设计方法
隐式并行程序设计 1)常用传统的语言编程成顺序源码,把”并行”交给编译器实现自动并行 2)程序的自动并行化是一个理想目标,存在难以克服的困难 3)语言容易,编译器难显示并行程序设计 1)在用户程序中出现”并行”的调度语句 2)显示的并行程序开发是解决并行程序开发困难的切实可行的方法 3)语言难,编译器容易
其中,f(x,y) 和个g(x,y)为已知函数分别定义在区域的内部和边界
• 非重叠区域的分解
• 将离散化后的方程化成一些独立的小规模问题和一个与每个小问题关联的全局问题
并行算法的基本设计技术
• 功能分解方法
将不同功能组成的问题,按照其功能进行分解的一种手段,其目的是逐一解决不同功能的问题,从而获得整个问题的解
并行程序设计模型隐式并行数据并行共享变量消息传递
隐式并行
概况 1) 程序员用熟悉的串行语言编程(未作明确的指定并行性) 2) 编译器和运行支持系统自动转化为并行代码特点 1) 语义简单 2) 可移植性好 3) 单线程,易于调试和验证正确性 4) 细粒度并行 5) 效率很低
并行算法的一般设计过程:通信
四种模式
局部通信vs.全局通信结构化通信vs.非结构化通信静态通信vs.动态通信同步通信vs.异步通信
并行算法的一般设计过程:通信
• 通信标准
所有任务是否执行大致同样多的通信。(可扩放性) 每个任务是否只与少许近邻通信诸通信操作是否能并行执行不同任务的计算能否并行执行

e商务文档

并行算法

相关文档推荐：