当前位置：文档之家› SMP集群上的混合并行计算

SMP集群上的混合并行计算

５０
万方数据Ｉ计算机教育２００７．４｜
环／球／ＩＴ进行通信和计算。ＭＰＩ＋ＯｐｅｎＭＰ混合模型可以选择主线程或指定一个线程进行通信，而其他线程执行计算，从而实现了通信与计算的重叠。
＝…＠）＿等
４．４性能测试
本文采用不同的进程数对平板流动进行了测试，该算例中采用多块网格结构，本文下面的所有的计算负载和通讯负载都是都是平衡的，图４给出了四组不同计算规模下的加速比。其中，图中标出的是一块网格的网格点数（共１２８块），另外，在本测试中，由于迭代步较少，Ｉ／Ｏ占用会影响统计时间的准确度，因此，下面测试中未计人流场计算结束后的文件输出。对于纯ＭＰＩ的测试，本文给每个处理核分配一个进程，而ＭＰＩ＋ＯｐｅｎＭＰ混合并行的测试，本文对每个Ｓｏｃｋｅｔ分配一个进程，同时，每个Ｓｏｃｋｅｔ上又分配２个线程。图中可以看到，当处理核总数较少的时候，与ＭＰＩ＋ＯｐｅｎＭＰ｝昆合并行模型相比，由于ＭＰＩ的并行粒度相对较大，因此性能明显占优，进程数小于３２的时候，除了Ｇｒｉｄ９７．１３．２５之外，其余的并行效率都超过了９５％，前者性能较低是由于单进程上的计算量相对其他的计算较小，因此通信占用就比较大，因此效率较低。随着处理核的增加，ＭＰＩ并行模式的通信量也增加，图４中可以看到，当通信量达到一定规模之后，不管是ＳｈａｒｅＳｏｃｋｅｔ还是ＤｉｆｆｅｒｅｎｔＳｏｃｋｅｔ的通信带宽都大大减小，因此在１２８个处理核的测试中，ＭＰＩ并行模式下的并行效率也明显降低，相对来说，而混合并行模型由于减少了通信的进程数，从而减少了计算中的通信占用比，因此性能较好。
丁
５结束语
ＯｐｅｎＭＰ＋ＭＰＩ这种混合并行模型相比单纯的ＭＰＩ消息传递更能充分利用ＳＭＰ集群系统，在某些情况下可以改善性能。本文首先对两种不同情况下的节点内的通讯进行了测试，表明基于ＳｈａｒｅＳｏｃｋｅｔ的通信性能较好，然后采用ＭＰＩ＋ＯｐｅｎＭＰ混合并行模型对ＮＡＰＡ软件进行了改进和测试，结果表明，就ＮＡＰＡ软件本身而言，采用ＭＰＩ并行模型在小规模节点情况下性能较好，而采用混合并行模型在多节点情况下可以大大减少通信，从而获得更好的性能。团
２．２
ＯｐｅｎＭＰ并行模型
ＯｐｅｎＭＰ使用Ｆｏｒｋ－Ｊｏｉｎ的并行执行模式。开始
时由一个主线程执行程序，该线程一直串行地执行，直到遇到第一个并行化制导语句后才开始并行执行。过程如下：①ＦｏｒＫ．主线程创建一队线程并行执行并行域中的代码；②Ｊｏｉｎ：当各线程执行完毕后被同步或中断，最后又只有主线程在执行。
ｔｈｅ
ＨｉｇｈＰｅｒｆｏｒｍａｎｃｅＣｏｍｐｕｔｉｎｇＡｐｐｌｉｃａｔｉｏｎｓ，２００５，ＩＦＣａｐｐｅｌｌｏ，ＤＥｔｉｅｍｂｌｅ．ＭＰＩＶｅｒｂｓＭＰＩ＋ＯｐｅｎＭＰ
ｏｎ
７（Ｉ）．
ＩＢＭＳＰｆｏＰ
ｏｎ
［２】Ｃｈａｒｌｅｓ
ＤＨ．Ｔｗｏ－－ｄｉｍｅｎｓｉｏｎａｌａｅｒｏｄｙｎａｍｉｃｃｈａｒａｃｔｅｒｉｓｔｉｃｓｏｆ
ＡＰ
Ａ软件进行了
ＭＰＩ＋ＯｐｅｎＭＰ的？昆合并行改进和并行优化，并在大规模节点上对比了混合并行和纯ＭＰＩ的性能。
４．２测试平台介绍
本文的计算平台节点包括２个Ｓｏｃｋｅｔ（ｘ８６平台，主频２．６Ｇ双核）和８Ｇ内存，计算节点共３２个，千兆交换机，操作系统为Ｒｅｄ
ＩｎｔｅｌＣｏｍｐｉｌｅｒＨａｔ
∽
ｊ
１．２１Ｏ．８０．６０．４０．２００ｌ２４８１６３２６４１２８
３混合并行方法３．１混合并行的实现方法
图２不同模式下的通信延迟比较
Ｂａｎｄｗｉｄｔｈ
ｌ＋ＷＤＣ｜士ｗＤｃ
Ｓｈａｒｅ
ＳｏｃｋｅｔＳｏｃｋｅｔ
Ｄｉｆｆｅｒｅｎｔ
为了充分利用ＳＭＰ集群层次存储结构的特点，可以考虑将上述两种编程模型相结合，实现ＭＰＩ／ＯｐｅｎＭＰ的混合编程模型。该模型同样具有层次结构：上层的ＭＰＩ表示节点间的并行；下层的ＯｐｅｎＭＰ表示节点内的多线程并行：首先对问题进行区域分解，将任务划分成通信不密集的几个部分，每个部分分配到一个ＳＭＰ节点上，节点间通过ＭＰＩ消息传递进行通信；然后在每个进程内采用ＯｐｅｎＭＰ编译制导语句再次分解，并分配到ＳＭＰ的不同处理器上由多个线程并行执行，节点内通过共享存储进行通信。图１描述了ＳＭＰ集群上ＭＰＩ／ＯｐｅｎＭＰ混合编程模型的实现机制。ＭＰＩ和ＯｐｅｎＭＰ的混合编程模型提供了节点间和节点内的两级并行机制，综合了进程间各个区域的粗粒度并行和进程内部循环级的细粒度并行。实践证明，在很多情况下其执行效率高于纯ＭＰＩ和ＯｐｅｎＭＰ的程序，混合并行模型解决了一些它们无法解决的问题，比如：（１）负载平衡问题【ｌ・１。混合并行模型很好解决了
图１混合并行模型
加∞∞∞∞加加 ∞＼重∞ ∞ ∞０
零§毒§零毋§◇弩≮≮≮整黼、
ｋａ＜；—ｒ一１一图３不同模式下的通信带宽比较
．／厂
．◆—◆√
／
／
，一一—弋
＼＼
‘▲—●ｒ一１｜—Ｉ
．．．．＼一
一Ｉ—－卜ｊ卜▲ ＭｅｓｓａｇｅＳｉ．ｚｅ．（Ｂ）
３．３混合并行的优点
单纯ＭＰＩ程序不容易实现负载平衡的问题，从而提高了并行程序的性能和可扩展性。（２）通信带宽和延迟问题［ｎｌ。ＭＰＩ并行程序进程间的通信带宽和延迟问题可能会严重影响程序的执行性能。混合模型的程序将减少通信的次数，并且ＯｐｅｎＭＰ的线程级并行具有较小的延迟。（３）通信与计算的重叠【１２１。大多数ＭＰＩ实现都是使用单线程实现的。这种单线程的实现可以避免同步和上下文切换的开销，但是它不能将通信和计算分开，因此，对于多处理系统上，单个的ＭＰＩ进程不能同时
Ｐ。ａｂｅｎｓｅｉｆｎｅｒ，ＧＷｅｌｌｅｉｎ．Ｃｏｍｍｕｎｉｃａｔｉｏｎ
ａｎｄ
Ｏｐｔｉｍｉｚａｔｉｏｎ
Ｐａｒａｌｌｅｌ
ｐｒｏｇｒａｍｍｉｎｇＭｏｄｅｌｓ
ｏｎ
ＨｙｂｒｉｄＡｒｃｈｉｔｅｃｔｕｒｅ．Ｉｎｔｅｒｐａｃｅ
Ａｐｐｌｉｃａｔｉｏｎｓ心唱ｔｈｅＮＡＳＡＣｏｌｕｍｂｉａＳｕｐｅｒｃｏｎ∞ｕｔｅｒ，２００５
ＭＰＩａｎｄＡＣＭ
ＰｒｏｇｒａｍｍｉｎｇＳｔｙｌｅ
ｏｎ
ＳｈａｒｅｄＭｅｍｏｒｙＭ¨ｌｔｌＤｒｏｃｅｓｓｏｒｓ．Ｉｎ
［４］朱国林，李树民，王开春．维低速Ｎｓ方程的并行计算
ＳＰＡＡ，ＳａｎＤｉｅｇｏ，ＵＳＡ，Ｊｕｎ．２００５
［１１］单莹，吴建平，王正华．基于ＳＭＰ集群的多层次并行
编程模型与并行优化技术［Ｊ］．计算机应用研究，２００６．
ＭＰＩ和ＯｐｅｎＭＰ并行模型在并行计算领域，ＭＰＩ和ＯｐｅｎＭＰ是最为流行的
万方数据
计算机教育２００７．４
ｌ
４９
环／球／ＩＴＯｐｅｎＭＰ的编程相对简单，充分利用了共享存储体系结构的特点，避免了消息传递的开销。虽然它也支持粗粒度的并行，但主要还是针对细粒度的循环级并行。ＯｐｅｎＭＰ的另一个特点在于将串行程序转换为并行程序时无须对代码作大的改动。其不足之处有只能在共享存储结构的机器上运行；数据的放置策略不当可能会引发其他问题；并行化的循环粒度过小会增加系统开销等。
Ｓｐｅｅｄｕｐ（ｐ）＝｝
』ｐ
Ｅｆｆｉｃｉ绷钞（ｐ）：—Ｓｐｅｅｄ—ｕｐ（ｐ）
万方数据
计算机教育２００７．４
ｌ
５＂１
环／球／ｉＴ
参考文献：
［１］Ｄｉｍｉｔｒｉ
Ｊ．Ｍａｖｄｐｌｉｓ，ＭｉｃｈａｅｌＪ．Ａｆｔｏｓｍｉｓ，Ｍａｒｓｈａ
『８１
Ｂｅｒｇｅｒ，Ｈｉ曲
ＡｓｐｅｃｔｓｏｆＪｏｕｒｎａｌｏｆ
Ｒ
９．０，编译器为
１．２．７。
９．０，消息传递库为Ｍｐｉｃｈ
４．３性能评价方法
并行计算中，我们把并行程序分成两部分：即串行部分和并行部分，如果用Ｔｓ表示串行部分串行执行所需的时间，Ｔｃｏｍｐ表示并行部分串行执行所需的时间，Ｔｃｏｍｍ表示Ｐ个进程并行计算中通讯部分占用的时间，使用Ｐ个进程执行的时间为Ｔｐ，那么单进程串行执行的时间为：Ｔｌ＝Ｔｓ＋Ｔｃｏｍｐ，Ｐ个进程并行执行的加速比（Ｓｐｅｅｄｕｐ）、并行效率（Ｅｆｆｉｃｉｅｎｃｙ）、通信占用比（”。。。）分别是：
３．２节点内并行的性能测试
本文首先测试了节点内并行的性能，测试在Ｉｎｔｅｌ
Ｘｅｏｎ
Ｗｏｏｄｃｒｅｓｔ
２．６Ｇ
（双核）的平台上进行，结
果如图２和图３所示。其中，ＳｈａｒｅＳｏｃｋｅｔ表示Ｓｏｃｋｅｔ中不同处理核之间的消息传递，而ＤｉｆｆｅｒｅｎｔＳｏｃｋｅｔ表示不同Ｓｏｃｋｅｔ之间的消息传递。可见ＳｈａｒｅＳｏｃｋ：ｅｔ间的通信性能明显好于不同Ｓｏｃｋｅｔ间的通信性能。
［５］吕晓斌，兰黔章，朱自强．二维跨音速Ｅｕｌｅｒ方程分区并行算＇法［Ｊ］．北京航空航天大学学报，２０００，２６（２）：１
［Ｊ］。空气动力学学报，２００２．［５］冯云，周淑秋天．ＭＰＩ＋ＯｐｅｎＭＰ混合并行编程模型应用研
９４—１９７
ｆ１０］Ｇ
ＴｈｒｅｅＯｐｅｎＭＰ
Ｋｒａｗｅｚｉｋ，ＦＣａｐｐｅＩＩｏ．ＰｅｒｆｏｒｍａｎｃｅＣｏｍｐａｒｉｓｏｎｏｆ
环／球／ＩＴ
ＳＭＰ集群上的混合并行计算
ＩＮＴＥＬ中国软件中心金君乔楠／文
１引言并行计算机体系结构的一个发展趋势是ＳＭＰ（ＳｙｍｍｅｔｒｉｃＭｕｌｔｉｐｒｏｃｅｓｓｏｒ）集群系统。它们是由拥有多个处理器的ＳＭＰ节点和连接各节点间的快速网络构成的多级体系结构。理想的并行编程方案可使应用程序设计者能以最有效的方法使用这个混合的硬件结构，获得理想的性能而不会引起由其导致的任何开销。在分布式内存的系统上，使用ＭＰＩ的消息传递已经被广泛的应用［１－４】，但是，大多数情况下，特别是在大规模节点下，采用纯的ＭＰＩ并行模型并不能取得理想的性能巧１。此外，ＯｐｅｎＭＰ已经成为共享存储系统编程的工业标准。由于ＳＭＰ集群同时具有共享存储和分布存储两极存储结构，因此节点内采用ＯｐｅｎＭＰ进行多线程化、节点间采用消息传递的混合并行模式可以更好的利用ＳＭＰ集群的特性［６１。近几年来，多极混合并行计算已经被应用于许多应用中【７】，并且取得了较大的成功［８－ｉｏｌ，本文首先介绍了ＯｐｅｎＭＰ和ＭＰＩ并行模型和混合并行方法，以Ｎａｐａ软件为例，进行了ＭＰＩ＋ＯｐｅｎＭＰ混合并行改进，最后在大规模节点上对比了混合并行和纯ＭＰＩ的性能。

e商务文档

SMP集群上的混合并行计算

相关文档推荐：