第六章 多机系统
0 8
…
1 9
… …
7
15
① 水平方向用PM2+0,
PM2 –0,水平螺旋连接 ② 垂直方向用PM2+3, PM2-3,垂直螺旋连接
56
57
…
63
(以64为模)
5、循环互联网络
1)实质:是对单级互联网络的重复使用,它可在一定 程度上模拟多级互联网络的性能
1 2 3 4 5
6
7
③ 0
1
2
3
4
5
6
7
④ 当把0~7共8个部件排成一个立方体时,Cube0可实 现8个部件在 X 方向的连接 6 2 4 0 1 3 5 7
Y
Z
X
2)Cube1(以n=8,用 P2P1P0表示) ① 互联函数:Cube1 (P2P1P0)= P2P1P0 ② 实现的连接关系表: 0 2 , 1 3,2 0, 3 1, 4 6, 5 7, 6 4,7 5 ③实现的连接关系图 出 入
.
bn0 bn1 … bnn
其中Cij=Σ aikbkj
k=0
n
4、可加速累加和运算
1)完成算式S= Σ ai
i=0 7
=a0+a1+a2+…+a7
① a0+a1
⑤ ①+②
② a 2+ a 3 ⑥ ③ +④
③ a4+a5 ⑦ ⑤ +⑥
④ a6+a7
2)当采用一个处理机完成时,需要七步求和完成 3)当采用多个处理机计算时,可减少求和时间的次数 ①第一次求和用4个处理机完成 PU0 a0+a1 PU1 a2+ a3 PU2 a4+a5 PU3 a6+a7 (同时计算)
③要有一定通信频率 5)互联网络的分类 ① 从级数来分 Ⅰ)单级互联网络(仅一级) Ⅱ)循环互联网络(物理一级,但可实现多级功能) Ⅲ)多级互联网络(有多级)
②按特征性能来分 Ⅰ)立方体互联网络 Ⅱ)混洗交换互联网络 Ⅲ)PM2I互联网络 在立方体和混洗交换互联网络中,处理机(或部件) 用编码P表示,其中编码所用二进制位数与部件数相关, 如当有8个部件时,需要用三位二进制表示,则用P2P1P0 表示部件编码。
A CU
I/O通道
2、阵列结构A
1)由64个8行8列排成阵列的PU来构成 PU0 PU8 PU56 PU1 … … … PU63 PU7
2)横的排列按±1的模式,且以64为模进行排列与连 接
3)纵的排列按±8的模式,且也以64为模进行行列连接 4)每一个PU可直接和四周的PU进行通信
例:PUI
PUI+1 PUI-1
①CU向各PU播发公共地址α 和读命令,各PU 分别取 出α 单元中的aij到PU的暂存器中。
② CU再向各PU播发公共地址α +1和读命令,使各 PU 分别取出α +1单元中的bij到PU的另一暂存器中。
③ CU再向各PU 下达求和命令(加法),使各PU完 成计算cij=aij+bij ④ CU再向各PU 播发第三个公共地址和写命令,使 各PU的计算结果存入α+2单元中。 3、对矩阵乘运算 C=A*B
2)若有多个相同的事件同时进行着,意味着对某事件 有多个装置进行数据处理,可靠性高。
3)并行也可意味着须多套装置来完成。
二、从单机系统向多机系统发展的三条途径
单机系统
一条指令多个 过程段
资源共享 多用户系统分时共 享CPU 将单机在不同时间虚 拟成不同概念结构 用微小型机来代替 虚拟结构 多存贮器结构
2)松散耦合度。通信能力较强,依赖程度较高。如连 接在网上的计算机,在高速中主机与处理机之间也属 此类。 3)紧密耦合。依赖程度最强,如阵列式,并行式处理 机与控制部件(CU)之间。
四、多机系统的特点和分类
1、多处理机系统 1)具有多个处理机 2)具有一个指令译码执行部件 3)各处理机共享公共主存与I/O通道 4)各处理机要在统一的操作系统控制下工作 5)它们属于SIMD结构 6)它们属于紧密耦合
a00 a01 … a0n
b00 b01 … b0n
a10 a11 … a1n
A=
。 。 。
b10 b11 … b1n
.
B=
。 。 。
an0 an1 … ann
c00 c01 … c0n C=
c10 c11 … c1n cn0 cn1 … cnn
. 。 。 。
如C00= a00b00 + a01b10 + a02b20 + … + a0nbn0 阵列式多处理机也比较有利于矩阵乘运算,但不如 矩阵加
4、单级PM2I互联网络
1)PM2I互联函数 PM2I有两大类 一大类是 PM2 + I = j + 2i(i=0~j-1) 另一大类是 PM2 – I = j – 2i (i=0~j-1) ① 当i=0时,PM2(j)+ 0 = j + 20 = j + 1 若有8个部件,也以8为模时, PM2(j)+ 0 可实现
4 5 6 7 0 1 2 3
6 1 1 0
7 1 1 1
1 0 1 5
1 1 1 7
3)在混洗基础上加上Cube(0)的交换时称为混洗交换 Cube(0)为P2P1P0 0 1 ,1 P2P1P0 3,3
0
0 ,2
2 ,4 出 入
1
2 3
5 ,5
4,
6 7 ,7
6
4)混洗交换互联网络
4
5 6 7
0 2 3 4 5 6 7 4 5 6 7 0 1 2 3
1
④ Cube1可实现8个部件在 Y 方向的连接(见立方图)
3)Cube2
① 互联函数:Cube1 (P2P1P0)= P2P1P0 ② 实现的连接关系表: 0 4,1 5,2 3 7, 4 0, 5 1,6 2,7 3
6,
③实现的连接关系图
0 0 1 2 3 1 2 3 4 4 5 6 7 5 6 7
出
入
④ Cube2可实现8个部件在 Z 方向的连接(见立方图)
4)当有16个部件时,可组成两个立方体,而在两个立 方体之间可用Cube3实现两个立方体的连接
① 互联函数:Cube3 (P3P2P1P0)= P3P2P1P0 ② 连接关系表: 0 8,1 9,2 10,3 11 4 12,5 13,6 14,7 15 8 0,9 1,10 2,11 3 6 12 4,13 5,14 6,15 2 4 3 7 14 5 10 11 15
以指令为单位构 成指令流水线
多处理机结构
宏流水线 异构型多机系统
同构型、并列 式、阵列式
分布式多机系统
三、多机系统中的耦合度
1、何谓耦合度 多机间相互通信能力或相互依赖程度称为系统的耦 合度。 2、几种耦合度
1)最低耦合度。通信能力低,依赖程度小。如两台 计算机间仅用两三条线连接通信,无任何性能。
2、阵列式多处理机系统
各处理机的构成完全相同,但处理机排列成矩阵结构, 如4*4,8*8等,主要对阵列数据(二维)进行处理。 3、分布式多处理机系统 各处理机的构成可以不同,处理地位也可以不同,主 要用于对同时产生不同性质的多发事件处理。
其中,1,2属同构系统,3属于分布式处理系统
二、阵列式多处理机系统简介(伊Ⅳ)为主
PUM0
PUM0
PUM0
α
a00
α α+1 α +2
a01 b01 c01
α
a77 b77 c77
α+1 b00 α +2 c00
…
α+1
α +2
设其单元地址为α 、α+1 、α+2,其中在α单元中有 存放A阵列数据aij, α+1单元放B阵式数据bij ,α+2单元放 C阵式数据cij
3)当CU取出距阵加指令时,可通过如下操作完成运算
0 1 2 3 4 5 6 7
当i=1时,PM2(j)+ 1 = j + 21 = j + 2,可实现
0 1 2 3 4 5 6 7
② PM2 -I = PM2(j) – 2i
当i=0时,有
0 1 2 3 4 5 6 7
当i=1时,有
0 1 2 3 4 5 6 7
2)阵列式处理机所用的PM2I互连函数
如:f(i)=i+1 (i=0~7,且以8为模) 按此函数实现的连接关系表:0 1,1 2,2 3 …5 6, 6 7, 7 0 3)互联网络:实现处理机之间联结的某种拓扑结构的 逻辑电路称为互联网络 出 入
0
1
2 3 4 5 6 7
4)对互联网络的基本要求
① 有利于实现
② 可实现多种灵活的连接
2)当n=3时,(共8个部件)可实现如下连接关系
P2P1P0
0 0 0 0 1 0 0 1 2 0 1 0 3 0 1 1 4 1 0 0 5 1 0 1
P1P0P2
0 0 0 0 1 0 1 0 0 1 1 0 0 0 1 0 1 1 0 2 4 6 1 3 它将8个部件分为四组, 每组之间互不相关
PUI+8 PUI-8
… … … …
其它PU可通过联网络进行通信
三、阵列式多处理机的算法
1、完成有限距离的拉普拉斯方程的求解(它是一个具 有二阶偏导数的偏微分方程)
其最后的计算公式如下
U(x,y) = (U(x+h,y) + U(x,y+h)+ U(x-h,y) + U(x,y-h))/4 其中U(x,y) 为某一点的参数,h为有限距离 上式意义在 于每次计算某点 U(x,y) U(x+h,y) 参数值可直接用 其四周参数的平 U(x,y-h) 均值