当前位置:文档之家› 计算机系统结构复习

计算机系统结构复习


m
i1
(50 50 100 200) 9 200
TP
n Tpipeline
1220 (ns1)
E TP
t i
i1
m
TP 400 4
5 45.45% 11
2200(ns)
在 3、4 段。
变成八级流水线(细分)
入 1
50ns
2
3_1 3_2 4_1
50ns
50ns
50ns
50ns
400
10 850
8
10 17
58.82%
3.13 有一个流水线由 4 段组成,其中每当流经第 3 段时,总要在
该段循环一次,然后才能流到第 4 段。如果每段经过一次所需要
的时间都是 时间输入任务时,该流水线会发
生什么情况?
1 此流水线的最大吞吐率为多少?如果每 2t 输入一个任务,连续
处理 10 个任务时的实际吞吐率和效率是多少?
1 当每段时间不变时,如何提高该流水线的吞吐率?仍连续处理
10 个任务时,其吞吐率提高多少?
解:(1)会发生流水线阻塞情况。
2)

4
1
2
3
4
5
6
7
8
9
10
3
1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10
2
1
2
3
4
5
6
3_1
1133557799
2
1 2 3 4 5 6 7 8 9 10
1 1 2 3 4 5 6 7 8 9 10
时间
14t
TP
n Tpipeline
10 14
t
5 7
t
吞吐率提高倍数=
5 7 t
=1.64
比例是:
0.2T 0.82 0.245T
3.12 有一指令流水线如下所示
求连续输入 10 条指令,该流水线的实际吞吐率和效率;该流水
线的“瓶颈”在哪一段?请采取两种不同的措施消除此“瓶颈”。对
于你所给出的两种新的流水线,连续输入 10 条指令时,其实际
吞吐率和效率各是多少?
解:(1)
m
(2)瓶颈 T pipeline ti (n 1)tmax
只有第 I 层失效时才会访问第 I+1。 设三级 Cache 的命中率分别为 HL1、 Hl2、 HL3,失效率分 别为 Ml1、Ml2、ML3,第三级 Cache 的失效开销为 PL3。
平均访问时间 TA =HL1+Ml1{Hl2+Ml2(HL3+ML3× PL3)} 0 降低 Cache 失效率有哪几种方法?简述其基本思想。 答:常用的降低 Cache 失效率的方法有下面几种:
部件 3 的可改进比例为多少时,系统加速比才可以达到 10?
(2) 如果三个部件的可改进比例分别为 30%、30%和 20%,
三个部件同时改进,那么系统中不可加速部分的执行时间在总执
行时间中占的比例是多少?
解:(1)在多个部件可改进情况下,Amdahl 定理的扩展:
Sn (1
1 Fi )
容量,当块大小增加( 从16字节开始)时,失效率开始是下降,后来反而上升了。
(2) Cache 容量越大,使失效率达到最低的块大小就越大。 导致上述失效率先下降后上升的原因,在于增加块大小会产
生双重作用。一方面它减少了强制性失效,因为局部性原理有两 方面的含义:时间局部性和空间局部性,增加块大小利用了空间 局部性;另一方面,由于增加块大小会减少 Cache 中块的数目, 所以有可能会增加冲突失效。在 Cache 容量较小时,甚至还会
为 0.2T。
已知 3 个部件改进后的加速比分别为 S1=30,S2=20,S3
=10,因此 3 个部件改进后的执行时间为 改进后 Tn'
0.3T 30
0.3T 20
0.2T 10
0.045T
整个系统的执行时间为:Tn = 0.045T+0.2T = 0.245T
那么系统中不可改进部分的执行时间在总执行时间中占的
7.在进行指令集格式设计时,有哪 3 种设计方法?
指令集格式的设计:有变长编码格式、固定长度编码格式和混合
型编码格式 3 种。
8.消除瓶颈的两种方法是?
细分瓶颈段与重复设置瓶颈段
9.在大多数指令集结构的功能设计中必须考虑支持的 3 种类型的
指令是?
变长编码格式,定长编码格式,混合型编码格式
10.根据指令读和写访问顺序,将数据冲突分哪 3 类?
7
8
9
10
11
2
3
4
5
6
7
8
9
10
时间
23 t
T Pm a x
1 2t
Tpipeline 23t
Tp
n Tpipeline
10 23t
E TP 5t 4 5092 54.35%
(3)重复设置部件
Δt
3_1
1
2
4
Δt
Δt
3_2
Δt
Δt

4
1 2 3 4 5 6 7 8 9 10
3_2
2 2 4 4 6 6 8 8 10 10
Fi Si
已知 S1=30,S2=20,S3=10,Sn=10,F1=0.3,F2=0.3,
得:
10
1(- 0.3
0.3
1 F3)(0.3 /
30
0.3 /
20
F3
/ 10)
得 F3=0.36,即部件 3 的可改进比例为 36%。
(2)设系统改进前的执行时间为 T,则 3 个部件改进前的
执行时间为:(0.3+0.3+0.2)T = 0.8T,不可改进部分的执行时间
“伪相联组”中的对应块。如果这一块的标识匹配,则称发生了“伪 命中”。否则,就访问下一级存储器。
(5) 硬件预取技术。在处理器提出访问请求前预取指令和 数据。
(6) 由编译器控制的预取,硬件预取的替代方法,在编译 时加入预取的指令,在数据被用到之前发出预取请求。
(7) 编译器优化,通过对软件的优化来降低失效率。 (8) “牺牲”Cache。在 Cache 和其下一级存储器的数据通 路之间增设一个全相联的小 Cache,存放因冲突而被替换出去的 那些块。每当发生不命中时,在访问下一级存储器之前,先检查 “牺牲”Cache 中是否含有所需的块。如果有,就将该块与 Cache 中某个块做交换,把所需的块从“牺牲”Cache 调入 Cache。 8 试从 3C 失效的关系分析增加块大小对 Cache 性能的影响。 降低失效率最简单的方法是增加块大小 。(1)对于给定的 Cache
回答以下问题:
1.经典 MIPS 流水线分哪 5 个功能段?
取指令周期(IF) 指令译码器/读寄存器周期(ID) 执行/有效
地址计算周期(EX) 存储器访问/分子完成周期(MEM) 写
回周期(WB)
2.流水线有哪 3 种相关?哪 3 种冲突?
数据相关,名相关,控制相关
结构冲突,数据冲突,控
制冲突
3.提高并行性的技术途径有哪 3 种? 动态分支预测技术,多指令流出技术,循环展开和指令调度 4.对向量处理有哪 3 种方式? 横向(水平)处理方式,纵向(垂直)处理方式,纵横(分组) 处理方式 5.Cache 失效可以分为哪 3 种? 强制性失效,容量失效,冲突失效 6.在存储层次中,常用的替换算法有哪 3 种? 随机法,先进先出法,最近最少使用法
出 4_4
50ns
m
Tpipeline ti (n 1)tmax
i1
50 8 9 50
TP
n Tpipeline
1 85
(ns
1
)
850(ns)
m
ti
E TP i1 TP 400 10 58.82%
m
8 17
重复设置部件 TP
n Tpipeline
1 85
(ns
1
)
E
解 由题可知: 可改进比例 = 40% = 0.4 10根据 Amdahl 定律可知:
部件加速比 =
系统加速比
1
1
0.4
0.4
1.5625
10
采用此增强功能方法后,能使整个系统的性能提高到原来的
1.5625 倍。
1.8 计算机系统中有三个部件可以改进,这三个部件的部件加速
比为:
部件加速比 1=30; 部件加速比 2=20; 部件加速比 3=10 (1) 如果部件 1 和部件 2 的可改进比例均为 30%,那么当
增加容量失效。刚开始增加块大小时,由于块大小还不是很大, 上述的第一种作用超过第二种作用,从而使失效率下降。但等到 块大小较大时,第二种作用超过第一种作用,使失效率上升。 0 简述减小 Cache 失效开销的几种方法答:让读失效优先于写、写 缓冲合并、请求字处理技术、非阻塞 Cache 或非锁定 Cache 技术、 采用二级 Cache。计算题请参考书中练习1.7 将计算机系统中某 一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统 运行时间的40%,则采用此增强功能方法后,能使整个系统的性 能提高多少?
相同功能的 CISC 目标程序的指令条数 ICCISC 少于 RISC 的 ICRISC,但是 CISC 的 CPICISC 和 TCISC 都大于 RISC 的 CPIRISC 和 TRISC,因此,CISC 目标程序的执行时间比 RISC 的更长。 0 计算机系统设计中经常使用的 4 个定量原理是什么?并说出它 们的含义。
(1) 增加 Cache 块大小。增加块大小利用了程序的空间局 部性。
(2) 增加 Cache 的容量。 (3) 提高相联度,降低冲突失效。 (4) 伪相联 Cache,降低冲突失效。当对伪相联 Cache 进行 访问时,首先是按与直接映象相同的方式进行访问。如果命中, 则从相应的块中取出所访问的数据,送给 CPU,访问结束。如 果不命中,就将索引字段的最高位取反,然后按照新索引去寻找
相关主题