当前位置：文档之家› chap4-3指令级并行

chap4-3指令级并行

10
4.1位预测机制的缺点
鲁
只要预测出错，往往是连续两次而不是一次。
东
大学信
5.解决方法
息与
采用两个预测位的预测机制。
电
气工
在两个预测位的分支预测中，更改对分支的
程
学院
预测必须有两次连续预测错误。
两位分支预测的状态转换图
11
鲁东大学
分支成功
分支不成功
11
10
分支成功
分支预测：成功
ADDD F6,F8,F2
27
解状态如图4.15所示。
鲁
东
大
学信
保留站
息与
名称
电
忙
操作
Vj
Vk
气
工程
Add1
no
学
院 Add2
no
Qj Qk
Add3 no
Mult1 no MULTD Mem[45+Regs[R3]]
Regs[F4]
Mult2 yes DIVD
Mem[34+Regs[R2]] #3
当前 PC 值送存储器和 BTB
否
是
BTB 中存在？
鲁东
取指令
大
学
信
息与
否
是
成功分支指令？
以分支目标 PC 值送存储器
电
气工
普通指令
程
否
当前分支成功？是
学院
指令译码
指令执行
将当前指令 PC 值和分支目标 PC 送入 BTB 中作为一个新项
预测错误，清除取来的指令并从分支的另外一个目标取指令，删除 BTB 中对应项
26
例4.8 假设浮点功能单元的延迟为加法是2个时钟周
期，乘法是10个时钟周期，除法40个时钟周
鲁东大
期。给出下面的代码段当指令MULTD要确认
学
信息
时的状态。
与
电气
LD F6,34(R2)
工
程学
LD F2,45(R3)
院
MULTD F0,F2,F4
SUBD F8,F6,F2
DIVD F10,F0,F6
方法和预测错误后恢复所采取的策略。
4
4.3.1 分支预测缓冲
¡ 动态分支预测必须解决两个问题：
鲁
东大
• 如何记录一个分支操作的历史。
学
信息与
• 决定预测的走向。
电
气工
¡ 记录分支历史的方法有以下几种：
程
学院
（1）仅仅记录最近一次或最近几次的分支历
史；
（2）记录分支成功的目标地址；
（3）记录分支历史和分支目标地址，相当于前
3. 分支预测错误时，预测位就被修改，并且需
要恢复现场，程序从分支指令处重新执行。
8
得到分支结果
鲁东
i+1
i+2
大学
分支指令
信
息
与电
i-1
i
气
工
程
学
猜测执行路径
院
p+1
p+2
实际执行路径
图4.10 分支预测执行不成功和重新执行过程
9
例4.6 一个循环共循环10次，它将分支成功9次，
1次不成功。假设此分支的预测位始终在缓
工程
令地址都与保存的标示作比较，一旦相同，我们
学院
就认为本指令是分支指令，且认为它转移成功，
并且它的分支目标（下一条指令）地址就是保存
在缓冲区中的分支目标地址。
这个缓冲区就是分支目标缓冲区（BranchTarget Buffer，简记为BTB，或者BranchTarget Cache）。
15
1. 分支目标缓冲结构和工作过程
4 yes SUBD F8,F6,F2 写结果 F8 #1-#2
信
息与
5 yes DIVD F10,F0,F6 执行 F10
电
气工
6 yes ADDD F6,F8,F2 写结果 F6 #4+#2
程
学
院
浮点寄存器状态表
域
F0 F2 F4 F6 F8 F10 … F30
ROB号 3
6 4 5…
忙
yes no no yes yes yes … no
程
学院
速度也快了n倍；
• 根据Amdahl定律可知，随着机器CPI的降低，
控制相关对性能的影响越来越大。
3
本节着重于：
鲁
东大
通过硬件技术，动态地进行分支处理，对程
学
信
息与
序运行时的分支行为进行预测，提前对分支操作做
电
气工
出反应，加快分支处理的速度。
程
学院
分支的最终延迟取决于流水线的结构、预测的
目的
#3 #5
28
ROB
项号忙
指令
状态目的
值
1 no LD F6,34(R2) 确认 F6 Mem[34+Regs[R2]]
2 no LD F2,45(R3) 确认 F2 Mem[45+Regs[R3]]
鲁东
3 yes MULTD F0,F2,F4 写结果 F0 #2×Regs[F4]
大学
24
¡ 再定序缓冲的每个项包含三个域：
（1）指令的类型
鲁
指令类型包括是否是分支（尚无结果）、
东大
存操作（目的地址为存储器）或寄存器操作
学
信息
（ALU操作或目的地址是寄存器的取操作）。
与
电气
（2）目的地址
工程
目的地址域给出结果应写入的目的寄存
学
院
器号（对于取操作和ALU指令）或存储器的地
址（存操作）。
当前 PC
查找、比较地址标示
分支目标 PC
分支目标指令
分
鲁
东
支
大学
目
信
标
息
与
缓
电气
冲
工
程
学
院
命中？
Y 命中，则认为本指令是分支，且分支成功，以分支目标缓冲中分支目标 PC 作为下一条指令地址
N
没有命中，则认为本指令不是
分支，按普通指令执行
图4.12 分支目标缓冲的结构和工作过程
16
2. 在流水线的各个阶段中，具有分支目标缓冲的工作分配如图4.13。
学
院
¡ 对目的指令进行缓冲，构成称为分支目标指令
缓冲（branch folding）的结构，它可使无条
件分支的延迟达到零，甚至有的条件分支也可
达到零延迟。
21
4.3.3 基于硬件的前瞻执行
鲁东
前瞻（Speculation）的技术方法：
大学
它允许在处理器还未判断指令是否能执行
信
息与
之前就提前执行，以克服控制相关。
信
息
与电
分支成功
分支不成功
气
工
程学院
分支预测：
01
分支不成功 00
分支不成功
不成功
分支成功
图4.11 具有两个分支预测位的分支预测缓冲状态转换机制
12
6. n位分支预测缓冲
鲁
¡ 采用n位计数器，则计数器的值在0到2n-1之间：
东大学
当计数器的值大于或等于最大值的一半（ 2n-1 ）
（3）值域值域用来保存指令前瞻执行的结果，直
到指令得到确认。
25
¡ 使用再定序缓冲的处理部件的硬件结构
从指令部件来
再定序缓冲
浮点
……
操作
队列
鲁东
去存储器
大学
操作总线 (地址/数据)
浮点寄存器组
信
息
与
操作数总线
电
气
工
程
学
院
保留站
从存储器来 (取的结果)
FP 加法器
FP 乘法器
公共数据总线
图4.14 采用Tomasulo算法并支持前瞻执行的DLX浮点部件的结构
延迟为0。
（2）在BTB中，预测成功，实际不成功，此时
的延迟为：
19
BTB命中率 × 预测错误率 × 2
鲁东
= 90% × 10% × 2
大
学信
= 0.18（时钟周期）
息
与电
（3）不在BTB中，实际成功，此时的延迟为：
气工程
（1-BTB命中率） × 不在BTB中分支转移成功率 × 2
学院
分支成功
图4.9 只有1个预测位的分支预测缓冲状态转换图
7
2. 分支预测缓冲技术包括两个步骤
¡ 分支预测
鲁东大
如果当前缓冲记录的预测位为“1”，则预
学信息
测分支为成功；如果预测位为“0”，则预测分支
与电
为不成功。
气
工程学
¡ 预测位修改
院
如果当前分支成功，则预测位置为“1”；
如果当前分支不成功，预测位置为“0”。
通过再定序缓冲，可以在进行精确异常处理的同时进行动态指令调度。29
鲁
东大
前瞻执行的技术策略很容易的推广到整数寄存器
学
信息
和整数功能单元上。
与
电
气工
前瞻技术存在的一个主要缺点：
程
学
院
支持前瞻的硬件太复杂，需要大量的硬件资源。
30
4.4 多指令流出技术
鲁

e商务文档

chap4-3指令级并行

相关文档推荐：