当前位置:文档之家› 计算机体系结构部分课后习题答案-清华大学

计算机体系结构部分课后习题答案-清华大学

START: LOAD R1, A
LOAD R2, B
LOAD R3, C
CMP R1, R2
BGE NEXT1 ;转移成功时,要取消下一条指令
MOVE R2, R1
NEXT1: CMP R1, R3
BGE NEXT2 ;转移成功时,要取消下一条指令
MOVE R3, R1
NEXT2: STORE R1, MAX
4.3概念略
4.7
5.1略
5.2略
5.3解:
(1)顺序执行:6n*Δt
(2)“取指令”和“执行”重叠:6t + (n-1)5t = (5n+1)Δt
(3)“取指令”、“分析”和“执行”重叠:6t + (n-1)3t = 3(n+1)Δt
(4)先行控制:Δt+5Δt + 3(n-1)Δt,约为3nΔt
10、[(A1*B1)+( A2*B2)]+[ (A3*B3)+( A4*B4)];
11、{[(A1*B1)+( A2*B2)]+[ (A3*B3)+( A4*B4)]}+[ (A5*B5)+( A6*B6)];
时空图:静态,功能需要分开
S6
1
2
3
4
5
6
7
8
9
10
11
S5
1
2
3
4
5
6
S4
1
2
3
4
5
6
C2 C3 C0 C1 C0 C2 C3 C1 C0 C1 C2 C3
(5) FIFO中Cache的块命中率:
图略
3/12=25%
(6) LFU中Cache的块命中率:
4/12=33.3%
(7)改为全相联映象后:
FIFO中块命中率:4/12=33.3%
LFU中块命中率:3/12=25%
(8)这时Cache的命中率:
(2)程序适当调整如下:
START: LOAD R1, A
LOAD R2, B
CMP R1, R2
BGE NEXT1
LOAD R3, C
MOVE R2, R1
NEXT1: CMP R1, R3
BGE NEXT2
NOP
MOVE R3, R1
NEXT2: STORE R1, MAX
3.1题
(1)当S2>>S1时,平均价格接近C2。
习题参考答案
1.1概念略
1.12Байду номын сангаас
1.13
1.15
1.19
1.21
2.1略
2.4证明:
设有两种浮点数表示方法F1, F2,他们二进制字长相同,尾数用原码或补码小数表示,阶码用移码整数表示,阶码均为2,而尾数基不同。
F1:尾数基值rm1 = 2,尾数p1,阶码长q1,二进制字长L1 = p1+q1+2
F1:尾数基值rm2 = 2^k,k为正整数,尾数p2,阶码长q2,二进制字长L2 =kp2+q2+2
一地址:
LOAD FSUB GSTORE XLOAD AADD BMUL CSTORE Y
LOAD DMUL EADD YDIV XSTORE X
零地址:
PUSH APUSH BADDPUSHMULPUSH DPUSH EMULADDPUSH FPUSH GSUBDIVPOP X
累加器:
MOV R1, AADD R1, BMUL R1, CMOV R2, DMUL R2, EADD R1, R2
方式五、高位体号:2位;低位体号:2位;体内地址:20位;
方式六、体内地址:20位;多路选择器:2位;低位体号:2位;
(2)小题
①扩大容量;
②比较简单;
③速度比较快;
④速度快,容量大;
⑤速度快,容量大;
⑥提高速度
(3)小题
①1;
②16;
③接近16;
④接近8;
⑤接近4;
⑥接近16
(4)略
3.12
3.14
2.5题
1)套公式,计算的到q >=6.99,p>=23.9,故去q = 7,p = 24阶码为7+1(1位符号位)
由于p + q + 1 = 33,隐藏最高位(-128-127)
2)计算:
①最大正数:(1-2^-24)×2^127
②最大负数:-2^-1×2^-128
③表数精度:1/2×2^-23=2^-24=10^-7.22
5.11解:
(1)
禁止向量:(6,4,2)
初始冲突向量:(101010)
(2)
状态图:
(3)
(4)
恒定循环:5最小循环:(1+7)/2=4
(5)
最大吞吐率:
(6)
10/40Δt或者10/42Δt
(7)
③9.9946 ns.美元/k字节;
选256k的cache最优
3.7题:
(1)小题解答:
方式一、体号:4位;体内地址:20位;4MB = 2^25b 4MB/32b = 20位
方式二、存贮地址:20位;多路选择器:4位;
方式三、体内地址:20位;存储器体号:4位;
方式四、高位体号:1位;低位体号:3位;体内地址:20位;
cache=128k, c=0.3152美元/k字节;
cache=256k,c=0.4235美元/k字节
(3)
按等效访问时间由小到大排序,容量分别为:
256k,128k,64k
按每字节平均价格由小到大排序,分别为:
64k, 128k, 256k
(4)
①19.129 ns.美元/k字节;
②11.9776 ns.美元/k字节;
MOV R2, FSUB R2, GDIV R1, R2MOV X, R1
2)P= 1B,A = 2B,D = 4B,R = 1/2B
1.6246P+18A = 42B6P+18A+18D = 114B
2.9339P+18A = 45B9P+18A+24D = 141B
3.122412P+12A = 36B12P+12A+12D = 84B
若F1,F2二进制字长相同,则L1=L2;
即p1+q1+2 = L2 =k p2+q2+2;(1)
表数精度相同,则
即1-p1=k(1-q1)(2)
由(1),(2)得q1 = q2+k-1;
表数范围:F1 = ,F2 = ;
显而易见, 在整数范围内恒成立,当且仅当k=1或k=2时,等号成立,因此F1的表数范围在k的整数范围内恒不比F2小,因此只有k=1或k=2时取得最大值,即rm = 2或rm = 4时有最大表数范围。证毕。
(2)ta = h*t1+(1-h)*t2
(3)e = 1/[h+(1-h)r]
(4)略
(5)当r = 100时,h>0.99947
(6)P134公式,H’= (H+n-1)/n=(0.96+5D-1)/5D>0.99947(精度,不能近似)
D = 0.008/(1-h)
计算得:D>15.05,取D=16
S3
7
8
9
10
11
S2
7
8
9
10
11
S1
1
2
3
4
5
6
7
8
9
10
11
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
流水线性能分析:
吞吐量:TP=11/22t=0.5/Δt
加速比:S=11*4*Δt/(22Δt)=2
效率:E=S/6=1/3
3.3题
(1)t = ht1 + (1–h)t2,
当cache为64k时,t = 0.7*20ns + (1-0.7)*200ns = 74ns;
当cache=128k时,t = 38ns;
当cache=256k时,t=23.6ns
(2)按照公式:
cache=64k, c=0.2585美元/k字节;
有先行指令缓冲栈,忽略取指令时间.
5.6
5.7
5.9题
可将原来的求和算式分为以下11步:
1、A1*B1; 2、A2*B2; 3、A3*B3; 4、A4*B4;
5、A5*B5; 6、A6*B6;
7、(A1*B1)+( A2*B2); 8、(A3*B3)+( A4*B4);
9、(A5*B5)+( A6*B6);
15/16=93.75%第一次冲突,后面15次命中。
4.1
异步性:外围设备相对于处理机通常是异步工作的。
实时性:处理机必须按照不同设备所要求的传送方式和传输速率不失时机的为设备提供服务。
与设备无关性:外围设备的类型、规格、特性多种多样,他们输出数据和接收数据的方式、数据的格式差异很大,因此,设备与处理机的连接方式也很不相同。
3.17
3.18略
3.19题
(1)主存共有2个区,每个区2组,每个组2快,每块16个字节,如果按字节寻址,那么块内地址需要4位,主存要7位。图略
(2)cache地址需要6位,组号1位,块号1位,块内地址4位。图略。
(3)教材图3.44。
(4)Cache的块地址流情况:
B6 B2 B4 B1 B4 B6 B3 B0 B4 B5 B7 B3
④表数效率:100%(如果尾数没有采用隐藏位,那么表数效率为50%)
相关主题