当前位置:文档之家› 计算机系统结构有详细答案

计算机系统结构有详细答案

(仅供参考,不作为考试标准),
选择题分,每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。

A)硬件设计人员B)逻辑设计人员
D)高级语言程序员C)机器语言或汇编语言程序员。

意________,应当注提系在计算机统设计时,为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速。

的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储
________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同
D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同
栈型替是的________。

换算法堆不属于B)近期最少A)近期最使用法久未用法
D)页面失效频率法出进C)先先法
象联组,相映的优点。

是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高
是方好关相指除中叠次一重消令最的法________。

B)设相关专用令指改准A)不修通路
令指条下析分后推C) 令指条下行执后推D)
流的用采,时关据数到,中作水操遇相________。

有法办解决器译编化优A)用办的排新重令指过通,测检序法据数B)向定重技术
C)延迟转移技术
D)加快和提前形成条件码
经多级网络串联来实现全排列网络,只能用________。

A)多级立方体网络B)多级PM2I网络
D)上述多级混洗交换网络任何网络C)
序传送的________。

是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字
________
处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)
________ 流水括标不包线的技术指率比加B) 应A)响比吞吐率C)速D)效
________ 属于机向量处理D)MIMD
B)SIMD A)SISD C)MISD
系。

统结构属________于MIMD 同一的管理元个控制单时元理A)各处单同受的送单一时理各B)处单元同接受同个控制元来指令机算机理和多计处C)多机处理阵D)列
储的储,单处机处并计BSP算机的行理有16个理元并行存器存体个数________。

为B)1
C)32
D)17A)16
判断题正确打√,错误打╳,分,每题分)10(1( ×)对计算机系统中经常使用的基本单元功能,宜于用软件来实现,这样可降低系统的成本。

(√)处理机级流水线又称为指令流水线。

( ×)由于RISC简化了指令系统,因此,RISC上的目标程序比CISC上的目标程序要短一些,程序执行的时间就会少一些。

( ×)在存储体系中,地址的映象与地址的变换没有区别。

( ×)在满足Cache与主存的一致性方面,写回比写直达法好。

( ×)Cache组相联映象的块冲突概率比直接映象的高。

(√)采用LRU替换的Cache存储器,分配给程序的Cache容量一定时,块的大小增加,Cache的命中率将先上升,到一定时候又会逐渐降低。

(×)阵列处理机以多个处理机构成阵列。

( √)SIMD计算机的算法极大地依赖于机器的系统结构。

(×)解决多处理机Cache不一致性问题是基于链式目录的协议优点是限制了共享数据块的拷贝数量。

综合题
(10分)如果某计算机系统有3个部件可以改进,则这三个部件经改进后的加速比分别为:S1=30,S2=20,S3=10。

(1)如果部件1和部件2改进前的执行时间占整个系统执行时间的比例都为30%,那么,部件3
改进前的执行时间占整个系统执行时间的比例为多少,才能使3个部件都改进后的整个系统的加速比Sn达到10
(2)如果3个部件改进前执行时间占整个系统执行时间的比例分别为30%、30%和20%,那么,3个部件都改进后系统的加速比是多少未改进部件执行时间在改进后的系统执行时间中占的比例是多少
,5%,10%,,别为35%25%,20%使条共有7指令,各指令的用频率分机一(10分)台模型。

3%和2%。

长平均度设算所计操作码的,并码设度的求(1)要操作码平均长最短,请计操作的编码计存储器型变址寻址方式-16位字长的寄存器-8字长的寄存器寄存器型指令3条,(2)设计127。

请设计指令格式,并给出各字段的长度和操作码的编码。

指令4条,变址范围不小于±
解:
Huffman)要使得到的操作码长度最短,应采用解:(1树如下:编码,构造Huffman
S1S2 S3S4这样,采用Huffman编码法得到的操作码的平均长度为:
H = 2×++ + 3×+ 4 ×+ 5×+
=+++
=
(10分)有一个4段流水线,如下图所示:
S1S2S3S4
其中,段S1和S3的执行时间均为200ns,段S2和S4的执行时间均为100ns。

若瓶颈段S1可使用细分方法改造,瓶颈段S3可使用并联方法改造,对改造后的流水线,分别使用公式和时空图求连续流入4条指令的实际吞吐率和效率
(10分)设向量长度均为64,在Cray-1机上所用浮点功能部件的执行时间分别为:相加6拍,相乘7拍,求倒数近似值14拍;从存储器读数6拍,打入寄存器及启动功能部件各1拍,问下列各指令组,组内的哪些指令可以链接哪些指令不可链接不能链接的原因是什么
分别计算出各指令组全部完成所需要的拍数。

(2)V2<--V0*V1(3)V0<--存储器存储器(4)V0<--存储器(1)V0<--存储器V3<--V1<--1/V0 V1<--V2+V3 V2<--V0*V1 V3<--V1*V2 V3<--V2+V0 V4<--V5*V6
V4<--V2+V3 V5<--V3+V4 V5<--V3+V4
解:(1)3 条向量指令之间既没有发生源Vi 冲突,也没有Vi 的先写后读相关,又不存在功能部件的使用冲突,所以这3 条向量指令可以同时并行流水。

向量指令组全部完成需要
max{(1+6(访存)+1+64-1),(1+6(浮加)+1+64-1),(1+7(浮乘)+1+64-1)}
=72拍。

(2)3 条向量指令之间没有功能部件的使用冲突,但是在第1、2 两条向量指令与第3 条向量指令之间有V2 及V3 的先写后读相关。

只要让第1 条向量指令较第2 条向量指令提前1 拍启动,则第1,2 两条向量指令的第1 个结果元素就可以被同时链接到第3 条向量指令中。

(1+7(浮乘)+1)+(1+6(浮加)+1+64-1)
=80(拍)。

(3)第1 条向量指令与第2 条向量指令之间有V0 的先写后读相关,两者可以链接。

第3
条向量指令与第2 条向量指令之间有源向量寄存器V0 的冲突,它们之间只能串行。

第3
条向量指令与第4 条向量指令之间有加法功能部件的使用冲突,它们之间也只能串行。

)+1+64-1)浮加乘)+1+64-1)+(1+6( 访存)+1+64-1)+(1+6( (1+6( 访存)+1+1+7( 浮。

拍)=222(冲用的使功能部件,但无源Vi 冲突,也无依(4)4 条向量指令均次有Vi 的先写后读相关水。

,进行流以全部链接在一起以突,所,这4 条向量指令可加)+1)+64-1乘)+1)+(1+6(浮)+1)+(1+(7 访
存)+1)+(1+14(求倒数浮(1+6(=104 拍。

表所示其预约表如下Δ水线,各段执行时间均为t,一(10分)有个5段流时间tt1t2t3t4t5t6t7S 段XS1XXS2XXXS3XS4XXXS5
(1)列出禁止表F和冲突向量C。

(2)画出流水线调度的状态图。

(3)分别求出允许不等时间间隔调度和等时间间隔调度的两种最优调度策略,以及这两种调度策略的流水线最大呑吐率。

(4)若连续输入10个任务,求这两种调度策略的流水线实际呑吐率和加速比。

解:
(1)禁止向量F=(1,3,6) (1 分)
冲突向量C=(100101) (1 分)
(2)
(3)
最小启动循环(2,2,5) 最小平均延迟(2+2+5)/3=3 TPmax=1/(3Dt) (1 分)
最小恒定循环(4)
TPmax=1/(4Dt) (1 分)
(4)
(10分)阵列机有0~7共8个处理单元互连,要求按(0,5),(1,4),(2,7),(3,6)配对通信。

(1)写出实现此功能的互连函数的一般式。

(2)画出用3级立方网络实现该互连函数的互连网络拓扑结构图,并标出各控制开关状态。

解:(1)
如下图所示:(2)。

相关主题