当前位置:文档之家› 高等计算机体系结构考题部分答案整理与分析(1).

高等计算机体系结构考题部分答案整理与分析(1).

高等计算机体系结构考题部分答案整理与分析(1)——2002年高体考试真题解析1.填空题1)第一台通用流水线计算机是:Stretch,即IBM7030解析:主要是考察流水线技术的相关背景。

最早实现流水线技术的计算机应该是使用Stretch,即IBM7030,使用流水线实现了重叠取指令、译码和执行。

其中还设计了避免冲突的ALU旁路技术。

在1964年发布了CDC6600是使用记分板技术实现动态调度流水线机制的机器。

而使用保留站机制的Tomasulo算法是在IBM 360/91中使用的。

知识来源于本科课件第二讲2)有效检测N位加法溢出的方法是:察看输入最高位的进位是否等于最高位输出的进位解析:该知识来自本科计算器加减法运算的相关知识。

溢出指运算的结果超出了正常的表示范围。

加法溢出只可能出现在两个同为正数或同为负数相加才可以实现。

可用以下方法检测:察看输入最高位的进位是否等于最高位输出的进位。

若不相等则容易知道该数据溢出。

3)时间局部性是指:如果一个信息项正在被访问,那么近期它还会再被访问解析:考察流水线及性能改进基础——局部性原理。

局部性原理:CPU访问存储器时,无论取指令或者存取数据,访问存储单元都趋向于聚集在一个较小的连续区域中。

局部性原理包含时间局部性和空间局部性。

时间局部性指如果一个信息项正在被访问,那么近期它还会再被访问。

原因:由程序循环和堆栈技术造成的。

空间局部性指在最近的将来用到的信息很可能在现在正在使用的信息在空间地址上临近。

原因:由指令顺序执行和数组存放造成。

4)流水线存在的三种相关是:数据相关、名字相关和控制相关解析:考察指令级并行技术的基础相关知识。

相关性是程序的特性,一个相关是否会导致实际的冒险,该冒险是否会造成停顿,这是流水线结构的基本特征。

指令共有三种不同类型的相关:数据相关、名字相关和控制相关。

2.辨析题1)加深流水线级数一定可以提升处理器性能。

这句话说法不对。

当然在一定条件下加深流水线的级数可以加快流水线处理的并行度,从而提高处理器的性能。

但超过一定限度后,流水线级数无法无限制地增加并提高处理性能。

影响和限制流水线级数来提高性能的因素如下:1)指令流的并行度有限,当流水线级数增加,即流水线深度增加时,因为相关引起停顿将最终造成CPI的增加。

更深的流水线会造成时钟周期的下降,并受到时钟扭斜和负载的限制。

2)增加页面大小一定可以提升系统整体性能。

这句话说得不对。

由于RAM价格下降,存储器变得更大;处理器和存储器之间的速度差别更大,因此必须增加页面大小。

但增加页面大小会使存储器中的内部碎片变得严重,从而浪费很多存储空间。

因此增加页面大小不一定可以提升系统整体性能。

3.简答题1)简要回答DMA的概念和优势。

答:DMA方式是利用硬件控制的特殊处理器实现直接访问存储器,它可以在CPU做其他工作时组织内存和IO设备之间传送数据,适合成组数据的交换。

DMA控制器可以接管CPU总线控制,数据传输不受CPU干预,直接在存储器和外围设备之间传输数据,节约了硬件中断开销,大大减少了CPU访问和控制IO设备的时间。

2)时钟扭斜与建立时间,时钟周期之间的关系。

答:时钟扭斜是指两个同步时钟边沿可能会产生不一致,由于时钟时间>=CLK-to-Q+最长延迟路径+Setup+时钟扭斜,因此时钟扭斜会影响最小时钟周期长度,从而影响处理器的性能和频率。

由于时钟扭斜会影响保持时间,CLK-to-Q+最短延迟路径-时钟扭斜>保持时间,从而无法确定保持时间的范围。

综上,时钟扭斜对电路稳定性、时钟周期和处理器性能都有所影响。

3)什么是Cache分配写回策略?答:cache分配写回策略指Cache对应快被替换时才会被写入内存从而更新数据,之前内存的数据往往是脏数据。

写回策略主要是出于减少存储器之间通信量的考虑。

4)什么是软件流水技术?答:软件流水技术主要是发现如果程序循环中每次迭代没有相关,通过从不同迭代中抽取指令来获得更高的指令级并行,即对循环结构重构,使得每次迭代指令属于原循环不同的迭代过程。

软件流水的代码空间比较小,每次只需填充和排空流水线一次,而程序循环结构展开每次就需要一次迭代。

但要求原有循环结构每次迭代之间不能存在相关。

5)精确中断技术的定义?精确中断指对于单条指令,所有该指令之间的指令都处于提交状态,且所有后续指令,包括产生中断的指令没有改变任何机器状态,需要一定措施使得指令执行次序与指令发射流进行再同步。

高等计算机体系结构考题部分答案整理与分析(2)——2003年高体考试真题解析1.填空题1)第一台全面的、可操作的、存储程序计算机是:剑桥大学的EDSAC计算机解析:这是来自本科的内容,考察计算机制造历史的基本知识。

似乎对于这方面的考察每年似乎都有相关的题目。

世界上第一台通用电子计算机来自1946年宾夕法尼亚大学的ENIAC计算机,世界上第一台可以操作的存储式计算机来自1948年曼彻斯特大学的Mark-I计算机,世界上第一台全面的、可操作的、存储程序的计算机是1949年剑桥大学的EDSAC计算机。

最早用于商业应用的通用计算机是UNIVAC I 计算机。

世界上第一台通用流水线计算机是IBM 7030(Stretch)计算机,世界上第一台超级计算机是1966年CDC公司的CDC 6600计算机。

IBM 360/85计算机是第一台使用cache的商业计算机。

2)Cache访问的三种失效为:义务失效、容量失效、冲突失效解析:Cache访问失效一般有义务失效、容量失效和冲突失效三种。

义务失效指第一次访问不在缓冲器中的数据块,该块必须被调用。

这种失效在所难免,无效大存储器也会发生。

容量失效是程序执行时,缓冲器不能存放需要的所有数据块会先放弃一些数据块再找回数据。

冲突失效是采用组相联或直接相联技术,有多个数据块映射到同一组而产生的数据块的丢失和找回过程。

3)流水技术的三种相关:数据相关、名字相关和控制相关解析:指令共有三种不同类型的相关:数据相关、名字相关和控制相关。

数据相关指后面指令的源操作数是前面指令的目的操作数。

名字相关指两条指令使用同一个寄存器或内存地址,但指令之间不存在数据流。

控制相关指决定分支指令执行顺序和转移方向而引起的相关。

4)(10÷0)在IEEE754中的表示:NaN(Not a Number)解析:IEEE754为专门的非法运算规定了这个特殊符号NaN,表示所得的结果不是一个有效的实数。

出现非法运算程序员也不用理睬,直到方便再进行处理。

2.名词解释1)软件流水技术✧(已考) 软件流水技术主要是发现如果程序循环中每次迭代没有相关,通过从不同迭代中抽取指令来获得更高的指令级并行,即对循环结构重构,使得每次迭代指令属于原循环不同的迭代过程。

软件流水的代码空间比较小,每次只需填充和排空流水线一次,而程序循环结构展开每次就需要一次迭代。

但要求原有循环结构每次迭代之间不能存在相关。

2)延迟转移解析:延迟转移法由编译程序重排指令序列来实现。

基本思想是“先执行再转移”,即发生转移取时并不排空指令流水线,而是让紧跟在转移指令lb之后已进入流水线的少数几条指令继续完成。

如果这些指令是与Ib结果无关的有用指令,那么延迟损失时间片正好得到了有效的利用。

转移预测法用硬件方法来实现,依据指令过去的行为来预测将来的行为。

通过使用转移取和顺序取两路指令预取队列器以及目标指令cache,可将转移预测提前到取指阶段进行,以获得良好的效果。

延迟槽用来存放延迟指令,可以由分支语句之前、分支语句转移目标处和发生转移和转移目标中间代码获得指令。

延迟转移主要局限在与对延迟槽中填充指令的限制和在编译时间内准确判断转移是否发生的能力不足。

3)直接存储访问(DMA)✧(已考)DMA方式是利用硬件控制的特殊处理器实现直接访问存储器,它可以在CPU做其他工作时组织内存和IO设备之间传送数据,适合成组数据的交换。

DMA控制器可以接管CPU总线控制,数据传输不受CPU干预,直接在存储器和外围设备之间传输数据,节约了硬件中断开销,大大减少了CPU访问和控制IO设备的时间。

1)问答题1) 计算Cache的组数,相联度和TLB位数,说明TLB和Cache并行工作流程。

答:数据块放入Cache如何采取灵活方式减少Cache缺失?使用直接映像的方法是最简单的定位方式,即一一对应。

另一个就是用全相联映射,即数据块可以放到Cache 任意位置。

折中方法就是利用组相联映射,每个数据块可以放在固定数量位置。

每个块有几个位置可以放入组关联Cache称为n路组关联Cache。

N即为组关联Cache的关联度。

TLB是为了加快地址变换而设计的转换后援缓冲器,是一个跟踪和记录最近用过地址转换的特殊Cache。

TLB中每个标记项存放虚拟页号的一部分,每个数据项存放物理页号。

同时包含一些有效位和修改位。

对每次访问,我们都要在TLB中查找虚拟页号,如果命中,则物理页号用来形成地址并打开访问位。

TLB和Cache相连工作原理:CPU请求虚拟地址,虚实地址变换机制MMU会通过Table Walk访问主存页表来获得映射,查看是否有要求的虚拟页号。

若命中,则MMU 将对应的虚页号转换为物理页号,产生物理地址访问内存。

若发生缺失,CPU转到页面失效入口交给操作系统实现。

高等计算机体系结构考题部分答案整理与分析(3)——2004年高体考试真题解析1.辨析题1)高的流水级数总能提高性能.2)CPI较低的机器运行速度总是快.3)频率能够衡量两台使用相同指令系统的计算机的相对性能.4)预测错误之间的指令数目比预测错误率更能体现预测性能.5)Superscalar只使用硬件调度指令,VLIW只使用软件调度指令.2.名词解释1)软件流水技术解析:(已考) 软件流水技术主要是发现如果程序循环中每次迭代没有相关,通过从不同迭代中抽取指令来获得更高的指令级并行,即对循环结构重构,使得每次迭代指令属于原循环不同的迭代过程。

软件流水的代码空间比较小,每次只需填充和排空流水线一次,而程序循环结构展开每次就需要一次迭代。

但要求原有循环结构每次迭代之间不能存在相关。

2)(3,2)预测器解析:(已考) 预测转移是处理控制相关的一种策略。

预测转移通过其他分支指令的行为进行控制称为关联控制器。

(m,n)关联预测器指通过该分支指令前面m条指令的转移结果来从2m个n位预测器中选择转移结果。

这m条最近转移指令结果可以放到m位移位寄存器中,每一位表示该转移是否发生。

3)SMP(对称多处理器系统)解析:对称式共享存储器系统结构(SMP)指多个处理器通过总线共享一个物理存储器,每个处理器与同一个共享内存有相同的关系的设计结构。

它支持共享和私有数据的高速缓存。

私有数据是被单个处理器使用,而共享数据由多个处理器使用,本质上通过读写共享数据完成处理器之间的通信。

相关主题