当前位置:文档之家› 高等计算机体系结构课程小结.201509-201511讲义

高等计算机体系结构课程小结.201509-201511讲义

监听总线协议
内容
Cache一致性的提出 多个Cache不一致的原因
(1) 共享可写数据的不一致性 (2) 进程迁移带来的不一致性 (3) 绕过Cache的I/O操作带来的不一致性
设计Cache一致性协议的两种策略
(1) 写无效 (2) 写更新 (3) 两种策略的缺点
写一次协议
(1) 一致性协议的内容 (2) 每份Cache中的副本可能出现的四种状态(有效、保留、重写、无效)
用缓冲实现虚拟直通寻径 阻塞流控制(Wormhole寻径) 抛弃并重发 阻塞后绕道
备注
第三章 互连与通信续3
通信问题
内容
维序寻径
(1) 寻径方式(确定性寻径、自适应寻径) (2) 两种确定性寻径 --- 维序寻径算法
二维网格中的X-Y寻径 立方体网格中的E立方体寻径 (3) 自适应寻径
通信模式
(1) 通信模式(单播、选播、广播、会议) (2) 寻径效率(通信流量、通信时延)
(1) 集中式目录 (2) 分布式目录 (3) 三种目录实现(全映射、有限、链式)及其各自优缺点(如:占用空间)
备注
第五章 Cache Coherence续2
三种Cache一 致性策略
内容
采用写直达的Cache一致性策略
(1) 两种状态、四种操作 (2) 状态转换
采用写回的Cache一致性策略
计算机科学与技术系研究生课程
《高等计算机体系结构》 课程小结
主讲教师:李建江
《高等计算机体系结构》内容
第一章 并行计算简介 第二章 加速比性能模型与可扩展性分析 第三章 互连与通信 第四章 并行存储器系统 第五章 Cache一致性 第六章 基于MPI的并行程序设计 第七章 基于OpenMP的并行程序设计
网络时延(结点时延、线路时延)、 阻塞时延)
四种寻径算法(各自特点、网络时延的计算)
(1) 线路交换 (2) 虚拟直通 (3) 存储转发 (4) Wormhole交换
死锁与虚拟通道
(1) 虚拟通道(逻辑链) (2) 死锁产生的原因(缓冲区产生死锁、通信产生死锁) (3) 死锁的避免(要求通道相关图上不出现圈 --- 利用虚拟通道) (4) 四种解决包冲突的解决方法
备注
第五章 Cache一致性续1
内容
基于目录的 Cache一致性 协议
一般性概念
(1) Cache一致性协议的开销分析(写无效、写更新)
基本思想(只发送给存放该副本的Cache)
(1) 目录的结构(目录里放所有共享数据块的所有Cache副本的地址表、 每个目录项(每个数据结构)包含以及重写位)
目录的方式
(2) 控制方式(级、单元、部分级控制) (3) Ω网(特点、 互联函数及网络描述) (4) 蝶式网络(特点、互联函数及网络描述) (5) 其它(总线、交叉开关)
备注
第三章 互连与通信续2
通信问题
内容
基本术语与性能指标
(1) 消息、包、片 (2) 互联网络(描述(拓扑、寻径算法、流控制)、性能指标(传输时延、吞吐量)) (3) 传输时延(建立时延(源结点时延、目的结点时延)、
备注
第四章 并行存储器系统
内容
存储器系统的 层次结构
一般概念
(1) 存储器系统的层次结构 (2) 五个参数(时间、容量、成本、带宽、单位)
包含性、一致 性和局部性
包含性
(1) 定义 (2) 相邻层之间数据传送的单位
• 一致性
(1) 定义 (2) 维护一致性的两种策略(写直达、写回)
• 局部性
(1) 时间局部性 (2) 空间局部性
备注
第四章 并行存储器系统续1
存储器容 量的规划
虚拟存储 技术
内容
一般概念
(1) 有效存取时间 (2) 命中率 (3) 访问频率 (4) 命中率、缺失率、访问频率、有效访问时间之间的关系
层次结构的优化
(1) 实例 (2) 需要解决的问题(定位问题、寻址问题、替换问题、一致性策略)
共享存储与分布存储
加速比
(1) 绝对加速比、相对加速比 (2) 并行度 (3) 线性、超线性、病态加速比
三种加速比性能模型(思想、特点、决定因素、适用范围)
(1) 固定负载加速比性能模型—Amdahl定律 (2) 固定时间加速比性能模型—Gustafsun定律 (3) 受限于存储器的加速比模型—Sun-Li定律
可扩展性
定义(规模、换代、问题可扩展性)
可扩展性分析
(1) 恒等效率 (2) 恒等效率函数及其求取
备注
第三章 互连与通信
互联网络的作 用
静态网络
元件、拓扑结构、控制方式) 操作方式(同步、异步) 控制策略(集中、分布) 交换方式(电路、分组、Wormhole) 网络拓扑结构(静态、动态)
特点与指标
(1) 点-点相连,不会改变 (2) 结点度、距离、网络直径、网络规模、等分宽度、结点间线长、对称性
典型的静态网络(特点、各种指标的求取)
(1) 线性阵列 (2) 环(双向、单向) (3) 带弦环 (4) 全链接 (5) 树形(带环树、二叉胖树) (6) 星形 (7) 网格(Illiac网、环形网、搏动式阵) (8) 超立方体 (9) 带环立方体 (10) k元n-立方体网络
第一章 并行计算简介
什么是并行计 算?
内容
并行处理、并行处理计算机系统 同时性、并发性、流水
开发并行处理 单用户:加速比;多用户:吞吐率 技术的目的 典型的并行应用
备注
第二章 加速比性能模型与可扩展性分析
加速比性能分 析
可扩展性分析
内容
一般概念
(1) 处理机-时间积、有效工作量、效率 (2) 并行度 (3) 工作负载
(1) 优缺点 (2) 编程模式
DSM与SVM
备注
第四章 并行存储器系统续2
交叉访问 的存储器
内容
定义
(1) 由多个存储模块构成
分类
(1) 低位交叉 (2) 高位交叉 (3) 低位交叉与高位交叉的比较
容错
实现容错的方法(将低位交叉与高位交叉进行组合)
备注
第五章 Cache一致性
Cache 一致性 问题
第三章 互连与通信续1
动态网络
内容
特点
(1) 有源、可重构
互联函数(排列、置换)
(1) 恒等函数 (2) 立方函数 (3) 洗牌函数(均匀洗牌、第k个子洗牌、第k个超洗牌) (4) 逆洗牌函数 (5) 蝶式 (6) PM2I函数
多级互联网络
(1) 三要素 开关(两功能、四功能) 级间互联模式(均匀洗牌、蝶式、多路洗牌、纵横开关、立方体等)
相关主题