当前位置：文档之家› 一种快速浮点加法器的设计与优化方法

一种快速浮点加法器的设计与优化方法

!
引言浮点加减法运算是浮点预算中最常用的操作 !
其中 ! # 表示浮点数 ! 的符号 % $ 表示 % 的指数部分 !它是一个 6 位的带 2!& 位偏移量 &&0" ! "0" 时除外 ’ 的无符号数 % " 表示 % 的小数部分 ! 它是一个
浮点加减法的性能对整个浮点运算器的性能起到决定性的作用 " 由于浮点预算包括一系列独立 # 复杂而又费时的操作 ! 如指数对齐 # 移位 # 尾数加减 # 结果的四舍五入及规范化处理等 ! 如果不使用优化技术而顺序执行上列的步骤 !其时延将无法忍受 " 为此 ! 本文从算法和结构等多方面考虑 ! 采用了多种优化技术 ! 使本文提出的单精度浮点加法器能达到 ’""()* 的频率 ! 达到了优化的目的 " 由于文献 +!, 已经对该浮点加法器的结构给予了详细的介绍 ! 本文将重点介绍该结构所采用的优化技术 "
!’ 位的无符号数 " 因此 ! 可以用 7#8&+&$",! " +!!$", 5 来
表示一个单精度浮点数+’," 浮点加法器应以两个标准的浮点数作为输入 ! 在指定运算类型 & 加或减 ’ 及四舍五入模式的情况下 ! 输出一个仍符合 -... 标准格式的结果 "
"#" $%%% 四舍五入模式
8:(09,;0< -> @KFD EBEAC8 LA ECADA>@ B ><ZAW ?ADFX> <G -... V<\EWFB>@ DF>XWA ECAVFDF<> GW<B@F>X E<F>@ B??AC3 ]KA B??AC BVKFAZA? KFXK EACG<C\B>VA =E @< ’""()* =>?AC "326!\ @AVK><W<X[ ^[ =DF>X ZBCF<=D <E@F\F*B@F<> @AVK>F_=AD8 D=VK BD @L< ?B@B EB@K DAEBCB@F<>8 @KCAA EFEAWF>A D@BXAD8 M: A>V<?AC8 CA?=VA? -... C<=>?F>X \<?AD B>? EBCBWWAW ECAGF‘ B??AC A@V3 =’> !39-"< 4W<B@F>X E<F>@ B??AC8 M: A>V<?AC8 %<=>?F>X8 5BCBWWAW ECAGF‘ B??AC
选择出大小操作数 ! 并进行指数对阶移位 ! 这些大致需要 , 个逻辑级延时 " 第二级执行 23 编码操作 ! 前导零预测 ! 使用 !, 位的并行前缀加法器执行尾数的相减操作 !共需要 M 个逻辑级 " 在第三级中 !执行规格化处理 &, 个逻辑级 ’" 综上 !3>DEFG 关键路径的长度不超过 M 个逻辑级 "
! %! F 0P $N ’
该方法中 !$KO 与 &’( 的不同仅在于当 8H E
)9HG9!: [ ! 且 9! 的最低有效位为 H 时 ! 因此 ! 在修正
结果时 ! 在上述情况下将 9! 的最低位强制为零即可) 对舍入模式的简化 ! 使得相应的逻辑电路在时间和面积上都得到相应优化 )
根据式7*: !定义 5 为 (
( 5E/G1 7=: 并行前缀加法器 ! 如 QR%’44B- 或 R6%’44B- ! 可以同时计算出 5 和 5GH) 则可根据 5 的符号 !选择 & 或 5GH 作为结果 ) 在 $%&’() 中 ! 由于四舍五入可能产生进位 ! 因
此也可以利用并行前缀加法器的上述特性 ! 同时计算出 .*+, 和 .*+,GH! 最终结果的选择根据四舍五入部分的进位来决定 )
"!,
微电子学与计算机
!""# 年第 !! 卷第 !" 期
一种快速浮点加法器的设计与优化方法
刘哲
摘
付宇卓
&上海交通大学微电子学院 ! 上海 !"""’" ’ 要 ! 本文提出了一种快速单精度浮点加法器的设计方法 ! 重点介绍了该浮点加法器所采用的各种优化技术 !
四舍五入的模式决定了浮点运算的精确度!
-...%&/# 规定浮点运算中所用到的 # 种标准四舍
五入模式 ! 它们分别是
125 向零进位 $ 即将最低有效位后的所有位直接
舍去 %
1!5 向最近的高位进位 &9:;$9<=>? @< :ABCAD@ "
浮点数标准和基本算法本节介绍浮点数的 -... 标准表示法和基本的浮点加法运算的算法 "
#%!
流水线划分及时延分析兼顾到面积和速度的需要 ! 该浮点加法器采用
* 级流水线结构 ! 其详细结构图请见附录 ’" 采用文献 -#/ 中以逻辑级为基本单位的时延分析方法. 分别对 3>DEFG 和 H>DEFG 进行分析 " 在 3>DEFG 中 ! 流水线第一级将计算指数差异 !
> 个逻辑级 "
若把这样一个加法器运用到一个浮点 ?6@ 上 ! 在时延分析时 ! 还需考虑到加法器外围电路的延时 " 假定有四个通用寄存器可参与浮点运算 ! 则为从这四个寄存器中作选择 ! 又需要两个逻辑级 " 再考虑到对于溢出等情况进行处理的监控逻辑 ! 整个加法器的每级流水线延时不会超过 = 个逻辑级 " 采用 6.31&A.A 公司的 4BA053 81C&0DB- 工具进行综合 ! 综合的结果表明该浮点加法器的关键路径在
式 ! 即在原操作的基础上加上一个根据舍入模式得到的插入数值 &6"7 $) 对单精度数 ! 插入的定义如下 (
"F $ NK7E % ! F
& %!!
%>#
0P $% 0P $KZ 7H":
& %!T
$%&’() 的第二级 " !"!
部分压缩编码进行前导零预测本文引入 !%" 编码及其相关理论来计算前导零的个数 " 定义 #( 设 !"!##!!##"$$$!$ 为一个 # 位的借位保存编码串 ! 对它进行 @ 编码得到 $ ! 即 $E@ 7%:F 则 $ 为一个 #GH 位的借位保存编码串 $&$#$#%HIII%"! 且 )
’!故 # 对齐操作的移位数目至多为 ’$ # 指数差的计算只需抽取最末两位 $ # 不需要进行四舍五入 " 在 H>DEFG 中 ! 或者进行加法 ! 或者进行指数差
异较大的减法 !故
# 最后结果在规格化时至多只需要左移一位 $ # 尾数运算结果始终为正 ! 不需要取反 "
与传统的双数据通道划分方法相比 ! 该结构在
文章编号 ! 2"""%&26" （!""#） !"%"!,-,*
&’()*+ ,+- ./0)1)2,0)3+ 34 , 5,(0 563,0)+* 73)+0 8--’9
Q-; RKA! S; T=U*K=<
&OVK<<W <G (FVC<AWAV@C<>FVD. OKB>XKBF YFB<@<>X ;>FZACDF@[. OKB>XKBF !"""’" /0123’
如双数据通道划分 "’ 级流水线结构 "M: 编码 " 简化的四舍五入模式及并行前缀加法器等 ! 使得该浮点加法器的频率能够达到 ’""()* ! 能在高性能浮点 NOM 中得到很好的应用 # 关键词 ! 浮点加法器 !M: 编码 ! 四舍五入 ! 并行前缀加法器中图法分类号 ! )&*+
!! 文献标识码 ! P
!%&
简化的四舍五入模式根据 S2’8);#<! 将 NOOO 的四舍五入模式简化为
T 种 ! 即 ( 向零舍入 &$U$! 向无穷舍入 &$N $! 向最近的偶数进位 &$KO $) V OWOK 和 @ X 6B4BD;!< 还通过引入插入 &03YB8(013 $ 的方法进一步简化了舍入模
#
优化技术根据以上的分析 ! 本设计采用了一系列的优化这样划分的优点是 # 在 3>DEFG 中 ! 由于两操作数指数差异不超过
方法 !来降低整个浮点运算的操作时延 " 在结构上 ! 采用优化的双通道方案 ! 并提出 * 级流水线的划分方法 $ 在算法上 ! 使用 23 编码进行指数差前导零的预测 ! 采用简化的四舍五入模式 % 带流水线结构的并行前缀加法器等优化技术 ! 并在细节上尽量增加并行运算的可能 " 下面将对这些优化技术作详细介绍 " 这里 ! 将以 !4+"#. $#. %#(. &4+"’. $’. %’( 表示两操作数 !() 表示将进行的运算 &5 为加 !’ 为减 ’!678 表示采用的四舍五入的模式 !*+&",. $,. %, ) 表示 - %& 中较大的操作数 !./&"". $". %") 表示较小的操作数 ! 9:;< 表示 %0 ()

e商务文档

一种快速浮点加法器的设计与优化方法

相关文档推荐：