当前位置：文档之家› 位单精度浮点数的IEEE表示法

位单精度浮点数的IEEE表示法

32位单精度浮点数的IEEE表示法
float 共计32位(4字节)
31位是符号位，1表示该数为负，0反之
30~23位，一共8位是指数位(-128~127)
22~ 0位，一共23位是尾数位，尾数的编码一般是原码和补码
IEEE标准从逻辑上用三元组{S,E,M}表示一个数N,如下图所示：
n,s,e,m分别为N,S,E,M对应的实际数值,而N,S,E,M仅仅是一串二进制位。

其中，
S(sign)表示N的符号位。

对应值s满足：n>0时，s=0; n<0时，s=1。

E(exponent)表示N的指数位，位于S和M之间的若干位。

对应值e值也可正可负。

M(mantissa)表示N的尾数位，恰好，它位于N末尾。

M也叫有效数字位（sinificand）、系数位（coefficient）, 甚至被称作“小数”。

IEEE标准754规定了三种浮点数格式：单精度、双精度、扩展精度。

前两者正好对应C语言里头的float、double或者FORTRAN里头的real、double精度类型。

限于篇幅，本文仅介绍单精度、双精度浮点格式。

★单精度:N共32位，其中S占1位，E占8位，M占23位。

★双精度:N共64位，其中S占1位，E占11位，M占52位。

值得注意的是，M虽然是23位或者52位，但它们只是表示小数点之后的二进制位数，也就是说，假定 M为“010110011...”, 在二进制数值上其实是“.010110011...”。

而事实上，标准规定小数点左边还有一个隐含位，这个隐含位通常，哦不，应该说绝大多数情况下是1，那什么情况下是0呢？答案是N 对应的n非常小的时候，比如小于 2^(-126)(32位单精度浮点数)。

不要困惑怎么计算出来的，看到后面你就会明白。

总之，隐含位算是赚来了一位精度,于是M对应的m最后结果可能是"m=1.010110011...”或者“m=0.010110011...”
计算e、m
首先将提到令初学者头疼的“规格化(normalized)”、“非规格化(denormalized)”。

掌握它以后你会发现一切都很优雅,更美妙的是，规格化、
非规格化本身的概念几乎不怎么重要。

请牢记这句话：规格化与否全看指数E！
下面分三种情况讨论E，并分别计算e和m:
1、规格化：当E的二进制位不全为0,也不全为1时，N为规格化形式。

此时e被解释为表示偏置（biased）形式的整数,e值计算公式如下图所示：
上图中，|E|表示E的二进制序列表示的整数值,例如E为"10000100",则
|E|=132,e=132-127=5 。

k则表示E的位数，对单精度来说，k=8,则bias=127，对双精度来说，k=11,则bias=1023。

此时m的计算公式如下图所示：
标准规定此时小数点左侧的隐含位为1,那么m=|1.M|。

如M="101"，则
|1.M|=|1.101|=1.625,即 m=1.625
2、非规格化：当E的二进制位全部为0时，N为非规格化形式。

此时e，m 的计算都非常简单。

注意，此时小数点左侧的隐含位为0。

为什么e会等于(1-bias)而不
是(-bias)，这主要是为规格化数值、非规格化数值之间的平滑过渡设计的。

后文我们还会继续讨论。

有了非规格化形式，我们就可以表示0了。

把符号位S值1,其余所有位均
置0后，我们得到了 -0.0; 同理，把所有位均置0,则得到 +0.0。

非规格化数
还有其他用途，比如表示非常接近0的小数，而且这些小数均匀地接近0,称为“逐渐下溢(gradually unde rflow)”属性。

3、特殊数值：当E的二进制位全为1时为特殊数值。

此时，若M的二进制位全为0，则n表示无穷大，若S为1则为负无穷大，若S为0则为正无穷大; 若M的二进制位不全为0时，表示NaN(Not a Number)，表示这不是一个合法实数或无穷，或者该数未经初始化。

范例
仔细研读第四点后，再回忆一下文章开头计算n的公式，你应该写出一个浮点编码的实际值n了吧？还不能吗？不急，我先给你示范一下。

浮点数C0A00000H，二进制形式为( 1100 0000 1010 0000 ... 0000 0000)。

红色数字为E，可以看出|E|=129>0, 则e=129-bias=129-127=2 ；
蓝色数字为M, 且|E|>0，说明是规格化数，则m=|1.M|=|1.01000..000|=1.25 ; 由n的计算公式可以求得 n=(-1)^1 * 1.25 * 2^2 = - 5，结果被验证了。

e商务文档

位单精度浮点数的IEEE表示法

相关文档推荐：