前言
大家好,我是何小侠
大家可以叫我小何或者小侠
希望能通过写博客加深自己对于学习内容的理解
也能帮助更多人理解和学习

积学以储宝,酌理以富才— 出自《文心雕龙·神思》
解释:积累学识来储存珍宝,要斟酌辨析各种事理来丰富增长自己的才学。


    这篇博客将会详细介绍浮点数的存储,我们在很多教材上是学不到的,所以我们会对浮点数的存储产生好奇,今天我们就一起来学习。

    概览

    • 常见的浮点数
    • 引例
    • 引例答案✳️
    • 浮点数的存储规则
    • M与E的特别规定
      • 指数E从内存中取出还可以分成三种情况
    • 我们回到引例
    • 总结

    常见的浮点数

    例如:1.2233344
    又如:1E3
    1E3我们应该好好介绍一下:
    实际上就是我们初中物理中学习的科学计数法,
    就等于1 x 10^3 = 1000。
    还有一点规定,就是E前面的数字可以是小数,而E后面的数字只能是整数
    这与我们写物理题目是一个道理,毕竟我们从来没有都不会让小数成为
    10的指数。

    我所使用的编译器是VS2022,我们如果想知道我们编译器所规定的数据类型的最大值最小值可以查找两个头文件。

    1. limits.h是用来查看除浮点型以外的数据类型的。


    由于我们的重点是浮点数,就不一一展示了

    1. float.h就是用来查看编译器所设定的浮点数的最大值最小值的,但是在VS2022上很难查找到这个文件,所以我借助了everything这个很好用的查找文件的工具。

    我们已经学会了如何查看头文件,接下来我们再来看一个例子。

    引例

    int main(){ int n = 9; float *pFloat = (float *)&n; printf("n的值为:%d\n",n); printf("*pFloat的值为:%f\n",*pFloat); *pFloat = 9.0; printf("num的值为:%d\n",n); printf("*pFloat的值为:%f\n",*pFloat); return 0;}

    我们看看这行代码,再分析一下。
    下面是我的分析图,你也可以看看。

    • 我们先看上面部分

      我们 printf("n的值为:%d\n", n);
      这行代码是比较简单的,输出9,
      那么 printf("*pFloat的值为:%f\n", *pFloat);这一行就有点不确定了,我们知道如果以%d打印,那么我们要打印的数据在%d看来就是一个有有符号整型或者以%u打印,那么要打印的数据在%u看来就是一个无符号的整型。
      这里应该也是一样的,那么以%f来打印,是打印9.000000吗?我们暂时放一放看下半部分。

    • 下半部分

      我们知道*pfloat = 9.0会改变这两个变量里的数据,那么float *类型的是比较容易改变的,会被直接改变变成9.000000,但是int 类型的变量n呢?如果你不了解浮点数在内存中的存储,你确实很难知道为什么。
      我们先将答案给出来,大家带着答案一起去寻找为什么

    引例答案✳️


    这真的很奇怪是不是,第二行和第三行好像是完全没有道理。但是如果你仔细一想就应该能推提出一个假设浮点数的存储方式一定与整型不同。
    别急我们马上就来介绍。

    浮点数的存储规则

    我们想搞懂这个问题需要我们了解浮点数在内存中的存储方法
    放心不是很复杂,只要我们用点心。

    在C语言中,浮点数的存储方式遵循IEEE 754标准。具体来说,C语言中的浮点数类型(如float、double)使用二进制表示,并按照IEEE 754标准进行存储。

    IEEE 754规定:
    任何一个二进制浮点数N都可以表达成下面的方式:

    (-1) ^ S * M * 2 ^ E

    • 在这个式子中(-1) ^ S表示符号位,当S为0时,N为正数,当S为1时,N为负数。
    • M表示的是有效位数,大于1,小于2。
    • 2 ^ E表示指数位。

    这样你肯定也还是不明白,没关系我们举例就行。

    首先我们也还是需要复习一下我们的数学知识:

    我们更仔细的来看就是这样的:

    那么如果十进制是这样那么二进制呢?

    当然是差不多的,我们再来举个例子

    如果不是很懂可以看这副图
    如果你上面的图都能看懂那么下面的也就很简单了

    如果我们明白了这个道理,那么我们就直接试一试吧!尝试将9.0的S,M,E写出
    我们知道了方法就比较简单了,虽然刚开始可能不太熟练,见得多了也就会了。

    1. 首先我们看到是正数所以S=0

    2. 9.0转换为2进制1001.09的二进制。

    3.将1001.0用类似科学计数法的形式转换得到
    1.001 * 2 ^ 3,我们得到M=1.001 ,E = 3。
    这三步做好了就基本不会出错了。

    但是我们还要讲一个比较重要的概率,就是:
    既然小数位也是用2 ^ -1, 2 ^-2,·······2 ^ n 来逐渐趋近数据的小数点后的值
    那么3.14这个值呢?
    我们再用我们的方法试试是搞不出来的。
    下面是我用叫AI算的
    11.00100110...(无限循环,以省略号表示)
    0.14这样的数需要很多小数点后的1来表示,但是我们计算机只会保留部分,所以会导致精度丢失,但是没有办法,所以我们才会四舍五入。

    知道了这些知识我们再来看看到底计算机能存储多少有效的数位呢?
    IEEE 754规定:
    对于32位的浮点数,最高的1位是符号位s,接着的8位是指数E,
    剩下的23位为有效数字M。

    IEEE 754规定:
    对于64位的浮点数,最高的1位是符号位s,接着的11位是指数E,
    剩下的52位为有效数字M。

    由于52比特位实在是太长了,我就换了一下行,但是实际上是连起来的。

    M与E的特别规定

    1. M的相关规定

    在上面我们说过M的范围为[1, 2)。也就是说M最小也是1。
    IEEE 754规定,当计算机内部保存M的时候,会默认这个数第一位总是1,
    因此可以被舍去,只保存小数点后面部分。
    这样做的好处是,当省略掉一个比特位,那么就多出一个比特位用来增加精度。

    比如保存1.01的时 候,只保存01,等到读取的时候,再把第一位的1加上去。
    这样做的目的,是节省1位有效数字。
    以32位 浮点数为例,留给M只有23位, 将第一位的1舍去以后,等于可以保存24位有效数字。

    1. E的相关规定

    指数E的情况是比较复杂的。

    • 我们看到E有8位,并且这8位是无符号的,也就是说,E最大是1111 1111
      就是255,最小为0; 0 < = E < = 255(32比特位浮点数)。

    • 如果E为11位,它的取值范围为0~2047

    但是,我们知道,科学计数法中的E是可以出现负数的。

    那该怎么办?
    所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127;
    对于11位的E,这个中间数是1023。

    比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即1000 1001。

    我们来看两个例子:


    然后我们调试起来验证验证~

    代码也给出来

    int main(){float f = 5.5;//101.1// S = 0,M = 1.011,E=2//-1^(0) * 1.011 * 2^2//当要存储时E+127// SEM//0 10000001 01100000000000000000000//0100 0000 1011 0000 0000 0000 0000//40b0 00 00//由于是小端存储//00 00 0b 40return 0;}

    我们再换当E不加127时是负数的例子

    int main(){float f = 0.5;//0.1//S = 0, M = 1.0 E = -1//-1*(0) * 1 * 2^-1//E+127 = 126//0 01111110 0000000000000000000000//0011 1111 0000 0000 0000 0000//3f 00 00 00// 00 00 00 3freturn 0;}

    如果说把数据放进去需要根据是32位还是64位来决定放的是多大的E,
    那么取出来的时候是不是也有很多情况呢?

    确实是这样!

    指数E从内存中取出还可以分成三种情况

    1. E不全为0或不全为1

    这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),
    得到真实值,再将有效数字M前加上第一位的1。
    比如:
    0.5(1/2)的二进制形式为0.1,由于规定正数部分必须为1,
    即将小数点右移1位,则为1.0*2^(-1),其阶码为-1+127=126,
    表示为01111110,而尾数1.0去掉整数部分为0,
    补齐0到23位00000000000000000000000,则其二进制表示形式为:
    0 01111110 00000000000000000000000

    1. E全为0
      这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,
      有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。
      这样做是为了表示±0,以及接近于 0的很小的数字。

    为什么会被直接解析为0呢? 因为 2^-126次方已经非常小了,相当与趋近余0,地球离月球的距离约为2的28.8974次方,这样对比就知道2 ^-126 有多小了吧。

    1. E全为1

    这时,如果有效数字M全为0,
    表示±无穷大(正负取决于符号位s);

    为什么呢?
    我们知道E最大是1111 1111也就是255,
    255 - 127 也还有128。
    2^128次方是多大?
    是不是就相当于-+无穷!

    我们回到引例


    我们现在再来看第二行和第三行。

    1.第二行解析:


    2. 第三行解析

    就是这么奇妙!

    总结

    我们同过这篇博客系统的学习了,二进制与十进制在科学计数法上的不同,也了解的浮点数在内存中存储方式,和注意的要点,并且我们最后也帮大家解答了最开始的题目

    最后如果这篇博客有帮助到你,欢迎点赞关注加收藏


    如果本文有任何错误或者有疑点欢迎在评论区评论