c++浮点数存储方式
答案:3 悬赏:0 手机版
解决时间 2021-02-28 06:14
- 提问者网友:人生佛魔见
- 2021-02-27 11:20
c++浮点数存储方式
最佳答案
- 五星知识达人网友:第幾種人
- 2021-02-27 12:48
根据国际标准IEEE 754,任意一个二进制浮点数V可以表示成下面的形式:
V = (-1)^s×M×2^E
(1)(-1)^s表示符号位,当s=0,V为正数;当s=1,V为负数。
(2)M表示有效数字,大于等于1,小于2。
(3)2^E表示指数位。
IEEE关于浮点数的定义标准了,0.0f是一个特殊的数,阶码和尾数全为0来表示浮点的0,这是规定.
举例来说,
十进制的5.0,写成二进制是101.0,相当于1.01×2^2。那么,按照上面V的格式,可以得出s=0,M=1.01,E=2。
十进制的-5.0,写成二进制是-101.0,相当于-1.01×2^2。那么,s=1,M=1.01,E=2。
V = (-1)^s×M×2^E
(1)(-1)^s表示符号位,当s=0,V为正数;当s=1,V为负数。
(2)M表示有效数字,大于等于1,小于2。
(3)2^E表示指数位。
IEEE关于浮点数的定义标准了,0.0f是一个特殊的数,阶码和尾数全为0来表示浮点的0,这是规定.
举例来说,
十进制的5.0,写成二进制是101.0,相当于1.01×2^2。那么,按照上面V的格式,可以得出s=0,M=1.01,E=2。
十进制的-5.0,写成二进制是-101.0,相当于-1.01×2^2。那么,s=1,M=1.01,E=2。
全部回答
- 1楼网友:洒脱疯子
- 2021-02-27 14:36
上面的回答很好。浮点数的存储国际标准的。
- 2楼网友:洎扰庸人
- 2021-02-27 14:00
月初还在上班的时候,就天天盼望着过年放长假,然而终于熬到了过年,却发现自己的12天的长假将在碌碌无为中度过,朋友们又一个接一个的远去,心里真是拔凉拔凉的啊!最近版上的人气有点低落,连违规率(不敢说犯罪率哈,怕被人砍)都下降了不少,我想在春节这档子这是免不了的,论坛上应该有不上工作的朋友可能都回家团聚了。那像我这种无家可归的人除了眼馋别人的幸福,那就只有向仍然全力支持着我们C++/面向对象这个大家庭的兄弟姐妹们拜个年,祝来年薪水猛涨,职位高升,身体健康,家庭幸福!
最近一段时间看到版上关于C++里浮点变量精度的讨论比较多,那么我就给对这个问题有疑惑的人详细的讲解一下intel的处理器上是如何处理浮点数的。为了能更方便的讲解,我在这里只以float型为例,从存储结构和算法上来讲,double和float是一样的,不一样的地方仅仅是float是32位的,double是64位的,所以double能存储更高的精度。还要说的一点是文章和程序一样,兼容性是有一定范围的,所以你想要完全读懂本文,你最好对二进制、十进制、十六进制的转换有比较深入的了解,了解数据在内存中的存储结构,并且会使用VC.net编译简单的控制台程序。OK,下面我们开始。
大家都知道任何数据在内存中都是以二进制(1或着0)顺序存储的,每一个1或着0被称为1位,而在x86CPU上一个字节是8位。比如一个16位(2字节)的short int型变量的值是1156,那么它的二进制表达就是:00000100 10000100。由于Intel CPU的架构是Little Endian(请参数机算机原理相关知识),所以它是按字节倒序存储的,那么就因该是这样:10000100 00000100,这就是定点数1156在内存中的结构。
那么浮点数是如何存储的呢?目前已知的所有的C/C++编译器都是按照IEEE(国际电子电器工程师协会)制定的IEEE 浮点数表示法来进行运算的。这种结构是一种科学表示法,用符号(正或负)、指数和尾数来表示,底数被确定为2,也就是说是把一个浮点数表示为尾数乘以2的指数次方再加上符号。下面来看一下具体的float的规格:
float
共计32位,折合4字节
由最高到最低位分别是第31、30、29、……、0位
31位是符号位,1表示该数为负,0反之。
30-23位,一共8位是指数位。
22-0位,一共23位是尾数位。
每8位分为一组,分成4组,分别是A组、B组、C组、D组。
每一组是一个字节,在内存中逆序存储,即:DCBA
我们先不考虑逆序存储的问题,因为那样会把读者彻底搞晕,所以我先按照顺序的来讲,最后再把他们翻过来就行了。
现在让我们按照IEEE浮点数表示法,一步步的将float型浮点数12345.0f转换为十六进制代码。在处理这种不带小数的浮点数时,直接将整数部转化为二进制表示:1 32位的表示方法
1位表示符号位,8位表示指数位用移码表示(+127,据说硬件容易设计),23位表示尾数位(一般用原码表示)
计算机是用科学计数法表示浮点数的
浮点数的规格化表示: 如: 1.1可以表示为 1.1*2+0(规格化表示,第一位默认为1) ,11*2-1 ,0.11*2-1
由于第一位默认为1,所以可以不用保存,这样就多了一位精度23+1=24,所以可以表示为2^24代表8位精度
由此可以算出来最大规格数==1.1(23个1)*2+127 最小规格数==1*2-126
指数全1
a.如果尾数为0,根据符号为可以表示为+-无穷大 比如运算结果超过所能表达的最大数
b.尾数不为0,代表NAN(NOT A NUMBER)比如0/0的结果
ieee还规定了非规格化数即指数为0
a.尾数不为0 ,则可以算出最小的非规格化浮点数==2的-149(126+23)次方
b.尾数为0代表0
最近一段时间看到版上关于C++里浮点变量精度的讨论比较多,那么我就给对这个问题有疑惑的人详细的讲解一下intel的处理器上是如何处理浮点数的。为了能更方便的讲解,我在这里只以float型为例,从存储结构和算法上来讲,double和float是一样的,不一样的地方仅仅是float是32位的,double是64位的,所以double能存储更高的精度。还要说的一点是文章和程序一样,兼容性是有一定范围的,所以你想要完全读懂本文,你最好对二进制、十进制、十六进制的转换有比较深入的了解,了解数据在内存中的存储结构,并且会使用VC.net编译简单的控制台程序。OK,下面我们开始。
大家都知道任何数据在内存中都是以二进制(1或着0)顺序存储的,每一个1或着0被称为1位,而在x86CPU上一个字节是8位。比如一个16位(2字节)的short int型变量的值是1156,那么它的二进制表达就是:00000100 10000100。由于Intel CPU的架构是Little Endian(请参数机算机原理相关知识),所以它是按字节倒序存储的,那么就因该是这样:10000100 00000100,这就是定点数1156在内存中的结构。
那么浮点数是如何存储的呢?目前已知的所有的C/C++编译器都是按照IEEE(国际电子电器工程师协会)制定的IEEE 浮点数表示法来进行运算的。这种结构是一种科学表示法,用符号(正或负)、指数和尾数来表示,底数被确定为2,也就是说是把一个浮点数表示为尾数乘以2的指数次方再加上符号。下面来看一下具体的float的规格:
float
共计32位,折合4字节
由最高到最低位分别是第31、30、29、……、0位
31位是符号位,1表示该数为负,0反之。
30-23位,一共8位是指数位。
22-0位,一共23位是尾数位。
每8位分为一组,分成4组,分别是A组、B组、C组、D组。
每一组是一个字节,在内存中逆序存储,即:DCBA
我们先不考虑逆序存储的问题,因为那样会把读者彻底搞晕,所以我先按照顺序的来讲,最后再把他们翻过来就行了。
现在让我们按照IEEE浮点数表示法,一步步的将float型浮点数12345.0f转换为十六进制代码。在处理这种不带小数的浮点数时,直接将整数部转化为二进制表示:1 32位的表示方法
1位表示符号位,8位表示指数位用移码表示(+127,据说硬件容易设计),23位表示尾数位(一般用原码表示)
计算机是用科学计数法表示浮点数的
浮点数的规格化表示: 如: 1.1可以表示为 1.1*2+0(规格化表示,第一位默认为1) ,11*2-1 ,0.11*2-1
由于第一位默认为1,所以可以不用保存,这样就多了一位精度23+1=24,所以可以表示为2^24代表8位精度
由此可以算出来最大规格数==1.1(23个1)*2+127 最小规格数==1*2-126
指数全1
a.如果尾数为0,根据符号为可以表示为+-无穷大 比如运算结果超过所能表达的最大数
b.尾数不为0,代表NAN(NOT A NUMBER)比如0/0的结果
ieee还规定了非规格化数即指数为0
a.尾数不为0 ,则可以算出最小的非规格化浮点数==2的-149(126+23)次方
b.尾数为0代表0
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯