开发者

C#中32位浮点数Float(Real)一步步按位Bit进行分析

开发者 https://www.devze.com 2022-12-01 13:53 出处:网络 作者: 斯内科
目录C#代码示例如下程序运行结果关于32位浮点数的一些理解1、定点的缺点2、对于定点123.6253、翻译一下4、定点转浮点实例:123.625用32位浮点表示5、验证6、浮点转定点实例我们都知道单精...
目录
  • C#代码示例如下
  • 程序运行结果
  • 关于32位浮点数的一些理解
    • 1、定点的缺点
    • 2、对于定点123.625
    • 3、翻译一下
    • 4、定点转浮点实例:123.625用32位浮点表示
    • 5、验证
    • 6、浮点转定点实例

我们都知道单精度浮点数(Single,float,Real)由32位0或1组成,它具体是如何来的。

浮点数的32位N=1符号位(Sign)+8指数位(Exponent)+23尾数部分(Mantissa)

  • 符号位(Sign) : 0代表正,1代表为负【占1位】
  • 指数位(Exponent)::用于存储科学计数法中的指数数据,并且采用移位存储【占8位】
  • 尾数部分(Mantissa):尾数部分【占23位】
  • 单精度float:N共32位,其中S占1位,E占8位,M占23位。因此小数点后最多精确到23/4=6位 。

C#代码示例如下

using System;
using System.Collections.Generic;
using System.Linq;
namespace ConverterAndPrecisionDemo
{
  class Program
  {
    static void Main(string[] args)
    {
      //参考博客:https://blog.csdn.net/zhengyanan815/article/details/78550073
      //小数点后面:4个位占用一个数字【十进制9就是1001】
      //符号位(Sign) : 0代表正,1代表为负【占1位】
      //指数位(Exponent):用于存储科学计数法中的指数数据,并且采用移位存储【占8位】
      //尾数部分(Mantissa):尾数部分【占23位】
      //单精度float:N共32位,其中S占1位,E占8位,M占23位。因此小数点后最多精确到23/4=6位
      //双精度double:N共32位,其中S占1位,E占11位,M占52位。因此小数点后最多精确到52/4=13位
      //十进制小数的二进制表示:【法则--整数部分:除基取余,逆序拼接。小数部分:乘基取整,顺序拼接】
      //整数部分:除以2,取出余数,商继续除以2,直到得到0为止,将取出的余数逆序。可以使用栈Stack
      //小数部分:乘以2,然后取出整数部分,将剩下的小数部分继续乘以2,然后再取整数部分,一直取到小数部分为零为止。如果永远不为零,则按要求保留足够位数的小数,最后一位做0舍1入。将取出的整数顺序排列。可以使用队列Queue
      float f = 123456.8125F;
      byte[] 开发者_Python开发buffer = BitConverter.GejavascripttBytes(f);
      Console.WriteLine("打印浮点数对应的4个字节:");
      Console.WriteLine(string.Join(",", buffer));
      Console.WriteLine($"【使用函数】{123456}对应的二进制:{ Convert.ToString(123456, 2)}");
      int num = 123456;
      Stack<int> stack = new Stack<int>();
      while (num != 0)
      {
        int cur = num % 2;
        stack.Push(cur);
        num = num / 2;
      }
      Console.WriteLine($"【使用堆栈】{123456}对应的二进制:{ string.Join("", stack)}");
      int scale = 10;
      int index = 0;
      double d = 0.8125;
      Queue<int> queue = new Queue<int>();
      while (index < scale)
      {
        int cur = (int)(d * 2);
        queue.Enqueue(cur);
        d = d * 2 - cu编程客栈r;
        if (d == 0)
        {
          break;
        }
        index++;
      }
      Console.WriteLine($"{0.8125}对应的二进制:{ string.Join("", queue)}");
      string binaryDisplay = string.Join("", stack) + "." + string.Join("", queue);
      Console.WriteLine($"{123456.8125}对应的二进制为{binaryDisplay}");
      int dotIndex = binaryDisplay.IndexOf('.');
      //移除小数点后将小数点插入索引1的位置【即:小数点移动到索引1的位置】
      string scienceDisplay = binaryDisplay.Remove(dotIndex, 1).Insert(1, ".");
      Console.WriteLine($"小数{123456.8125}对应的二进制科学计数为{scienceDisplay}(2的{dotIndex - 1}次方)");
      string sign = (f > 0 ? "0" : "1");//符号位占用1位
      Console.WriteLine($"符号位S:正数为0,负数为1。符号位是:{sign}");
      string exponent = Convert.ToString(127 + (dotIndex - 1), 2).PadLeft(8, '0');//指数位占用8位
      Console.WriteLine($"指数位E:123456最python高位为2的{dotIndex - 1}次方,指数为{dotIndex - 1},因此指数位E的十进制值为【127+{dotIndex - 1}={127 + dotIndex - 1}】");
      //尾数部分:去除scienceDisplay开始的"1.",也就是字符串从索引2开始。并凑够23位
      string mantissa = scienceDisplay.Substring(2).PadRight(23, '0');//尾数位占用23位
      Console.WriteLine($"尾数位M:尾数部分M需要凑够23位。为【{mantissa}】");
      string joinBits = sign + exponent + mantissa;//符号位占用1位+指数位占用8位+尾数位占用23位=32位
      byte[] bufferJoin = new bZwCLmnyte[4];
      for (int i = 0; i < 4; i++)
      {
        bufferJoin[i] = Convert.ToByte(joinBits.Substring(8 * i, 8), 2);
      }
      Console.WriteLine("重新拼接形成的32位浮点数,对应的4个字节为:");
      Console.WriteLine(string.Join(",", bufferJoin));
      byte[] reverseBuffer = bufferJoin.Reverse().ToArray();
      Console.WriteLine("反转数组bufferJoin的顺序:重新打印我们会发现与浮点数原始的字节完全一致。注意:C#是低字节在前");
      Console.WriteLine(string.Join(",", reverseBuffer));
      Console.ReadLine();
    }
  }
}

程序运行结果

C#中32位浮点数Float(Real)一步步按位Bit进行分析

关于32位浮点数的一些理解

1、定点的缺点

对于一个系统可能出现一些特别大的数和特别小的数,如果用定点表示就会很僵硬,位数一定就不能同时表达特别大的数和特别小的数。

2、对于定点123.625

用科学计数法的方式可以写成1.23625*10^2,也可以写成12.625*10^1或1.111011101*2^6。。。。。为了规范,IEEE就规定了32位浮点的格式如下

C#中32位浮点数Float(Real)一步步按位Bit进行分析

3、翻译一下

(1)最高位是符号位,“0”代表正,“1”代表负。

(2)接下来的8位是指数位,8位可表示整数的范围是0-255,考虑指数可以是负的,IEEE规定在上面的范围减去127,并将-127(全0)和128(全1)用做特殊值处理,所以指数的位的范围是(-127,128)。

(3)最低的23位是小数位(尾数位),正常是可以表示23位的范围,但是IEEE规定小数点左侧必须为1,右侧位数不够补0。这样可以就可以省略1,可以用23位来表示24位。

eg. 1.111011101*2^6中,小数位是111011101+补14个0

4、定点转浮点实例:123.625用32位浮点表示

科学计数法=1.111011101*26(整数部分:123=01111011b,小数部分:0.625=0.101b,整数部分除2取余,倒序排列,高位补零;小数部分乘2取整,顺序排ZwCLmn列)

符号位:0

指数位:6+127=10000101

小数位:11101110100000000000000

即:01000010111101110100000000000000=0x42F74000

5、验证

C#中32位浮点数Float(Real)一步步按位Bit进行分析

6、浮点转定点实例

42F74000=01000010111101110100000000000000,拆分为符号位、指数位、小数位。

(1)符号位:0

(2)指数位:10000101=133,实际指数=133-127=6

(3)小数位:11101110100000000000000去掉后面的0、前面补1为1. 111011101

即科学计数法表示为1. 111011101*26=(2^0+2^-1+2^-2+2^-3+2^-5+2^-6+2^-7+2^-9)*2^6=123.625。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。 

0

精彩评论

暂无评论...
验证码 换一张
取 消