关于二进制表示和补码计算的来龙去脉,入门看了秒懂-凡亿教育课堂

凡亿教育-雯雯

凡事用心，一起进步

打开APP

公司名片



凡亿专栏 | 关于二进制表示和补码计算的来龙去脉,入门看了秒懂

 

关于二进制表示和补码计算的来龙去脉,入门看了秒懂



IOT物联网小镇

2023-08-24 14:45:10  1016

关注

一、前言
二、从十进制到二进制

1. 十进制
2. 二进制
3. 十六进制
4. 任意进制

三、从十进制加法到二进制加法

1. 十进制加法
2. 二进制加法
3. 十六进制加法

四、把负数计算转换成正数计算

1. 原码
2. 把负数计算变成正数计算
3. 新问题：如何表示0？
4. 补码的计算：同余定理

五、总结

一、前言

计算机最喜欢的数字就是 0 和 1，在 CPU 的世界中，它只认识这两个数字，即使是强大的操作系统，也都是由 0 和 1 组成的。

作为一名软件开发者，入门学习的内容可能就是认识这 2 个既简单、又强大的数字。但是大部分人，对于二进制、二进制计算、原码、反码以及补码的认识，仍处于机械的强制记忆阶段。尤其是对一些编码和计算，仍然处于模糊的认识阶段，例如：

CPU 是如何表示负数的？
为什么补码可以用来表示负数？
一个 8 位的二进制数，最小值为什么是 -128，而不是 -127？
CPU 中的加法器，为什么可以连同符号位一起运算？

这篇文章我们就来聊聊这个最最基础的内容，帮助你来理解二进制计算的相关内容，看完这篇文章之后，不仅知其然，更能知其所以然！

PS: 这里有点高调了，最终的所以然部分，应该涉及到数学证明这一层次了，本文并不会涉及到求证过程。

二、从十进制到二进制 1. 十进制

作为数学计算能力强大的中国，10 以内的加减法，应该是在幼儿园阶段就完成了。如果你不属于这个范围，说明你上的是假幼儿园。

我们来快速复习一下关于十进制运算的一些基本知识:

每一个数位上包括的数字为 0 到 9；
每一个数位上的数，是它右侧数位的 10 倍；
两个数相加时，相同数位上的数相加之和如果大于等于 10，就向前进 1 位，即：满十进一；

具体来看就是：

从右数第一个位数(个位)上的数字代表多少个 1；
从右数第二个位数(十位)上的数字代表多少个 10；
从右数第三个位数(百位)上的数字代表多少个 100；
从右数第四个位数(千位)上的数字代表多少个 1000；

十进制的数，可以使用后缀字母 D 来表示，也可以省略。例如：十进制的 1234 这个数字，个位上的数是 4，十位上的数是 3，百位上的数是 2，千位上的数是 1（一般是从最右侧的个位说起），每一个数位上的数比它右侧大十倍。如下图：

十进制数据，也称作基于十的表示法。

2. 二进制

那么对于二进制呢？直接套用上面十进制的概念，然后把 10 换成 2 即可(目前先忽略符号位)：

每一个数位上包括的数字为 0 和 1；
每一个数位上的数，是它右侧数位的 2 倍；
两个数相加时，相同数位上的数相加之和如果大于等于 2，就向前进 1 位，即：满二进一；

具体来看就是：

从右数第一个位数上的数字代表多少个 1；
从右数第二个位数上的数字代表多少个 2；
从右数第三个位数上的数字代表多少个 4；
从右数第四个位数上的数字代表多少个 8；

记住几个重点：二进制数中只包含 0 和 1 两个数字，在相加时满二进一。

在十进制中，每一个数位我们给它进行了专门的命名(个位、十位、百位...)，但是二进制没有类似的命名。

二进制的数，使用后缀字母 B 来表示，例如：二进制的 1111B 这个数字，用图来表示权重如下：

换算成十进制数就是 15(1 * 8 + 1 * 4 + 1 * 2 + 1 * 1 = 15)。

在二进制中，每一位称为一个比特(bit)，如果用 8 个 bit 来表示一个二进制数，最小值是 0000_00000，最大值是 1111_1111；

如果用 16 个 bit 来表示一个二进制数，最小值是 0000_0000_0000_0000，最大值是 1111_1111_1111_1111。(为了便于观察，每 4 个 bit 之间，加上了分隔符)

在早期的计算机中，8 位的处理器很常见，于是就给它一个专门的名字：字节(Byte)。16 位的二进制数就是 2 个字节，也称作：字(Word)。

3. 扩展到十六进制

原理还是相同的：直接把十进制中的 10 换成 16 即可：

每一个数位上包括的数字为 0 到 9，A 到 F；
每一个数位上的数，是它右侧数位的 16 倍；
两个数相加时，相同数位上的数相加之和如果大于等于 16，就向前进 1 位，即：满十六进一；

具体来看就是：

从右数第一个位数上的数字代表多少个 1；
从右数第二个位数上的数字代表多少个 16；
从右数第三个位数上的数字代表多少个 256；
从右数第四个位数上的数字代表多少个 4096；

在十六进制中，需要十六个数字来表示 0 到 15 这些数字，0 到 9 比较好处理，但是从 10 到 15，我们就需要找一些记号来表示，于是人们就想到用 A,B,C,D,E,F 这几个字母来分别表示 10 到 15 这个 6 个数字。

十六进制数据，使用后缀字母 H 来表示，有些场合也可以使用前缀 0x 来表示，本质上没有区别。例如：十六进制数字 1A2BH（或者写作 0x1A2B），每一个数位上的权重如图：

换算成十进制数就是 6699(1 * 4096 + 10 * 256 + 2 * 16 + 11 * 1 = 6699)。

4. 扩展到任意进制

原理仍然相同：直接把十进制中的 10 换成目标进制，例如 5 进制：

每一个数位上包括的数字为 0 到 4；
每一个数位上的数，是它右侧数位的 5 倍；
两个数相加时，相同数位上的数相加之和如果大于等于 5，就向前进 1 位，即：满五进一；

具体来看就是：

从右数第一个位数上的数字代表多少个 1；
从右数第二个位数上的数字代表多少个 5；
从右数第三个位数上的数字代表多少个 25；
从右数第四个位数上的数字代表多少个 125；

再看一个图加深印象：

三、从十进制加法到二进制加法 1. 十进制加法

这个就不必多说了，规则只有 2 条：

两个数，相同数位上的数字进行相加；
每一个数位上的相加结果，满十进一；

例如：

个位上：4 + 8，结果是 12，但是十进制中没有 12 这个数字，因此向左侧的高位进1，个位就剩下：12 - 10 = 2。

十位上：7 + 2，再加上进位 1，结果是 10，但是十进制中没有 10 这个数字，因此向左侧的高位进1，十位变成：10 - 10 = 0。

百位上：1 加上进位 1，结果是 2。

2. 二进制加法

第 0 位：0 + 0 结果为 0；

第 1 位：1 + 0 结果为 1；

第 2 位：1 + 1 结果为 2，但是二进制中没有 2 这个数字，因此需要向左侧的高位进 1，于是第 2 位上就剩下 2 - 2 = 0。

第 3 位：1 + 1 等于 2，再加上进位 1，结果就是 3，但是二进制中没有 3 这个数字，因此需要向左侧的高位进 1，于是第 3 位上就剩下 3 - 2 = 1。

第 4，5，6，7位计算均是如此。

3. 十六进制加法

第 0 位：E + C，结果为 26，但是十六进制中没有 26 这个数字，因此需要向左侧的高位进 1，于是第 0 位就剩下 26 - 16 = A。

第 1 位：A + 1 等于 B，再加上进位 1，结果就是 C，十六机制中有这个数字。

四、把负数计算转换成正数计算 1. 原码

原码(true form)是一种计算机中对数字的二进制定点表示方法。原码表示法在数值前面增加了一位符号位（即最高位为符号位）：正数该位为0，负数该位为1（0有两种表示：+0和-0），其余位表示数值的大小。

例如，用 8 个 bit (8 位二进制数)来表示一个数，+11 的原码为 0000_1011，-11 的原码就是 1000_1011。

2. 把负数计算变成正数计算

我们都知道，CPU 中有加法器，好像从来没有听说过“减法器”。例如计算 5 + 8，转换成二进制来计算：

再来计算一下减法：5 - 8，对于 CPU 来说，只会计算 5 + 8，但是不会计算 5 - 8。

但是可以转换一下思路，把减法变成加法 5 + (-8)，这样不就可以计算了吗？于是计算机先驱者就发明了反码：

正数的反码：保持原码不变；
负数的反码：原码中符号位不变，其余全部取反(-8 的原码是 1000_1000，反码就是：1111_0111)；

于是 5 + (-8)的计算过程就是：

此时，就完美解决了减法问题，那么乘法(多加几次)、除法(多减几次)问题也就跟着解决了。至于如何从数学的角度来证明，那就要问那些数学家了！

3. 新问题：如何表示0？

我们现在可以小结一下反码的表示范围(记住：第一位是符号位)：

正数的表示范围：0000_0000 ~ 0111_1111，也就是十进制的 +0 ~ +127 这 128 个数；
负数的表示范围：1000_0000 ~ 1111_1111，也就是十进制的 -127 ~ -0 这 128 个数；

有没有发现问题：怎么存在 +0 和 -0 这两个数？而且他们的编码还不一样：+0 对应 0000_0000，-0 对应 1111_1111。

CPU 虽然就是一个傻瓜，让它干啥就干啥，但是 CPU 最不能容忍的就是不确定性！我们都知道 +0 == -0 == 0，它们是同一个数字，但是在二进制编码中，居然有两个编码来表示同一个数。

伟大的计算机先驱者又做了这样一个决定：正数保持不变，负数整体减 1。

也就是说：符号位不变，值整体加1，如下：

这样就成功解决了 -0、+0 的问题！

现在一个 8 位的二进制就可以表示的范围是：-128 ~ 127，并且中间没有任何重复、遗漏的数字。

既然每一个二进制表示的值发生了变化，那么继续称之为反码就不准确了，此时给它们一个新的称呼：补码，也就是说：上图就变成了这样：

小结一下补码的定义：

正数的补码：保持原码不变；
负数的补码：原码中符号位不变，其余先全部取反，然后再加1(例如：-8 的原码是 1000_1000，补码就是 1111_1000)；

此时，我们仅仅是解决了二级制编码的表示问题，那么：补码能直接参与运算吗？运算结果会出现什么问题？

4. 补码的计算

我们先看一下这个问题：假设现在时间是 1 点整，但是你的手表进水了，它显示的是 3 点整，现在你怎么把时间调整到 1 点的位置？

方法1：把时针逆时针拨动 2 个小时(3 - 2 = 1)；

方法2：把时针顺时针拨动 9 个小时到 12 点，然后再拨动 1 个小时(3 + 10 = 1)；

对于时钟表盘来说，每 12 个小时为一圈，可以认为：-2 == 10，-1 = 11， -3 = 9，同样的：-2 == 10， -2 == 22， -2 == 34，...

可以看到规律是：-2、10、22、34 这些数字对 12 取模都得到同一个数(取正数)，在数学上，两个整数除以“同一个整数”，若得相同余数，则这两个整数同余。

表盘中的 12 就是这个“同一个整数”，可以看到这是一个可“溢出”的系统，-2、10、22、34 这几个数在表盘上表示的是一样的数，所以说这几个整数同余。

也就是说：在计算的时候，可以用 10、22、34 这几个数字来替换 -2，替换之后的计算结果是相同的。

那么对于一个 8 位的二进制数来说，最多只有 8 位，在计算过程中，如果最高位产生了进位，就会被丢弃，所以它也是一个可“溢出”的系统。那么这里的“同一个整数”是多少呢？

从前面的内容中可以看到，使用补码表示的 8 位二进制数表示的范围是 -128 ~ 127，一共是 256 个数，所以如果对 256 取模，得到相同的余数，那么这些数就是同余数。

例如：-2 和 254 对 256 取模，得到相同的余数，因此它俩就是同余数，那么在计算的时候，就可以用 254 来代替 -2。

那么我们通过计算 3 + (-2) 来验证一下。

(1) 利用同余数来计算

3 + (-2) == 3 + 254 = 257

257 超过了最大的表示范围，所以溢出，结果就是 257 对 256 取模，结果为 1。

(2) 直接用补码来计算

3 的补码是 0000_0011，-2 的补码是 1111_1110，在计算的时候，把符号位也参与运算：

结果也是 1，也就是说：

在二进制计算中，使用补码来计算，“天然”就满足了“同余定理”。

细心的读者可能已经发现了：-2 的二进制补码表示，与 254 的二进制自然表示，它们的形式是一样的！

这种“天然”性，是巧合？还是计算机前辈的设计结果？！

五、总结

这篇文章，我们探讨了计算机系统的软件基石：二进制系统，主要的目的是帮助你理解二进制的表示、计算方式。

登录查看更多内容

二进制补码计算

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表凡亿课堂立场。文章及其配图仅供工程师学习之用，如有内容图片侵权或者其他问题，请联系本站作侵删。