加载中...

05.Float Arithmetic

发表于2025-01-19|计算机组织与结构

|总字数:970|阅读时长:2分钟|浏览量:

溢出

阶值上溢
- 正阶值超过可能的最大允许阶值 11111110 (127)
- 标记为 ±∞
阶值下溢
- 负阶值小于可能的最小允许阶值 00000001 (-126)
- 报告为0
有效值上溢 (右规)
- 同符号的两个有效值相加可能导致最高有效位的进位
- 通过重新对齐来修补
有效值下溢 (右规)
- 在有效值对齐过程中, 可能有数字被移出右端最低位而丢失
- 需要某种形式的四舍五入

IEEE754标准规定的五种异常

无效运算 (结果为NaN)
- 运算时有一个数是非有限数, 如 : ±∞, ±∞/±∞, 0*±∞等
- 结果无效, 如 : 0/0, 源操作数为NaN, 一个数对0取余等
有限数除以0 (结果为±∞)
数太大 (阶上溢, 结果为±∞)
- 如 : 对于单精度, 阶码 > 1111 1110 (127)
数太小 (阶下溢, 结果用非规格化数表示)
- 如 : 对于单精度, 阶码 < 0000 0001 (-126)
- IEEE754出现前阶下溢一般为0, 换言之, IEEE754解决了这一问题
结果不精确 (舍入时引起)
- 如 : 1/3不能精确表示为一个浮点数

加法和减法

必须确保两个操作数具有相同的指数值(阶)
计算步骤
- 检查0: X是否等于0? Y是否等于0?
- 对齐有效值: 阶码向大值对齐
- 加或减有效值: X_S ± Y_S (原码加减法)
- 规格化结果

原码加法操作

尾数加法示例

我的理解是：

流程图

示例

我的理解是

上述两处 我的理解 总结: 尾数求补码时, 前面隐藏的那个数也要包括在取反加一的步骤中, 运算结果根据是否进位来判断是否要取结果的补码

乘法和除法

计算步骤
- 检查0: X是否等于0? Y是否等于0?
- 阶码相加减**(注意移码bias)**
- 尾数相乘除
- 规格化结果
  - 同上

乘法操作

无论哪个操作数是0, 乘积即为0
从阶值的和中减去一个偏移量
有效值相乘
结果的规格化和舍入处理
- 规格化可能导致阶值下溢
- IEEE754标准中, 只有右规
  - 高两位为01则无需处理
  - 高两位为10或11则右规一位
示例

除法操作

检查0
- 如果除数为0, 则报告出错, 或将结果设为无穷大
- 如果被除数为0, 则结果是0
被除数的阶值减除数的阶值, 加上一个偏移量
有效值相除
结果规格化和舍入处理
- 规格化可能导致阶值下溢
- IEEE754标准中, 只有左规
  - 高两位为01则左规一位
  - 高两位为10或11则无需处理
示例

精度考虑

附加位

寄存器的长度几乎总是大于有效值位长与一个隐含位之和
寄存器包含的这些附加位, 也称为保护位
保护为用0填充, 用于扩充有效值的右端

IEEE754规定: 中间结果须在右边加2个附加位
- 保护位(Guard) : 在尾数右边的位, 左规时被移到尾数中
- 舍入位(Round) : 在保护位右边的位, 作为舍入的依据

舍入

对有效值操作的结果通常保存在"更长"的寄存器中
当结果转换回浮点格式时, 必须要去掉多余的位
就近舍入(默认方式) : 结果被舍入成最近的可表示的数
- 非中间值: 0舍1入
- 中间值: 强制结果为偶数
朝+∞舍入 : 结果朝正无穷大方向向上舍入, 舍入为 Z₁
朝-∞舍入 : 结果朝负无穷大方向向下舍入, 舍入为 Z_-1
朝0舍入 : 结果朝0舍入, 正数 Z_-1, 负数 Z₁

数据类型

舍入示例

IEEE754并不完美

相关推荐

01.Introduction

组织与结构组织: 对编程人员不可见操作单元及其相互连接包括: 控制信号, 存储技术… 例如: 实现乘法是通过硬件单元还是重复加法? 结构: 对编程人员可见直接影响程序逻辑执行的属性包括: 指令集, 表示数据类型的位数… 例如: 是否有乘法指令? ISA Instruction Set Architecture(ISA), 指令集体系结构 ISA是一种规约, 它规定了如何使用硬件 ISA在通用计算机系统是必不可少的一个抽象层不同ISA规定的指令集不同计算机组成必须能够实现ISA规定的功能同一种ISA可以有不同的计算机组成计算机性能计算机的关键参数之一性能, 成本, 尺寸, 安全性, 可靠性, 能耗… 性能评价标准 CPU: 速度存储器: 速度, 容量 I/O: 速度, 容量 … 计算机设计的主要目标是: 提高CPU性能 CPU性能系统时钟时钟频率(单位: Hz): 计算机在单位时间内执行最基本操作的次数时钟周期(单位: s):...

02.A Top-Level View of Computer Function and Interconnection

哈佛结构与冯诺依曼模型哈佛结构将程序指令存储和数据存储分开程序指令和数据指令分开组织和存储的，执行时可以预先读取下一条指令成本高冯诺依曼模型最重要的思想 “存储程序” 使用同一个存储器同时存指令和数据，经由同一个总线传输这种指令和数据共享同一总线的结构，使得信息流的传输成为限制计算机性能的瓶颈，影响了数据处理速度的提高区别二者的区别就是程序空间和数据空间是否是一体的举一个最简单的对存储器进行读写操作的指令，指令1至指令3均为存、取数指令，对冯·诺依曼结构处理器，由于取指令和存取数据要从同一个存储空间存取，经由同一总线传输，因而它们无法重叠执行，只有一个完成后再进行下一个; 如果采用哈佛结构处理以上同样的3条存取数指令，由于取指令和存取数据分别经由不同的存储空间和不同的总线，使得各条指令可以重叠执行，这样，也就克服了数据流传输的瓶颈，提高了运算速度图灵机图灵机计算 4 + 3 例: 连续4个1代表数字 4, 连续3个1代表数字 3 1 R q1 1: 将数值改为 1 R:...

03.Integer, Floating-point and Decimal Representation

信息的二进制编码什么是信息? Infotmation is a message that is previously uncertain to receivers 怎么表示信息? Codebook (Dictionary) 怎么度量信息? 朴素的做法: 度量码长前提: 没有歧义表达 (如: A-0 B-1 C-10 若要表达10, 既有BA又有C,发生歧义) 累加上(每个字符出现的概率 * 该字符所拥有的比特数) 三个公设 Monotonicity in event probability: 事件所发生的概率作为度量的标准 Additivity: 两个独立事件发生概率可加 Continuity 自信息量: I(xi) = -log2p(xi) 一个系统的信息熵在冯诺依曼结构中, 所有信息 (代码和数据) 都采用二进制编码编码:...

04.Integer Arithmetic

ALU 算术逻辑单元 (Arithmetic and Logic Unit, ALU) 是计算机实际完成数据算术逻辑运算的部件数据由寄存器 (Registers) 提交给ALU, 运算结果也存于寄存器 ALU可能根据运算结果设置一些标志 (Flags), 标志值也保存在处理器内的寄存器中控制器 (Control Unit) 提供控制ALU操作和数据传入送出ALU的信号加法全加器注意: 异或门只能由2个输入端, 故需要6个门, 3个与门, 1个或门, 2个异或门优化: 实际需要2个与门, 1个或门, 2个异或门, 但是延迟更高了不足: 延迟高串行进位 (行波进位) 加法器 RCA 实际就是将多个全加器连在一起延迟: Cn = 2n Fn = Cn-1 + 3 = 2(n - 1) + 3 = 2n + 1 (n ≥ 3, 当n = 1 或 2 时, F = 6) 不足: 高位的运算必须等待低位的"进位输出信号" 思考:...

06.Decimal Representation

二进制编码的十进制数表示使用原因精度限制转换成本高编码方式 : 自然BCD码 (NBCD, 8421码) 0 ~ 9 : 0000 ~ 1001 符号正 : 1100 / 0 负 : 1101 /1 加法硬件实现 C4 判断是否要加6 (0110) 减法反转数字按位反转, 并添加 (1010) 添加 (0110), 并按位反转结果调整如果有进位, 舍弃进位如果没有进位, 对结果按位反转后加1, 并将结果符号设为负示例

07.Internal Memory

回顾 : 存储器存储器 : 由一定数量的单元构成, 每个单元可以被唯一标识, 每个单元都有存储一个数值的能力地址 : 单元的唯一标识符 (采用二进制) 地址空间 : 可唯一标识的单元总数寻址能力 : 存储在每个单元中的信息的位数, 即内存中能被单独识别并独立存放一个数据的最小内存空间大多数存储器是字节(8bit)寻址的, 32位计算机的最大寻址空间为4GB 如何存1bit 存储器层次结构半导体存储器用半导体芯片作主存储器是目前的主流做法位元半导体存储器的基本元件, 用于存储1位数据特性呈现两种稳态(或半稳态) : 分别表示二进制的0和1 它们能够至少被写入数据一次 : 用来设置状态它们能够被读取 : 来获得状态信息操作半导体存储器类型读写存储器随机存取存储器 (RAM) Random-Access Memory (RAM) 随机访问 : 对存储器中任意数据的访问所花费的时间与数据所在位置无关特性可以简单快速地进行读/写操作易失的类型静态RAM...

数据加载中