指令周期和指令流水 | luckylotus的成长年轮

标签

日期

Place

创建时间

Jan 8, 2026 01:52 PM

指令周期

基本概念

指令周期：CPU从主存中每取出并执行一条指令所需的全部时间/CPU完成一条指令的时间完成一条指令

取指周期：取指令+分析指令（比起取指令访存速度很快）

执行周期：执行指令

补充：

指令周期常常用若干机器周期<完成一个子工作>来表示，机器周期又叫CPU周期

一个机器周期又包含若干时钟周期（节拍、T周期、CPU时钟周期），它是CPU操作的最基本单位有可能出现执行指令比取指令所需的CPU的节拍数更少 每个指令周期内机器周期数可以不等，每个机器周期内的节拍数也可以不等--由于各种指令操作功能不同，因此各种指令的指令周期不相同的

具有间接寻址的指令周期间接寻址的指令周期：

取指周期

间址周期：取操作数的有效地址

执行周期

带有中断周期的指令周期在执行快结束阶段，留出一部分中断周期检查是否有中断信号需要处理【许多指令在CPU每条指令执行阶段结束前，都要发出中断查询信号，以检测是否有中断请求需要处理，如果有请求，CPU进入中断响应阶段，又称为中断周期】

指令周期流程上述四个周期【CPU的工作周期】都有CPU的访存操作，只是访存的目的不同：取指周期：取指令间址周期：取有效地址执行周期：取操作数（当指令为访存指令时）中断周期：保存程序断点

为了区分它们，可在CPU内设置4个标志触发器---CPU工作周期标志触发器

数据流

为了便于分析指令周期中的数据流，假设CPU中有存储器地址寄存器MAR、存储器数据寄存器MDR、程序计数器PC、指令寄存器IR

取指周期的数据流

PC存放现行指令的地址，该地址送到MAR并送至地址总线（PC）-> MAR

控制部件CU向存储器发出读命令 1->R

将对应MAR所指单元中的内容（指令）经数据总线送至MDR M(MAR)->MDR

将MDR中的内容（指令）送至IR （MDR)->IR

CU发出控制信号，形成下一条指令地址 (PC)+1->PC

间址周期的数据流最终有效地址的两种处理方式：

从MDR直接送给MAR

将有效地址送至指令的地址码字段前三步的梳理：一旦取指周期结束，CU便会检查IR中的内容，以确定其是否有间址操作，若有间址操作：

将指令的地址码送入MAR，又送至地址总线 Ad(IR)->MAR Ad(MDR)->MAR 此时IR和MDR存储同一指令

CU向存储器发读命令 1->R

将MAR所指主存中的内容经数据总线送入MDR M(MAR)->MDR

执行周期的数据流执行周期的任务是根据IR中指令字的操作码和操作数通过ALU操作/CPU内部寄存器间的数据传送/对存储器(或I/O)进行读写操作产生执行结果不同的指令在执行周期的操作不同，无法用统一的数据流图表示

中断周期

中断：暂停当前任务/程序去完成其他任务程序为了能够恢复当前任务，需要保存断点（PC）当前的内容必须保存起来，以待执行完中断服务程序后可以准确返回到该程序的间断处

在每一个进程运行过程当中，操作系统都会给进程在主存中开辟一片空间作为进程的运行堆栈，一般使用堆栈来保存断点，SP表示栈顶地址，指向栈顶元素，进栈操作先修改指针，后存入数据

CU控制将SP-1，修改后的地址送入MAR (SP)-1->SP (SP)->MAR 本质上是将断点存入某个存储单元，假设其地址为a，故可记作a->MAR

CU发出控制信号，启动主存做写操作 1->w

将断点（PC内容）送入MDR (PC)->MDR

CU控制将中断服务程序的入口地址（由向量地址形成部件产生）送入PC 向量地址->PC

指令流水

对指令的执行过程进行优化

如何提高机器速度

提高访存速度

提高存储芯片的性能---高速芯片
分级存储措施提高存储器的性能/价格比

cache
多体

提高主机与I/O交换信息的速度

DMA方式
多总线结构，将速度不一的I/O分别挂到不同带宽的总线上

提高运算器速度

高速芯片
快速进位链
改进算法

提高整机的速度

提高器件的性能---高速器件
改进系统结构，开发系统的并行性

并行的概念

同时性：两个或多个事件在同一时刻发生
并发性：两个或多个事件在同一时间段发生
同一时刻或同一时间段完成两种或两种以上性质相同或不同的功能，只要在时间上相互重叠，存在并行性

并行性的等级

过程级粗粒度算法（软件）实现

作业级/程序级
任务级/进程级

指令级细粒度硬件实现

指令之间
指令内部

原理

一条指令的执行过程可以分成多个阶段取指分析执行取指：根据PC内容访问主存储器，取出一条指令送到IR 分析：对指令操作码进行译码，按照给定的寻址方式和地址字段中的内容形成操作数的有效地址EA，并从有效地址EA取出操作数执行：根据操作码字段，完成指令规定的功能，把运算结果写到通用寄存器/主存中 特点：每个阶段有可能用到的硬件不同

指令的串行执行

传统的冯·诺伊曼机采用顺序执行方式/串行执行方式优点：控制简单，硬件代价小缺点：执行指令的速度较慢，任何时刻处理机只有一条指令在执行，各功能部件的利用率低

指令的二级流水指令预取：由指令部件取出一条指令，并将它暂存起来，如果执行部件空闲，就将暂存的指令传给执行部件执行，与此同时，指令部件又可取出下一条指令并暂存起来影响指令流水效率加倍的因素：

一般执行时间 > 取指时间

条件转移指令对指令流水的影响

当遇到条件转移指令时，下一条指令是不可知的，必须等执行阶段结束后，才能获知条件是否成立，从而决定下条指令的地址，造成时间损失
解决方案：猜测法

当条件转移指令从取指阶段进入执行阶段时，指令部件仍按顺序预取下一条指令

若条件不成立，转移未发生，则没有时间损失
若条件成立，转移发生，则所取的指令必须丢掉，并再取新的指令 3.指令六级流水时序在这个流水线中，处理器有六个操作部件，同时对六条指令进行加工，加快程序的执行速度

流水线的表示方法

指令执行过程图

时空图

每个执行阶段默认所需时间相同
各个阶段所需硬件相互独立，不同的阶段对应不同的硬件资源
用途：分析流水线的性能

流水线的性能指标

假设理想情况：每个阶段花费时间相同，且每个阶段结束后能立即进入下一阶段

吞吐率定义：在指令级流水线中，吞吐率指单位时间内流水线所完成指令或输出结果的数量

最大吞吐率

流水线在连续流动达到稳定的状态所获得的吞吐率$$T_{pmax}=\frac{1}{\Delta t}$$

流水线仅在连续流动时才可达到最大吞吐率
实际上由于流水线在开始时有一段建立时间（第一条指令输入后到其完成的时间），结束时有一段排空时间（最后一条指令输入后到其完成的时间），以及由于各种相关因素使流水线无法连续流动，因此，实际吞吐率总是小于最大吞吐率

实际吞吐率

流水线完成n条指令的实际吞吐率

加速比定义：完成同样一批任务，不适用流水线所用的时间与使用流水线所用的时间之比（m 段的流水线速度与等功能的非流水线的速度之比） $$ S_{p}=\frac{nm\Delta t}{m\Delta t+(n-1)\Delta t}=\frac{nm}{m+n-1} $$ 当n>>m时，Sp接近于m，当流水线各段时间相等，其最大加速比等于流水线的段数