计算机组成原理——CPU
CPU功能
- 指令控制:完成取指令、分析指令和执行指令的操作,即程序的顺序控制。
- 操作控制:一条指令的功能往往是由若干操作信号的组合来实现的。CPU管理并产生由内存取出的每条指令的操作信号,把各种操作信号送往相应部件,从而控制这些部件,从而控制这些部件按指令的要求进行动作。
- 时间控制:对各种操作加以时间上的控制,时间控制要为每条指令按时间顺序提供应有的控制信号。
- 数据加工:对数据进行算术和逻辑运算。
- 中断处理:对计算机运行过程中出现的异常情况和特殊请求进行处理。
运算器
运算器功能
对于运算器,主要负责对数据加工的功能。对于控制器,协调并控制计算机各部件执行程序的指令序列,基本功能包括取指令、分析指令、执行指令。
取指令:自动形成指令地址,自动发出取指令的命令。
分析指令:操作码译码(分析本条指令要完成什么操作),产生操作数的有效地址。
执行指令:根据分析指令得到的“操作命令”和“操作数地址”,形成操作信号控制序列,控制运算器、存储器以及IO设备完成相应的操作。
中断处理:管理总线及输入输出,处理异常情况(如掉电)和特殊请求(如打印机请求打印一行字符)。
基本结构
- 算术逻辑单元:主要功能是进行算术/逻辑运算。
- 通用寄存器组:如x86下的AX、BX、CX等,用于存放操作数(包括源操作数、目的操作数、中间结果以及各种地址信息等)。SP是堆栈指针,用于指示栈顶的地址。(有些书中会把SP归为专用寄存器,有些归为通用寄存器)
- 暂存寄存器:用于暂存从主存读来的数据,或者从ALU输出的数据,这个数据不能存放在通用寄存器中,否则会破坏其原有的内容。
- 程序状态字寄存器(PSW):保留由算术逻辑运算指令或者测试指令的结果而建立的各种状态信息,如溢出标志(OP)、符号标志(SF)、零标志(ZE)、进位标志(CF)等。PSW中的这些位参与并决定微操作的形成。
- 累加寄存器:它是一个通用寄存器,用于暂时存放ALU的运算结果信息,用于实现加法运算。
- 移位器:对运算结果进行移位运算。
- 计数器:控制乘法、除法运算的操作步数。
连接方式
通用寄存器连接ALU有以下几种方式。
专用数据通路方式
对于ALU有两端,也就是说通用寄存器的数据可能从任意一遍发送到ALU,因此每个寄存器与ALU两端分别有专门的连线。假设寄存器为16Bit,那么通用寄存器组中每个寄存器与ALU两端各有16跟线相连。以上这种方式成为专用数据通路方式,即根据指令执行过程中的数据和地址的流动方向安排连接线路。这种方式的缺点是,随着硬件增多连线越来越复杂,随之难度和成本也越来越高。
此外,如果直接用导线连接,相当于多个寄存器同时并且一直向ALU传输数据,这在运算过程中并不是我们想看到的。我们有以下解决方案(注意下图为了方便表示每个寄存器一侧只用了一根线与ALU相连,但实际并不一定是这样,取决于位数,16Bit就是16根线):
- 使用多路选择器根据控制信号选择一路输出
- 使用三态门可以控制每一路是否输出
三态门实际上有三个接口,其中两个用于输入、输出,另外一个用于控制电信号是否可以通过。如果控制端为高电平,则意味着可以导通,如果为低电平则无法导通,也就是说信号无法被输送到ALU该端。
采用专用数据通路的方式可以保证数据冲突的现象,性能较高,但结构复杂硬件量大,不方便实现。
CPU内部单总线的方式
CPU内部单总线的方式,即将所有寄存器的输入端和输出端都连接到一条公共的通路上。寄存器可以从总线输入信号,也可以接收信号。
上图中蓝色的表示寄存器向总线的输出线路,而绿色的表示输入线路,与之对应的Rin与Rout分别为输入、输出的控制信号。当Rin信号为1时,表示可以从总线将输入数据到寄存器,当Rout为1时,表示可以输出数据到总线。
使用这种方式结构虽然简单、容易实现,但是数据传输存在较多的冲突现象,性能较低。
ALU两端都是与总线连接的,此时假设我们进行加法运算ADD R0, R1
,那么如果两个寄存器先后输出到总线,对于ALU来讲是无法判断两端是一个什么样的值。为了解决这种问题,我们在ALU的一端连接一个暂存寄存器,当R0寄存器输出时,其值保存到暂存寄存器中,然后撤销R0到输出控制信号,然后激活R1的输出控制信号,其数据通过总线直接输送到ALU的一端,此时ALU两端的值就有了差异。
对于ALU,两端必须等待到输入信号稳定后再输出。因为输出也是到总线上的,如果不稳定就会与输入信号冲突。我们可以在ALU的输出端再加一个暂存寄存器,暂存寄存器连接一个三态门,当ALU输入信号稳定后,ALU首先将输出信号输送到输出端的暂存寄存器,当三态门收到控制信号后才将其导通,并将数据发送到总线。
有时候还会对输出端的暂存寄存器进行改造,增加一些功能,如移位、累加等,当然也可以专门设置ACC等寄存器进行累加等操作。
控制器
基本结构
- 程序计数器:用于指出下一条指令在主存中存放的地址。CPU就是根据PC的内容去主存中取指令的。因程序中指令同场是顺序执行的,所以PC有自增的功能。
- 指令寄存器:用于保存当前正在执行的那条指令。
- 指令译码器:仅对操作码字段进行译码,向控制器提供特定的操作信号。
- 微操作信号发生器:根据IR的内容(信号)、PSW的内容(状态信息)及时序信号,产生控制整个计算机系统所需的各种控制信号,其结构有组合逻辑型和存储逻辑型两种。
- 时序系统:用于产生各种时序信号,他们都是由统一时钟分频得到的。
- 存储器地址寄存器MAR:用于存放所要访问的主存单元的地址。(对于现在的计算机,MAR集成在CPU内部)
- 存储器数据寄存器MDR:用于存放向主存写入的信息或从主存中读出信息。(对于现在的计算机,MDR集成在CPU内部)
指令执行过程
指令周期
CPU从主存中每取出并执行一条指令所需的全部时间称为指令周期。
指令周期又被划分为取指周期和执行周期。取指周期会根据PC所指向的位置,取出当前指令,然后PC指向下一条指令,另外还会对取出的指令进行译码操作。取指令操作通常需要访问内存,因此译码阶段相比于取指阶段要快许多。执行周期主要为执行指令阶段,由于执行指令不同,有些需要访存,有些不需要,因此所需时间可能差距很大。执行完指令后,就继续取下一条指令,也就进入了下一个指令周期。
指令周期通常用若干个机器周期(又叫做CPU周期)来表示,一个机器周期又包括若干个时钟周期(又称为接拍、T周期或CPU始终周期,是CPU操作的最基本单位)。此外,机器周期分为定长机器周期和不定长机器周期。每一个子工作(如取指令等)要占用一定的节拍,如果每个子工作所占用的节拍数相同,也就是所有机器周期长度也相同,那么我们就说机器周期是定长的,反之机器周期不定长。
每个指令周期内机器周期数可以不等,每个机器周期内的节拍数也可以不等。有的指令在取指令后可以立即执行,有的指令在取指令后还需要把形式地址转换为有效地址再执行。
很多指令在取指、间址、执行后都会留出来单独的一端时间检查是否有信号需要处理(例如鼠标点击、键盘输入等),这段时间被称为中断周期。除非CPU处于关中断状态,否则正常指令都会留出这段时间。
总结来讲,指令周期流程可以如下图所示:
为了区分CPU目前处于哪个阶段,可以设置4个触发器来解决这个问题,每个触发器存放一个二进制位。如果处于取指周期,则FE设为1,其余全为0;如果进入间址周期,则IND为1,其余为0。此外EX对应执行周期,INT对应中断周期,与上同理。
4个工作周期都有可能进行访存操作,只是访存的目的不同,取指周期是为了取指令,间址周期是为了取有效地址,执行周期是为了取操作数,中断周期是为了保存程序断点。
指令周期的数据流
取指周期
- 当前指令地址送至存储器地址寄存器MAR,记作$(PC)\to MAR$
- CU发出控制信号,经过控制总线传到主存,这里是读信号,记作$1\to R$
- MAR所指主存的内容经过数据总线送入MDR,记作$M(MAR)\to MDR$
- 将MAR所指主存中的内容经数据总线送人MDR,记作$(MDR)\to IR$
- CU发出控制信号,形成下一条指令地址,记作$(PC)+1\to PC$
间址周期
- 将指令的地址码送入MAR,记作$Ad(IR)\to MAR$或$Ad(MDR)\to MAR$
- CU发出控制信号,启动主存做读操作,记作$1\to R$
- 将MAR所指主存中的内容经数据总线送入MDR,记作$M(MAR)\to MDR$
- 此时读出的数据为有效地址EA,此时可以将MDR中的内容直接送往MAR,记作$(MDR)\to MAR$。也有些CPU是将MDR的内容拼接到IR中,记作$(MDR)\to Ad(IR)$
执行周期
执行周期的任务是根据IR中指令的操作码和操作数通过ALU操作产生执行的结果。不同指令的执行周期操作不同,因此没有统一的数据流向。
中断周期
中断即暂停当前任务去完成其他任务,为了能恢复当前任务,需要保存断点。
一般使用堆栈来保存断点,这里用SP表示栈顶地址,假设SP指向栈顶元素,进栈操作是先修改指针,后存入数据。
- CU控制将SP减1,修改后的地址送入MAR,记做$(SP) - 1 \to SP,\space (SP)\to MAR$
- 本质上是将断点存入某个存储单元,假设其地址为a,故可记作$s\to MAR$
- CU发出控制信号,启动主存做写操作,记作$1\to W$
- 将断点(PC内容)送入MDR,记作$(PC)\to MDR$
- CU控制将中断服务程序的入口地址(由向量地址形成部件产生)送入PC,记作$VecAddr \to PC$
指令执行方案
执行多条指令的时候有以下几种执行方案:
- 单指令周期:虽然不同指令的操作步骤可能不同,但是采用单指令周期的方案,所有指令的指令周期都是相同的。也就是说,原本有些指令的周期很短,单指令周期方案会将它们的周期延长,与最慢的指令保持相同。指令之间串行执行。其缺点显而易见,会降低整个系统的运行速度。
- 多指令周期:对不同类型的指令选用不同的执行步骤来完成。指令之间串行执行。可选用不同个数的时钟周期来完成不同指令的执行过程,需更复杂的硬件设计。
- 流水线方案:在每一个时钟周期启动一条指令,尽量让多条指令同时运行,但各自在不同的执行步骤中。这种方案可以使指令并行执行。