简易CPU设计入门:本CPU项目的指令格式
在这一节里面,主要是理论知识,基本上不讲代码。不过,本项目的代码包,大家还是需要下载的。
本项目的代码包的下载方法,参考下面的链接所指示的文章。
下载本项目代码
本节,其实是要讲本项目CPU的指令集。
什么是指令集?
我的理解,一个CPU,它所支持的所有的指令的集合,就叫做它的指令集。
同一个架构的CPU,会支持大致相同的指令,且功能大致相同。像这样的,支持大致相同的指令的架构,叫做指令集架构。英文简写为ISA,全称为:Instruction Set Architecture。
我们这个CPU项目,它也有它的指令集。不过,暂时谈不上什么架构。
本项目使用的指令集,大体上,和姜咏江先生的书,《自己设计制作CPU与单片机》里面所用的指令集是一样的。指令格式大致相同。我给大家贴一下姜咏江先生的这本书的图片。
现在呢,大家在淘宝网,当当网等等的电商平台里面,应该还能够买得到。
我的这个项目,我只是采用了其中的一部分的指令,且有的指令,我作出了一点调整与改动。
接下来呢,我来讲一讲本项目CPU所使用的CPU指令格式。
一. 本项目CPU所用的CPU的指令格式
首先呢,我将姜咏江先生的书3.5.1节中所说的指令给贴出来。大家先略微看一看就行。
格式 机器指令编码 汇编指令 功能解释
1 00001 Lda r 将dram的r单元的数取出来,送到累加器da
2 00010 Add r dram的r单元的数与累加器da相加,结果放在da中
3 00011 Out r 将dram的r单元内容送到out寄存器输出
4 00100 Sdal n 将常数n送入累加器da的低8位,并扩充成16位有符号数
5 00101 Sdah n 将常数n送入累加器da的高8位,并与低8位组成16位有符号数
6 00110 Str r 将累加器da的内容送到dram的r单元保存
7 00111 Sub r dram的r单元与累加器da相减,结果放在累加器da
8 01000 Jmp r 跳转到iram的r单元
9 01001 Jz r 若da=0,则跳转到iram的r单元
10 01010 Jn r 若da<0,则跳转到iram的r单元
11 01011 Call r 调用子程序r,r是子程序地址
12 01100 Ret 从子程序返回
13 01101 Mult r dram的r单元与累加器da相乘,结果放在累加器da
14 01110 Divi r dram的r单元与累加器da相除,结果放在累加器da
15 11111 Stp 停止
最左列,为格式。其实它也是5bit的指令码对应的十进制数。
第二列,为机器指令编码,是二进制码。大家对照着第一列和第二列的格式码与机器指令码,就会发现,除了最后一行,其余的行里面,某一行的机器指令编码所对应的二进制数,与第一列中的十进制数的值是相等的。
第三列,是表示这个机器指令的汇编指令格式码。
第四列,为对这一指令的功能介绍。
原书的3.5.1节共设计了15条指令。我选取了这15条指令中的一部分指令,并且略作修改,形成了本CPU所支持的指令集。本CPU项目支持的指令集如下。
格式 机器指令编码 汇编指令 功能解释
2 00010 Add r dram的r单元的数与累加器da相加,结果放在da中
4 00100 Sdal n 将常数n送入累加器da的低8位,并扩充成16位无符号数
6 00110 Str r 将累加器da的内容送到dram的r单元保存
7 00111 Sub r dram的r单元与累加器da相减,结果放在累加器da
在功能解释部分,ram也好,dram也好,都指的是内存。而累加器,在功能解释部分,是用da来表示的。
(一)累加器的概念
关于累加器,学习过汇编语言的同学,对它应该是并不陌生的。没学过的,可能会有些陌生吧。
我略微来谈一谈。
在英特尔8086处理器里面,有8个通用寄存器,这些通用寄存器,都是16位的。列示如下。
图1所示的,英特尔8086CPU的8个通用寄存器,大家可以看一看。不要求记忆,但是呢,你还是应该对此有所了解。最好呢,以后可以渐渐地做到心里头熟悉这张表。
在图1里面,第一个寄存器,是累加器AX。关于累加器,大概起初在设计它的时候,就是为了用它做加法运算。然而,这基本上算是一个大忙人。好多的运算,都会用到累加器。包括我们自己编写汇编代码的时候,也常常会去使用累加器。累加器,是一个相当常用的寄存器。
我目前所接触过的CPU有两个,一个是英特尔架构的CPU,另一个是小时候的小霸王游戏机里面会用到的 6502 CPU。
在6502 CPU里面,也有累加器。而在姜咏江先生的书里面,同样是提到了累加器。
当前,电脑上使用的CPU,以英特尔和AMD公司的CPU为多。这俩公司的CPU,都属于英特尔的X86架构的CPU。而在手机,平板电脑上,使用的,大概以ARM架构的CPU为多。ARM架构的CPU的汇编代码,我还没有学习过。我估计,在ARM汇编里面,大概,也会使用到累加器。
累加器,大概会是各种CPU都是用到的一个寄存器。
(二)ram的概念
ram,是一个英文缩写,全称是 random access memory,中文翻译为随机访问存储器。它可以分为两种类型,一个是动态随机访问存储器,英文缩写为DRAM,另外一个是静态随机访问存储器,英文缩写为SRAM。
在速度上,SRAM要比DRAM快好多。不过,由于SRAM造价比较高,所以,在我们的计算机里面,并没有用SRAM来制作内存条,而是用DRAM来制作内存条。而SRAM,也是有使用的,主要是用于CPU中的高速缓存。
在我们的系统中,不存在SRAM,不存在CPU缓存,只有DRAM。所以,在我们的系统中,你可以认为RAM与DRAM是同义语。
在我们的系统中,我是用Quartus II软件的IP核,生成了两个ram IP核。这俩ram,一个是专门用来存储机器指令码,另一个是专门用来存储数据。这么去处理的原因,是因为,姜咏江的书是这么写的,另一个教写CPU代码的书也是这么写的。
大家都这么写,我也就跟着这么写了。
现实中的内存条,也就是DRAM,你可以将其看作是一个大的字节数组。每一个内存单元的尺寸,是1字节。如果某一个内存条的的容量是1024B,则它能够存储1024个字节。字节编号,就是这个内存单元的地址。
内存地址从0开始编号。内存地址511为第512个字节单元。
现实中的内存地址,指的是字节编号。
而在我们的这个系统中,内存地址,并非字节编号。我们这个系统,每一个内存单元的尺寸,是16bit,2字节。2字节,在汇编语言中,可以被称为一个字。我们的ram,每一个单元的尺寸,都是2字节,一个字。字编号,才是我们这个系统的内存地址。而我们的系统中,内存地址依然是从0开始编号。
举例来说,在我们这个系统中,内存地址0,它对应着现实内存的地址0和地址1。
本系统内存地址 现实内存的地址
0 0和1
3 6和7
10 20和21
1024 2048和2049
(三)指令码讲解
我来讲一讲本系统使用的4条指令的功能。
首先来看下面一条指令。
格式 机器指令编码 汇编指令 功能解释
4 00100 Sdal n 将常数n送入累加器da的低8位,并扩充成16位无符号数
上述指令,它是一个基本的立即数加载指令。我们平时所说的常数,指的是1,2,3,3.5等等的整数与小数之类的,数值保持不变的。在程序设计语言中,英文字符,中文字符也都是常数。
如果你在C语言中定义了如下的代码
#define NUM_01 102
那么,NUM_01 也成为了一个常数,它代表着102。
如果你在英特尔8086汇编语言中定义了如下的代码
NUM_02 = 103
则 NUM_02 也会称为一个常数,所代表的数是103。在汇编语言中,常数,也被称作立即数。这是因为,很多时候,汇编语言或者机器语言中参与运算的数,很多时候是需要去寻址的。这个数,要么是被存放在寄存器中,要么是被存放在内存地址里面。而有的时候,实际参与运算的数,并不存放在寄存器或者内存中,而是在指令中直接给出这个常数。所以,在汇编语言中,常数就被称作立即数了。
把它叫做立即数,是因为不需要从寄存器或者内存中将其寻找和取出来,而是可以立即从指令码中得到。
格式4所对应的指令的功能是,将立即数n送入累加器的低8位,并且扩充成为16位的数。
比如说,我们可以将30这个整数,送到累加DA中,并且扩充为16位的数。
在这里,为啥会提到扩充为16位呢?
现实中的处理器,它可以有着不同尺寸的指令。有的指令为1字节,有的为2字节,也有3字节和4字节,乃至更多的字节的指令。而在我们的系统中,所有的指令都是2字节的大小。
一个机器指令,要分为操作码和操作数两部分。我们这个系统里面,所有的指令都是操作码占一个字节,操作数占一个字节,所以都是2字节的指令。
在我的这个系统中,我设置了8个通用寄存器,而实际使用到的,仅仅是第一个通用寄存器,累加器。这个累加器是16位的。
Sdal n,这个汇编指令,它的操作码要占据一个字节,其中会包含机器指令编码【00100】。操作数n也要占据一个字节。操作数n为8位,一个字节。本指令,其实是要将8位的立即数n送入16位的累加器DA中。
在操作的时候,是将8位的立即数n送入累加器DA的低8位,而将DA的高8位清零。
我这样子解释,希望大家能听懂。
我们再来看下一条指令
格式 机器指令编码 汇编指令 功能解释
6 00110 Str r 将累加器da的内容送到dram的r单元保存
上述指令,是将累加器DA中的数,送入内存单元r中。
比如说,将累加器DA中的数12送入内存单元63中。
注意,我们系统的内存单元63,它的尺寸是2字节的。它对应着现实的内存的126和127两个字节单元。
在这里,我所使用的汇编指令符号,都是抄的姜咏江的书的。我自己其实并不喜欢这种风格的汇编书写格式。因为,我平时所用的,基本上都是英特尔汇编,我更喜欢【mov ax, cx】,【add cx, [1234H]】这样的书写方式。然而,我在写代码的时候,还是偷懒了,没有去认真地设置指令的机器码编码格式,也没有去认真地设置汇编指令书写格式。
当时写代码的时候,我是追求着,快点将这个项目给写完,凑合着搞出来一个简易的CPU就行了,所以也没有认真地去设计指令格式啥的。
如果以后,我自己再去认真一些地,去写一个CPU的话,我是希望,能够将6502 CPU,给实现出来。如果能够再认真一些,我希望能够将8086 CPU,给部分地实现出来,好在自己写的8086 CPU里面,运行着8086汇编代码。
本项目所用的汇编指令格式,如果你不需要这样的符号,你就自己去改好了。此处,我实在是不想费这个事。
最后,我们再来看剩余的两个指令的格式。
格式 机器指令编码 汇编指令 功能解释
2 00010 Add r dram的r单元的数与累加器da相加,结果放在da中
7 00111 Sub r dram的r单元与累加器da相减,结果放在累加器da
2号和7号指令,分别是加法与减法指令,将DRAM的r单元中的数与累加器DA中的数作运算,运算结果存放在累加器DA中。
我这里所列出的汇编指令里面,都没有涉及通用寄存器的编号的问题。像是 Add r,Sub r,Str r ,都是在汇编指令里面,仅仅指出了内存单元 r,而并未指出要操作哪个通用寄存器。
之所以未指定寄存器的编号,这是因为,在我们的这个系统中,仅仅使用了一个通用寄存器,就是第1个通用寄存器,累加器DA。
结束语
关于指令格式,其实本节并未完全讲完。然而,这一节不可能讲完。因为,还有一部分内容,是需要在讲译码器的时候,才能去讲解的。
这一节内容,我写得比较累。因为不知道要咋去讲。希望你已经看懂了我所讲的内容。如果没有看懂,那就请私信联系我好了。