【原创】【自制编程语言】2.控制寄存器

x33g5p2x  于2022-05-08 转载在 其他  
字(3.1k)|赞(0)|评价(0)|浏览(300)

如果是从中间来的,建议先从第一篇看起:https://www.cnblogs.com/jisuanjizhishizatan/p/16241991.html

第2天:控制寄存器

上一次,我们写了最基础的简单架构,接下来我们就要开始用上我们的寄存器了。

本次的成品测试代码是这样的:

mov eax 3
mov ebx 2
mov esi eax
debug
end

先从mov指令开始,mov指令时比较简单的一个指令(准确的说并不简单,我们今天只考虑操作数是寄存器的情况,即操作数不可能出现[ebp+16]这类的内存)

于是,为了通过输入的字符串来获得一个寄存器变量,其实为了方便赋值,函数的返回值一般是不可修改的,因此我们就返回指针,写一个函数:

int *getRegister(Word s){//给定一个寄存器字符串,获取它的地址(地址是因为方便赋值) 
	if(s=="eax")return &eax;
	else if(s=="ebx")return &ebx;
	else if(s=="ecx")return &ecx;
	else if(s=="edx")return &edx;
	else if(s=="esi")return &esi;
	else if(s=="edi")return &edi;
	else if(s=="ebp")return (int*)&ebp;
	else if(s=="esp")return (int*)&esp;//它们都是指针类型,要强制转换一下
	else return NULL; 
}

对于ebp和esp,我们以后如果写到函数调用,或许在栈上会使用,因此是指针类型,做了一次强制类型转换(当然这不太好,但是勉强忍受一下吧)

最后一句return NULL,如果函数返回NULL就说明这不是一个寄存器。

然后就是,如果在输入的时候有常数(如mov eax 3)我们就需要把字符串的常数转为数字,可以通过sscanf(当然stringstream也可以,看个人习惯)

int getNum(Word s){//给定一个数字串,获取它的数字形态 
	int res;
	sscanf(s.c_str(),"%d",&res);
	return res;
}

sscanf第一个参数是作为输入的字符串,第二个参数是格式串,我们通过s,以%d整数的形式,输入到res变量中,相当于进行了一次转换。

然后就是mov语句,对于两个字符串s1和s2,进行赋值操作:

void mov(Word s1,Word s2){
	int *p=getRegister(s1);
	if(p==NULL)error();
	int *q=getRegister(s2);
	if(q==NULL){//不是寄存器,就看做数字处理 
		q=new int;*q=getNum(s2);
	}
	*p=*q;//完成赋值! 
}

题外话:对于正常的汇编语言是这样写mov语句的:

mov eax,1

中间有逗号分隔,其实我们这里也可以用逗号分隔的,实现起来应该也很简单,只不过我懒得弄了。这样就基本把我们的代码完成了。

对了,现在由于还没有输出指令,因此不能查看寄存器的值,所以现在我就考虑写了一个debug指令,用于输出寄存器的值。当然,这个指令只是一个调试指令,后续会考虑专门做个中断函数之类的,或者等call,ret指令写出来之后,直接用call和ret来调用库函数scanf和printf。

完整的代码就是这些了。

#include<iostream>
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<string>
using namespace std;
typedef string Word;
int eax,ebx,ecx,edx,esi,edi;
int *ebp,*esp;
Word *eip;

Word wd[32768+10];
Word getword(){
	return *(eip++);
}

int *getRegister(Word s){//给定一个寄存器字符串,获取它的地址(地址是因为方便赋值) 
	if(s=="eax")return &eax;
	else if(s=="ebx")return &ebx;
	else if(s=="ecx")return &ecx;
	else if(s=="edx")return &edx;
	else if(s=="esi")return &esi;
	else if(s=="edi")return &edi;
	else if(s=="ebp")return (int*)&ebp;
	else if(s=="esp")return (int*)&esp;//它们都是指针类型,要强制转换一下
	else return NULL; 
}
int getNum(Word s){//给定一个数字串,获取它的数字形态 
	int res;
	sscanf(s.c_str(),"%d",&res);
	return res;
} 
void error(){
	printf("Error: EIP %d\n",eip);
	exit(1);
}
void mov(Word s1,Word s2){
	int *p=getRegister(s1);
	if(p==NULL)error();
	int *q=getRegister(s2);
	if(q==NULL){//不是寄存器,就看做数字处理 
		q=new int;*q=getNum(s2);
	}
	*p=*q;//完成赋值! 
}
void debug(){
	printf("eax..%d ebx..%d ecx..%d edx..%d\n",eax,ebx,ecx,edx);
	printf("esi..%d edi..%d ebp..%d esp..%d\n",esi,edi,ebp,esp);
	printf("eip..%p\n",eip);
}
int main(int argc,char** argv){
	if(argc!=2){
		printf("The syntax of the command is incorrect.\n");
		exit(1);
	}
	FILE *fp=fopen(argv[1],"r");
	eip=wd;
	for(;;){
		char s[100];
		int i=fscanf(fp,"%s",s);
		if(i==EOF)break;
		*eip=s;++eip;//*eip就是读取的指令单词 ,存储在wd数组中 
	}
	eip=wd;
	
	for(;;){
		Word s=getword(); 
		if(s=="end"){
			exit(0);
		}
		else if(s=="mov"){
			Word s1,s2;
			s1=getword();s2=getword();
			mov(s1,s2);
		}
		else if(s=="debug"){
			debug();
		}
	}
	
	return 0;
}

本期的内容到此结束,我们下期再见。

相关文章