我读过this,this,和this还没有找到我想要的。
首先,我理解lea
和mov
在它们可以实现的结果方面的区别,简单地说:
mov eax, ebp ;put the value in ebp register into eax register
lea eax, [ebp] ;same as above, and they are equivalent
字符串
然而:
mov eax, ebp+8 ;invalid register set size
lea eax, [ebp+8] ;calculate in sum of ebp value and 8, then assign it to eax
型
那么为什么mov eax, ebp+8
是非法的,而lea eax, [ebp+8]
是可以的呢?我的书上说:
MOV存储到EAX中的值必须由汇编程序计算(也就是说,它最终必须是一个常量)
但是这对我来说没有意义!CONSTANT是什么意思?显而易见的理解是,CONSTANT应该在程序运行之前由汇编器/链接器计算,但是,想想mov eax, [ebp+8]
是一条法律的指令。汇编器/链接器在程序运行之前没有办法知道[ebp+8]
(*(ebp+8)
作为C语言)的值!
1条答案
按热度按时间wecizke31#
你的书似乎只讨论了移动即时,比如
mov eax, 1234
或mov eax, foo
(符号地址)。一个更完整的规则是
mov
的源操作数必须是:mov
只能拷贝,不会先通过ALU送入数据再写入目的地。内存源操作数可以使用像
[ebp+8]
或[edx + eax*4 + my_array]
这样的寻址模式,但这与从该地址加载或存储到该地址的数据发生的情况无关。地址生成在CPU的单独部分中完成(或在原始8086上,在微代码处理指令的单独阶段)。x86的机器码格式编码addressing modes(以及寄存器与内存源)几乎所有指令都是相同的方式,所以
mov
不必做任何特殊的事情来支持mov eax, [ebp+8]
,就像add eax, [ebp+8]
在进行地址计算和加载后也会对数据进行加法。只有操作码字节不同,指定如何处理数据,而不是操作数在哪里(寄存器与内存寻址模式)。(有two opcodes for most instructions,一个源可以是内存,一个目的地可以是内存。我在这里谈论两个内存源操作码。)lea eax, [ebp+8]
的机器码除了操作码字节外,其他都是一样的。**莱亚的特殊之处在于,它使用寻址模式的机器码格式来编码移位/加法指令,该指令实际上并不访问内存。**参见 * Using LEA on values that aren't addresses / pointers? *没有其他指令可以做到这一点,所以你永远不能使用
eax+3
作为任何指令的源操作数。有两个独立的概念:指令的数据来自哪里(立即、寄存器或寻址模式寻址的内存)与该数据发生的情况(复制、imul、sub、popcount、..)。从这个意义上说,莱亚没有数据输入,因为它没有解引用
[ebp+8]
。莱亚只接受地址,就像C的
&
address-of运算符一样,它取消了原本是解引用的操作,例如&ptr[3]
与ptr+3
相同,但语法不同。莱亚有趣的一点是,x86 ADD只能做ptr+=3
,修改寄存器(或内存),但莱亚可以像tmp = &ptr[3]
一样复制和添加。(And对于32位或64位寻址模式,还可以添加移位寄存器,如
tmp = &ptr[x*4 + 3]
)有点离题,但可能相关:
大多数经典的x86整数指令只有一个或两个操作数(* What kind of address instruction does the x86 cpu have? *)。尽管
imul ecx, [edx+8], 123
可以在将结果写入非输入寄存器时进行数学运算。(与大多数立即源指令不同,新的186形式的imul
没有窃取ModRM中的/r
字段作为额外的操作码位,所以它可以有3个操作数,包括立即数,其存在由操作码发出信号。)但硬件乘法器的输入仍然是立即数和直接来自内存的值;imul ecx, edx+8, 123
是不可编码的。