我想学一点汇编,因为我在计算机体系结构课上需要它。我写了一些程序,比如打印斐波那契数列。
我认识到,每当我编写一个函数时,我都会使用这三行代码(正如我在比较gcc
生成的汇编代码与它的C
等效代码时所了解到的那样):
pushq %rbp
movq %rsp, %rbp
subq $16, %rsp
字符串
1.首先,为什么我需要使用%rbp
?使用%rsp
不是更简单,因为它的内容被移动到第二行的%rbp
?
1.为什么要从%rsp
中减去什么呢,我的意思是,不总是16
,当我计算7个或8个变量时,我会减去24
或28
。
我在虚拟机(4GB RAM)上使用Manjaro 64位,英特尔64位处理器。
2条答案
按热度按时间ie3xauqp1#
rbp
是x86_64上的帧指针。在您生成的代码中,它会获取堆栈指针(rsp
)的快照,以便在对rsp
进行调整时(即为局部变量保留空间或将push
的值添加到堆栈),仍然可以从rbp
的常量偏移量访问局部变量和函数参数。许多编译器提供帧指针省略作为优化选项;这将使生成的汇编代码访问相对于
rsp
的变量,并释放rbp
作为另一个通用寄存器用于函数。在GCC的情况下,我猜你是从AT&T汇编语法中使用的,那个开关是
-fomit-frame-pointer
。试着用那个开关编译你的代码,看看你得到了什么汇编代码。你可能会注意到,当访问相对于rsp
而不是rbp
的值时,指针的偏移量在整个函数中是变化的。qc6wkl3g2#
Linux使用System V ABI for x86-64(AMD 64)架构;有关详细信息,请参阅OSDev Wiki上的System V ABI。
这意味着堆栈 * 向下增长 *;更小的地址在堆栈中“更高”。
字符串
为局部变量保留的内存量总是16字节的倍数,以保持堆栈对齐为16字节。如果局部变量不需要堆栈空间,则没有
subq $16, %rsp
或类似指令。(Note返回地址和前一个推送到堆栈的
%rbp
都是8字节,总共16字节。当
%rbp
指向当前堆栈帧时,%rsp
指向堆栈顶部。因为编译器知道%rbp
和%rsp
在函数内任何一点的区别,所以可以自由地使用任何一个作为局部变量的基础。堆栈帧只是局部函数的Playground:当前函数使用的堆栈区域。
当前版本的GCC在使用优化时禁用堆栈帧。这是有道理的,因为对于用C编写的程序,堆栈帧对调试最有用,但其他用处不大。(然而,您可以使用例如
-O2 -fno-omit-frame-pointer
来保留堆栈帧,同时启用优化。)虽然相同的ABI适用于所有的二进制文件,无论它们是用什么语言编写的,但某些其他语言确实需要堆栈框架来“展开”(例如,向当前函数的祖先调用者“抛出异常”);即“展开”堆栈框架,一个或多个函数可以被中止,控制权传递给一些祖先函数,而不会在堆栈上留下不需要的东西。
当堆栈帧被省略时--GCC为
-fomit-frame-pointer
--,函数实现本质上改变为型
因为没有堆栈帧(
%rbp
用于其他用途,它的值从不压入堆栈),每个函数调用只将返回地址压入堆栈,这是一个8字节的量,所以我们需要从%rsp
中减去8,以保持它是16的倍数。(一般来说,从%rsp
中减去和添加的值是8的奇数倍。)函数参数通常在寄存器中传递。有关详细信息,请参阅本答案开头的ABI链接,但简而言之,整数类型和指针在寄存器
%rdi
,%rsi
,%rdx
,%rcx
,%r8
和%r9
中传递,浮点参数在%xmm0
到%xmm7
寄存器中传递。在某些情况下,您会看到
rep ret
而不是rep
。不要混淆:rep ret
的意思与ret
完全相同;rep
前缀,尽管通常用于字符串指令(重复指示),当应用于ret
指令时什么也不做。只是某些AMD处理器的分支预测器不喜欢跳到ret
指令,推荐的解决方法是使用rep ret
。最后,我省略了堆栈顶部上方的red zone(地址小于
%rsp
的128个字节)。这是因为它对典型函数并不真正有用:在普通的have-stack-frame情况下,你会希望你的本地内容在栈帧内,以使调试成为可能。在omit-stack-frame情况下,堆栈对齐要求已经意味着我们需要从%rsp
中减去8,因此在减法中包含局部变量所需的内存是没有成本的。