如何理解函數調用過程?本文把一個簡單的C語言程序匯編成目標代碼,然后用objdump目標文件反編譯成的匯編代碼,從而一窺函數調用過程,希望對你有所啟發。
C語言源碼:
#include <stdio.h>
int static add(int a, int b)
{
return a+b;
}
int main()
{
int x = 5;
int y = 10;
int u = add(x, y);
return 1;
}
~
經過編譯:gcc -g -c add.c,生成目標代碼add.o
查看目標文件(生成匯編代碼): objdump -d -S add.o
add.o: file format Mach-O 64-bit x86-64
Disassembly of section __TEXT,__text:
_main:
; { //這是注釋(ps)
0: 55 pushq %rbp
1: 48 89 e5 movq %rsp, %rbp
4: 48 83 ec 10 subq $16, %rsp
8: c7 45 fc 00 00 00 00 movl $0, -4(%rbp)
; int x = 5;
f: c7 45 f8 05 00 00 00 movl $5, -8(%rbp)
; int y = 10;
16: c7 45 f4 0a 00 00 00 movl $10, -12(%rbp)
; int u = add(x, y);
1d: 8b 7d f8 movl -8(%rbp), %edi
20: 8b 75 f4 movl -12(%rbp), %esi
23: e8 00 00 00 00 callq 0 <_main+0x28>
28: be 01 00 00 00 movl $1, %esi
2d: 89 45 f0 movl %eax, -16(%rbp)
; return 1;
30: 89 f0 movl %esi, %eax
32: 48 83 c4 10 addq $16, %rsp
36: 5d popq %rbp
37: c3 retq
38: 0f 1f 84 00 00 00 00 00 nopl (%rax,%rax)
_add:
; {
40: 55 pushq %rbp
41: 48 89 e5 movq %rsp, %rbp ;當前函數的棧指針
44: 89 7d fc movl %edi, -4(%rbp) ;把寄存器的參數移動到棧上
47: 89 75 f8 movl %esi, -8(%rbp) ;把寄存器的參數移動到棧上
; return a+b;
4a: 8b 75 fc movl -4(%rbp), %esi
4d: 03 75 f8 addl -8(%rbp), %esi
50: 89 f0 movl %esi, %eax
52: 5d popq %rbp
53: c3 retq
從上面可以看出:
1、目標文件(.o)的地址是從0開始的 (還沒有在虛擬地址空間中分配地址,ld的時候才分配)
2、函數開始地址是4字節對齊的。
3、X86架構指令長度是變長的(ARM指令是定長的4字節)。
4、名字修飾,符號名稱是通過下劃線+函數名得到。
程序調用過程
調用方:
- 先把參數保存在寄存器edi和esi中(通過寄存器傳參數)
- 調用callq
- 處理返回值eax
其中,callq做了兩件事情:
1) 保存下一條指令的地址,用于函數返回繼續執行
2) 跳轉到子函數的地址
被調用方:
- 上一個函數的幀指針rbp入棧
- 棧指針rsp保存到幀指針
- 從寄存器(edi和esi)取出參數到棧中
- 運算
- 把計算結果保存在eax
- 彈出幀指針(還原前一個函數的rbp)
- 函數返回,取下一跳指令繼續執行
特別說明:
上面函數傳參和返回參數傳遞是通過寄存器傳遞的,還可以通過棧和內存區域傳遞,具體可以參考C語言調用慣例。
一個函數的幀結構中包含哪些數據?
1、上一個棧幀寄存器保存在棧中的值
2、本函數用的臨時變量
3、調用子函數傳的參數
4、調用子函數后返回時繼續執行的(返回地址)
棧幀結構:
棧幀示意