ARM系統中函數調用時參數傳遞規則
對于ARM體系來說,不同語言撰寫的函數之間相互調用(mix calls)遵循的是 ATPCS(ARM-Thumb Procedure Call Standard),ATPCS主要是定義了函數呼叫時參數的傳遞規則以及如何從函數返回,關于ATPCS的詳細內容可以查看ADS1.2 Online Books ——Developer Guide的2.1節。這篇文檔要講的是匯編代碼中對C函數調用時如何進行參數的傳遞以及如何從C函數正確返回
本文引用地址:http://www.104case.com/article/201611/319131.htm不同于x86的參數傳遞規則,ATPCS建議函數的形參不超過4個,如果形參個數少于或等于4,則形參由R0,R1,R2,R3四個寄存器進行傳遞;若形參個數大于4,大于4的部分必須通過堆棧進行傳遞。
我們先討論一下形參個數為4的情況.
實例1:
test_asm_args.asm
//——————————————————————————–
IMPORT test_c_args ;聲明test_c_args函數
AREA TEST_ASM, CODE, READONLY
EXPORT test_asm_args
test_asm_args
STR lr, [sp, #-4]! ;保存當前lr
ldr r0,=0×10 ;參數 1
ldr r1,=0×20 ;參數 2
ldr r2,=0×30 ;參數 3
ldr r3,=0×40 ;參數 4
bl test_c_args ;調用C函數
LDR pc, [sp], #4 ;將lr裝進pc(返回main函數)
END
test_c_args.c
//——————————————————————————–
void test_c_args(int a,int b,int c,int d)
{
printk(“test_c_args:n”);
printk(“%0x %0x %0x %0xn”,a,b,c,d);
}
main.c
//——————————————————————————–
int main()
{
test_asm_args();
for(;;);
}
程序從main函數開始執行,main調用了test_asm_args,test_asm_args調用了test_c_args,最后從test_asm_args返回main.
代碼分別使用了匯編和C定義了兩個函數,test_asm_args 和 test_c_args,test_asm_args調用了test_c_args,其參數的傳遞方式就是向R0~R3分別寫入參數值,之后使用bl語句對test_c_args進行調用。其中值得注意的地方是用紅色標記的語句,test_asm_args在調用test_c_args之前必須把當前的lr入棧,調用完test_c_args之后再把剛才保存在棧中的lr寫回pc,這樣才能返回到main函數中。
如果test_c_args的參數是8個呢?這種情況test_asm_args應該怎樣傳遞參數呢?
實例2:
test_asm_args.asm
//——————————————————————————–
IMPORT test_c_args ;聲明test_c_args函數
AREA TEST_ASM, CODE, READONLY
EXPORT test_asm_args
test_asm_args
STR lr, [sp, #-4]! ;保存當前lr
ldr r0,=0×1 ;參數 1
ldr r1,=0×2 ;參數 2
ldr r2,=0×3 ;參數 3
ldr r3,=0×4 ;參數 4
ldr r4,=0×8
str r4,[sp,#-4]! ;參數 8 入棧
ldr r4,=0×7
str r4,[sp,#-4]! ;參數 7 入棧
ldr r4,=0×6
str r4,[sp,#-4]! ;參數 6 入棧
ldr r4,=0×5
str r4,[sp,#-4]! ;參數 5 入棧
bl test_c_args_lots
ADD sp, sp, #4 ;清除棧中參數 5,本語句執行完后sp指向 參數6
ADD sp, sp, #4 ;清除棧中參數 6,本語句執行完后sp指向 參數7
ADD sp, sp, #4 ;清除棧中參數 7,本語句執行完后sp指向 參數8
ADD sp, sp, #4 ;清除棧中參數 8,本語句執行完后sp指向 lr
LDR pc, [sp],#4 ;將lr裝進pc(返回main函數)
END
test_c_args.c
//——————————————————————————–
void test_c_args(int a,int b,int c,int d,int e,int f,int g,int h)
{
printk(“test_c_args_lots:n”);
printk(“%0x %0x %0x %0x %0x %0x %0x %0xn”,
a,b,c,d,e,f,g,h);
}
main.c
//——————————————————————————–
int main()
{
test_asm_args();
for(;;);
}
這部分的代碼和實例1的代碼大部分是相同的,不同的地方是test_c_args的參數個數和test_asm_args的參數傳遞方式。
在test_asm_args中,參數1~參數4還是通過R0~R3進行傳遞,而參數5~參數8則是通過把其壓入堆棧的方式進行傳遞,不過要注意這四個入棧參數的入棧順序,是以參數8->參數7->參數6->參數5的順序入棧的。
直到調用test_c_args之前,堆棧內容如下:
sp->+———-+
| 參數5 |
+———-+
| 參數6 |
+———-+
| 參數7 |
+———-+
| 參數8 |
+———-+
| lr |
+———-+
test_c_args執行返回后,則設置sp,對之前入棧的參數進行清除,最后將lr裝入pc返回main函數,在執行 LDR pc, [sp],#4 指令之前堆棧內容如下:
+———-+
| 參數5 |
+———-+
| 參數6 |
+———-+
| 參數7 |
+———-+
| 參數8 |
sp->+———-+
| lr |
+———-+
上面是轉自http://lionwq.spaces.eepw.com.cn/articles/article/item/17475/
但實際上可能不同的編譯器可能用著不同的處理方式,于我們所使用的編譯器我們可以寫一個簡單的代碼,調用10個參數的函數,然后升成匯編再查看它是如何處理,這樣再根據編譯器進行特殊的優化.
評論