基于ARM的高效C語言編程
add r3,[r2,r1,lsl #1];增加語句①
ldrh r3,[r3,#0]
add r1,r1,#1
and r1,r1,0xff;增加語句②
cmp r1,#0x0a
add r0,r3,r0
bcc add2_loop
mov r0,r0,lsl #16;增加語句③
mov r0,r0,asr #16;增加語句④
mov pc,r14
比較add1和add2兩個函數的匯編代碼,可以發現add2_loop循環比add1_loop循環增加了4條語句。
語句①:函數add2中變量sum為16位short類型,ARM指令中ldrh指令不支持移位地址偏移,因此增加add指令計算數組下標地址。
語句②:由于函數add2中循環變量i為8位的char類型,而ARM處理器的寄存器為32位,此語句用于處理循環變量累加過程中引起的溢出問題。即:當i累加到255時,再加1應該為0,而不是256。
語句③、④:函數add2中返回結果sum為short類型,在返回前需將32位寄存器的前16位用符號位填充,即轉換為16位short類型。
2 函數局部變量的個數
為了加快程序的執行速度,函數編譯時應盡可能將局部變量都分配在寄存器中。*部變量多于可用的寄存器時,編譯器會將多余的變量壓入堆棧(即存入存儲器中),因此必須控制局部變量的個數。
ARM處理器采用RISC結構,帶有豐富的內部寄存器。在編譯器使用apcs開關選項,即支持ATPCS(ARMThumb Procedure Call STandard)標準時,理論上有14個寄存器(R0~R12,R14)可以用來存放局部變量。但是實際上有些寄存器有自身特殊的用途,例如R9在與讀寫位置無關(RWPI)的編譯情況下作為靜態基址寄存器使用,R12作為子程序內部調用的臨時過渡寄存器使用。ATPCS規則中的寄存器名稱及說明如表1所列。
表1 ATPCS規則中寄存器說明
因此,應盡量限制局部變量的數目:①對于函數的參數個數應控制在4個以內,只有R0~R3可用來保存參數,當參數多于4個時將被壓入堆棧。如果由于實際應用的需要,參數多于4個,也可以采用結構體來組織參數,傳遞結構體指針來實現。②函數內部局部變量的個數應控制在12個以內(R0~R11),R12~R15都有特定用途。
3 函數內代碼的編寫
3.1 循環代碼的編寫
循環的控制條件設為遞減到零的形式,可以減少指令條數。以求10個數的累加和為例進行分析。
代碼1:
int sum=0;
for(int i=0;i10;i++)
sum=sum+i;
代碼2:
int sum=0;
for(int i=10;i!=0;i--)
sum=sum+i;
評論