ARM體系結構研究(一)
Thumb指令的優點在于它可以在保留32位代碼優勢的同時,大大節省系統的存儲空間,因為在Thumb指令集中的操作數仍然是32位的,指令地址也是32位的,只是指令編碼變成了16位,而ARM指令則為32位,所以,相比之下,實現同樣的功能,Thumb指令的條數要比ARM略多。圖2.1是“Add Rd,#Constant”在Thumb狀態和ARM狀態下的指令比較:
圖2.1 Thumb指令和ARM指令的比較
由上圖我們可以清楚地看到Thumb指令的精簡之處,所以Thumb的存儲空間僅僅是ARM存儲空間的60%~70%,但是Thumb的指令條數比ARM指令條數多30%~50%,如果使用32位的存儲器,由于指令條數較少等原因,ARM指令會比Thumb指令快40%左右,而使用16位存儲器時,Thumb指令則會快40%~50%。同時與ARM比較Thumb指令的功耗會降低約30%。但是Thumb指令也有其局限性。第一、偏移范圍,在Thumb指令中條件轉移偏移只有8位,也就是說只能在256Byte的范圍內有條件地轉移,在無條件轉移中可以有16位的偏移,而這些在ARM指令中都是32位,大大提高了靈活性。同時,在Thumb指令中不支持乘法和累加,沒有協處理器指令沒有信號量指令也沒有CPSR指令。
在面臨二者的取舍的時候,同其它無數的案例一樣,發揮各自的長處是最完美的解法。如果系統對性能要求較高,應采用32位的存儲器和ARM指令集,而對功耗和成本要求較高,則應使用Thumb指令集。但是如果兩者結合使用,讓它們充分發揮各自的優點,則會取得更好的效果。
ARM指令的基本格式如下:
其中<>號內的項是必須的,{}號內的項是可選的,opcode為指令助記符;cond是該動作的執行條件;S表示影響CPSR寄存器(程序狀態寄存器)的值,如果不加則表示不影響CPSR的值;Rd表示運算結果的目標寄存器;Rn表示第1個操作數的寄存器;operand2表示第2個操作數,可選。 同時,ARM芯片還支持協處理器,在ARM指令集中有對協處理器的數據操作、數據讀取、數據寫入和CPU與協處理器的寄存器傳送的相應指令。 ARM指令集詳細介紹見附錄A。 2.5 運行Java虛擬機(JVM)解釋Java字節碼這種方式對大多數嵌入式應用來說占用空間過多,運行速度過慢。而系統發展的趨勢及市場的需求決定了Java應用需要有更強的圖形處理能力以及一個強大的Java虛擬機。于是催生出了Jazelle技術,從硬件上對Java虛擬機提供支持。 Jazelle DBX(Direct Bytecode eXecution)是一種硬件架構擴展技術,為ARM處理器引入了第三套指令集—Java字節碼。新指令集建立了一種新的狀態,處理器在此狀態下處理Java字節碼取指令、譯碼和維護Java操作數棧等任務。允許它們在某些架構的硬件上加速執行Java字節碼,就如其他執行模式般,它能在現存的ARM與Thumb模式之間互相切換。為了降低芯片尺寸并提高性能,Jazelle DBX沒有設計成傳統形式的微引擎,而是融入流水線中的一個有限狀態機。如圖2.2所示 Jazelle DBX技術增加了一條新的“Branch-to-Java”指令來進入Java狀態。此指令支持條件執行,先檢查條件標志,如果條件滿足,處理器進入Java狀態,跳轉到指定目標地址,開始執行Java字節碼。在Java狀態下,PC寄存器仍是32位尋址Java字節代碼。字節碼的取指、譯碼分別在兩個流水段完成(對應ARM/Thumb狀態下為一個譯碼流水級)。32位的取指令操作一次性可以取4個Java字節碼,性能優勢十分明顯,對于一個高度優化的商業Java虛擬機,運行評測程序或復雜的MIDP2.0應用,Jazelle DBX技術通常可帶來約2~4倍的性能提升。Jazelle DBX技術允許所有的Java指令是“可重新開始”的。這樣在執行Java指令過程中,即刻響應中斷,從而減少中斷延遲,確保實時性能。 在ARM處理器的Java狀態下,有若干個ARM寄存器可以功能復用(包括棧指針、棧頂四項(top4 elements of stack)、局部變量0等)。正是這些硬件復用設計,才使得只用了很少的額外邏輯(約一萬兩千門)就實現了一個Java機。把所有Jazelle DBX擴展所需的狀態用ARM寄存器保存,也保證了和現有操作系統、中斷處理程序和異常處理代碼的兼容性。把棧頂四項保存在ARM寄存器中也能提高Java性能。大量的程序分析顯示,大多數程序的棧深度是很小的,所以這項策略可以盡量減少內存訪問,硬件也可自動處理棧溢出或下溢。 和Java協處理器或其它專用Java處理器設計不同的是,Jazelle DBX和主處理器共用緩存,這一方面能夠降低功耗,而且還可以提高性能。另一個重要的設計考慮是確保Jazelle DBX技術不會影響實時中斷性能,仍保持與操作系統中已有ARM異常處理代碼的兼容。圖2.3是在加入了Jazelle的ARM處理器中運行Java應用的垂直架構架圖。 圖2.3加入了Jazelle的ARM處理器上的Java應用垂直架構圖
評論