ARM9系列處理器—嵌入式處理器
新一代的ARM9處理器,通過全新的設計,采用了更多的晶體管,能夠達到兩倍以上于ARM7處理器的處理能力。這種處理能力的提高是通過增加時鐘頻率和減少指令執行周期實現的。
1 時鐘頻率的提高
ARM7處理器采用3級流水線,而ARM9采用5級流水線。增加的流水線設計提高了時鐘頻率和并行處理能力。5級流水線能夠將每一個指令處理分配到5個時鐘周期內,在每一個時鐘周期內同時有5個指令在執行。在同樣的加工工藝下,ARM9TDMI處理器的時鐘頻率是ARM7TDMI的1.8~2.2倍。
2 指令周期的改進
指令周期的改進對于處理器性能的提高有很大的幫助。性能提高的幅度依賴于代碼執行時指令的重疊,這實際上是程序本身的問題。對于采用最高級的語言,一般來說,性能的提高在30%左右。
2.1 loads 指令矛n stores指令
指令周期數的改進最明顯的是loads指令和stores指令。從ARM7到ARM9這兩條指令的執行時間減少了30%。指令周期的減少是由于ARM7和ARM9兩種處理器內的兩個基本的微處理結構不同所造成的。
(1)ARM9有獨立的指令和數據存儲器接口,允許處理器同時進行取指和讀寫數據。這叫作改進型哈佛結構。而ARM7只有數據存儲器接口,它同時用來取指令和數據訪問。
(2)5級流水線引入了獨立的存儲器和寫回流水線,分別用來訪問存儲器和將結果寫回寄存器。
以上兩點實現了一個周期完成loads指令和stores指令。
2.2 互鎖(interlocks)技術
當指令需要的數據因為以前的指令沒有執行完而沒有準備好就會產生管道互鎖。當管道互鎖發生時,硬件會停止這個指令的執行,直到數據準備好為止。雖然這種技術會增加代碼執行時間,但是為初期的設計者提供了巨大的方便。編譯器以及匯編程序員可以通過重新設計代碼的順序或者其他方法來減少管道互鎖的數量。
2.3 分枝指令
ARM9和ARM7的分枝指令周期是相同的。而且ARM9TDMI和ARM9E-S并沒有對分枝指令進行預測處理。
3 ARM9結構及特點
以ARM9E-S為例介紹ARM9處理器的主要結構及其特點。ARM9E-S的結構如圖4所示。其主要特點如下:
(1)32bit定點RISC處理器,改進型ARM/Thumb代碼交織,增強性乘法器設計。支持實時(real-time)調試;
(2)片內指令和數據SRAM,而且指令和數據的存儲器容量可調;
(3)片內指令和數據高速緩沖器(cache)容量從4K字節到1M字節;
(4)設置保護單元(protcction unit),非常適合嵌入式應用中對存儲器進行分段和保護;
(5)采用AMBA AHB總線接口,為外設提供統一的地址和數據總線;
(6)支持外部協處理器,指令和數據總線有簡單的握手信令支持;
(7)支持標準基本邏輯單元掃描測試方法學,而且支持BIST(built-in-self-test);
(8)支持嵌入式跟蹤宏單元,支持實時跟蹤指令和數據。
4 ARM9的典型應用
TI公司的OMAP730是最新的無線通信基帶信號處理器。該處理器是TI的GPRS Class 12通信模塊與專用于應用處理的ARM926通用處理器(GPP)的集成。由于GPP的速度可達200MHz,因此OMAP730具有兩倍于上一代OMAP710處理器的應用處理性能。如同所有的OMAP處理器一樣,OMAP730可支持領先的移動操作系統,其中包括Microsoft的智能電話與Pocket PC PhoneEdition、Svmbian OS與Series 60、Palm OS以及Linux。
評論