新聞中心

        EEPW首頁 > 嵌入式系統 > 設計應用 > ARM體系結構研究

        ARM體系結構研究

        作者: 時間:2016-11-28 來源:網絡 收藏
        2.1構對多媒體信號處理的支持——NEON

        本文引用地址:http://www.104case.com/article/201611/322741.htm

        隨著電子消費品市場上,屏幕、觸屏越來越大,像素、幀數、分辨率越來越高,各種無線通信擴展雨后春筍般此起彼伏,處理器的處理能力越來越受到這些多媒體應用的考驗。在這樣的背景下,ARM芯片推出了自己的解決方案——NEON。

        NEON技術是ARM公司2004年發布的媒體和信號處理技術,可以加速多種類型的多媒體應用,適用于手機和消費娛樂電子,可靈活地實現多種視頻編/解碼、三維圖像、語音處理、音頻解碼、圖像處理和基帶功能。該技術已經應用在了Cortex-A系列的ARM處理器中,同時獲得了ARM和第三方工具提供商的廣泛支持,適用于高端多媒體設備。

        NEON技術使用64/128位單指令多數據流(SIMD)指令集,能同時執行高達16個操作,用于新一代媒體和信號處理應用加速,其編程接口簡單,性能十分優異,功耗非常小。在NEON技術下執行MP3音頻解碼器,CPU頻率可低于10MHZ;運行GSM AMR語音數字編解碼器,CPU頻率僅為13MHZ,和其它專業的DSP處理器相比較,NEON能獲得更低的功耗和更簡單的編程接口。NEON支持8位、16位、32位、64位整數及單精度浮點SIMD操作,以進行音頻/視頻、圖像和游戲處理,滿足現代電子消費品的需求。

        NEON實際上是ARM的SIMD(Single Instruction Multiple Data)技術的延續,其實就是ARM處理器中的向量處理功能。而且它同其它處理單元共享CPU的資源,如:整數操作、循環控制、Caching等,顯著減小了處理器的面積和功耗,同時又簡化了編程環境,不用控制一些特定硬件加速器的并發訪問和數據規整性維護。這是NEON體系結構同硬件加速器相比最顯著的優點。

        NEON的指令集對于編譯器來說是十分友好的。它包括了高效的Promotion/Demotion操作和結構(Structure)的加載與寫入而不用強行的向量對齊(Vector Alignment)。

        在NEON擴展里,數據被組織在非常長的寄存器中,而這些寄存器可以以8、16、32、64位來提供和貯存數據,而具體用多少位來處理他們是通過在指令中顯示指定的。這與x86體系結構中的AX,AL,AH的關系類似。



        圖2.4 NEON中的向量寄存器邏輯示意圖

        上圖中的三個寄存器向量其實都是同一個128為的寄存器,程序開發人員可以將它當做4個32位的寄存器向量來使用,也可以當做8個16位向量或者16個8位向量來使用。下面具一個具體的例子加以說明。指令VADD.I16 D0,D1,D2


        圖2.5 NEON中16位向量相加示意圖

        上圖中為將D1向量加上D2向量之后將值存入D0向量的邏輯示意圖,在指令中VADD.I16表示該操作的每一個操作元為16位。

        在編程中我們經常會遇到數據位數的轉換,有時你需要將一個long型的數據降級為int,有時你有需要將int型提升為long型。而在NEON體系中提供了對數據轉換的指令集支持。下面舉個例子說明。指令:VSHR.I16.I32 D0,Q1,#5


        圖2.6 NEON中demotion示意圖

        這個例子將一個4個32位元素的128位寄存器每個元素右移5位之后截取16位存至64位的D0中。指令中的I16.I32指定了這種數據降級(demotion)。

        同時NEON還支持一種緩存友好的structure load/store功能,該功能能夠一次加載一個結構數組,從而可以更好的利用緩存,同時也可以使代碼的結構邏輯清晰。還是舉個例子來說明。指令VLD3.16 {D0,D1,D2},{R0}


        圖2.6 NEON中對于結構體的指令集支持

        圖中將內存中的一個結構數組分別裝入三個寄存器向量中,向量與向量見的同一個索引位構成了一個完成的結構(圖中表示的是屏幕的三像素)。

        2.2構與Atom的比較

        Atom處理器,是Intel從2008年才推出的一款面向上網本、入門級PC(Entry Level PC)、Tablet PC、智能手機以及其他一些手持設備的處理器,由此可見,Intel的Atom架構瞄準的市場是已經被ARM稱霸已久的移動計算領域,兩方的戰爭可見一斑。而至今為止經歷了四次重大的革新。

        1)2008年3月——初次亮相,主要面向移動internet設備(Mobile Internet Devices),提供低功耗的電源方案。

        2)2009年9月——Intel宣布了基于45nm技術的Intel Atom Processor CE4100,向一組為Interactive TV而設計的消費性電子產品多媒體處理器提供了了最新的System on Chip【1】芯片。、

        3)2010年1月——Intel發布了它最新的額Intel Atom Processor,專門為上網本而設計,芯片上集成了一個內存控制器,一個圖形處理器,在減小了系統,降低了功耗的基礎上同時提高了性能。


        上一頁 1 2 下一頁

        關鍵詞: ARM體系結

        評論


        技術專區

        關閉
        主站蜘蛛池模板: 南城县| 宣威市| 西藏| 长乐市| 营口市| 彝良县| 西平县| 库车县| 彭泽县| 禹州市| 洛隆县| 日土县| 康马县| 城口县| 庄浪县| 略阳县| 荔波县| 晴隆县| 江津市| 虞城县| 崇阳县| 北安市| 锡林浩特市| 宁强县| 绥阳县| 合山市| 东阳市| 中西区| 广东省| 佳木斯市| 临猗县| 玉树县| 嵊泗县| 绵阳市| 安平县| 农安县| 株洲县| 海口市| 营山县| 本溪| 太仆寺旗|