新聞中心

        EEPW首頁 > 嵌入式系統 > 設計應用 > 基于ARM946E處理器的MP3解碼優化設計

        基于ARM946E處理器的MP3解碼優化設計

        作者: 時間:2009-05-21 來源:網絡 收藏

        根據硬件特點,對實時性要求較高的關鍵程序進行C語言和ARM級代碼
        4.1 減計數循環體
        IMDCT和子帶合成濾波器組2個運算量最大部分中有多個循環體運算,為了提高執行效率,推薦使用減計數循環體。
        如表3所示,對于固定次數的循環,減計數循環比增計數循環速度快。這是因為每次增計數循環體外加3條指令,而減計數循環體外只有2條指令,減循環終止條件為減計數到零,而不是計數增加到某個特定的限制值。由于減計數結果已存儲在指令條件標志里,省去與零比較指令。

        本文引用地址:http://www.104case.com/article/152480.htm

        4.2 和內嵌
        算法中定點化乘法都是通過函數調用來實現,每次調用需要開銷23~28個時鐘周期,其中超過15個周期用于函數調用時PC指針以及寄存器壓棧保護上。采用方式(使用關鍵字_inline聲明)或宏指令,在編譯階段代碼段將被直接展開。另外armcc編譯器允許在C源程序中使用內嵌(但代碼可移植性差),使用包括匯編的內嵌函數,可以使編譯器支持通常不能有效使用的ARM指令和方法,例如C編譯器不支持的ARM v5E擴展指令。使用結合內嵌匯編實現移位乘法,可使平均時鐘周期縮短為6~8個。
        4.3 ARM DSP擴展指令的運用
        支持ARMDSP擴展指令,主要包括3個類型:
        (1)單周期的16×16和32×16 MAC操作;
        (2)對原有的算術運算指令增加了飽和處理擴展;
        (3)前導零(CLZ)運算指令,提高歸一化、浮點運算以及除法操作的性能。
        ARM不支持浮點運算,經過測試及分析,定點運算中數值的截斷誤差選擇為28 b,其可以達到較好的音質,不會因為爆音過多而影響播放效果。
        完成類似的乘法功能,ARM的SMULL(32×32)指令需要3個周期,而ARMDSP擴展指令SMULWT(32×16)只需要1個周期。從數據的準確性上分析,由于乘數的精度為16 b,最終結果有些差異,但由于運算都是28 b的定點數值的,所以通常的運算都是一個運算結果跟某一個固定定點表中的數據相乘的。若選擇固定定點表中數據的高16 b數據進行運算,運算的結果誤差在1 b以內。
        為了驗證使用ARMDSP擴展指令的效果,在系統120 MHz主頻下,以128 Kb/s的壓縮速率進行編碼測試,采用的測試文件如表4所示。

        上述3個測試文件的比特率均為128 Kb/s,使用這三首MP3歌曲進行解碼分析結果如圖3所示。

        實驗表明,使用ARMDSP擴展指令比使用ARM一般指令解碼性能平均提高17.5%,主觀聽覺上音質效果無差異。


        5 結 語
        這里充分利用處理器的DSP擴展指令特點提高程序代碼的執行效率,對3個關鍵模塊:Huff-man解碼,IMDCT運算,合成子帶濾波進行算法優化及簡化處理,減少了各模塊的運算量,同時從C語言和ARM匯編層次來優化代碼,取得了較好的實時MP3解碼效果。


        上一頁 1 2 3 下一頁

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 景东| 东方市| 孟津县| 西昌市| 曲水县| 蒙山县| 读书| 壤塘县| 桦南县| 南华县| 玉门市| 巩留县| 青冈县| 新昌县| 浙江省| 徐汇区| 化州市| 开封县| 青阳县| 高安市| 金溪县| 柏乡县| 肃宁县| 东乡族自治县| 永嘉县| 斗六市| 克拉玛依市| 杂多县| 营山县| 永城市| 扶余县| 马尔康县| 大悟县| 健康| 郴州市| 波密县| 临漳县| 永安市| 石门县| 南江县| 陆良县|