新聞中心

        EEPW首頁 > 模擬技術 > 設計應用 > 基于TMS320DM6446的H.264編碼器實現與優化

        基于TMS320DM6446的H.264編碼器實現與優化

        作者: 時間:2009-06-22 來源:網絡 收藏

        幀間預測模式的改進:將當前的16×16宏塊劃分為4個8×8宏塊,分別預測其運動矢量,然后以左右相鄰、上下相鄰的2個8×8塊的運動矢量的差值和閾值相比較為依據,判定是否進行16×8、8×16等分塊模式的預測,最后選擇開銷最小的劃分模式為最佳幀間劃分模式。
        (3)指令級優化 DM一個時鐘周期內可并行運行8條指令,一次可存取64位數據,內部擁有64個32位通用寄存器,并且支持對寄存器中的4個8位字節或2個16位字節分別進行運算處理,這些使得DM具有很強的并行運算能力。視頻圖像的像素尺寸一般是4的倍數,X中像素的值是用8位或16位數據按矩陣形式有規律的存儲,這種數據存儲結構與DM的并行處理方式很契合。因此對X程序進行指令優化充分發揮DM6446的并行運算能力,是提高編碼器速度的關鍵。主要分為以下兩部分:①使用內聯函數優化;C6000編譯器提供了許多內聯函數intrinsics,它們是匯編指令映射的在線函數,不宜用C語言實現其功能的匯編指令都有對應的intrinsics函數。這樣就可在C語言結構中直接使用內聯函數實現對多個數據的并行運算操作。如:未使用內聯函數優化前X程序調用一次雙線性內插函數只能計算一個亞像素點的值,而使用內聯函數_mem4()、_avgu4()等進行優化后,一次可以計算4個亞像素點的值,大大提高了運算速度。②使用線性匯編語言優化:由于線性匯編不需要考慮寄存器分配、指令延遲、并行指令安排等因素。因此可以利用CCS提供的profile分析工具將使用頻率高、耗時多的函數抽取出來,根據事先已知的數據間的相關性等信息,在程序中直接改寫函數匯編,人工優化。涉及的算法有:SAD、SSD的計算;DCT變換;反DCT變換、亞像素搜索等。

        4 實驗結果
        選取具有代表性的視頻序列carphone(人物運動幅度較大)、news(背景變化,人物運動幅度不大)、container(背景簡單,景物運動緩慢)進行編碼。視頻為YUV 4:2:0格式.QCIF,量化步長定為26,共50幀,采用IPPP…編碼模式。DM6446的時鐘頻率為600 MHz。表1為優化后峰值信噪比、消耗時鐘周期、碼率等實驗結果。表2為優化前后編碼時鐘周期對比,I幀編碼速度平均提高了9倍,P幀編碼速度平均提高了11倍。

        以視頻Miss-America為例,研究、對比移植優化后的編碼器在不同的量化步長值(QP)下,圖像的壓縮質量,如圖4所示。

        5 結論
        移植優化后的X264編碼器在CCS環境下可正確編碼,在量化步長值26下編碼圖像質量較高,優化后編碼速度較優化前有明顯提升。介紹的H.264視頻編碼系統的硬件設計,和X264編碼器針對DM6446平臺移植、優化的思路和方法,對構建高效的視頻應用平臺具有一定的參考價值。


        上一頁 1 2 下一頁

        關鍵詞: 6446 TMS 320 264

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 大宁县| 巴林右旗| 黄平县| 徐汇区| 天镇县| 辽阳市| 沈阳市| 涪陵区| 台北市| 德兴市| 措美县| 高雄县| 墨玉县| 宕昌县| 友谊县| 双鸭山市| 东港市| 苏尼特左旗| 南安市| 五常市| 沙田区| 察哈| 易门县| 沅江市| 和龙市| 江华| 谷城县| 长海县| 垫江县| 大宁县| 都兰县| 建始县| 松原市| 唐河县| 葵青区| 井陉县| 宣城市| 腾冲县| 岗巴县| 鹤庆县| 新闻|