基于DSP和FPGA的視頻編碼器
2 視頻壓縮算法優化
(1)MPEG-4數據流優化設計
實驗表明,如果代碼和代碼要訪問的數據在C6201片內存儲區(PRAM和DRAM),其代碼執行速度要比代碼和數據在片外同步SDRAM中平均快17倍(片內總線寬度為256位,數據訪問為1個CPU周期)。因此,將執行代碼和數據放到片內將大大提高程序的運行速度。
在MPEG-4算法中,由于沒有考慮存儲器的限制,算法每次讀入一幀YUV數據進行壓縮編碼。但對于C6201來說,片內只有64K字節DRAM,不可能一次將一幀數據讀到片內存儲器進行壓縮。如果將一幀數據一次讀到片外存儲器(SDRAM)中進行壓縮,又會大大降低代碼的執行速度,因此,我們對視頻壓縮算法進行了改進,一次對一個切片(slice)數據進行壓縮編碼,并將壓縮碼流數據直接送入到發送緩沖區中。
編碼器一次將一個切片的YUV數據(當前幀)讀入到片內存儲器中,然后根據計算決定切片宏塊的編碼類型(幀內/幀間編碼)。如果宏塊進行幀內編碼,則YUV數據被分成8×8的像素塊(一個宏塊包含4個Y分量像素塊和2個UV分量像素塊)進行DCT變化,以消除圖像空間冗余信息。DCT變化后的系數經過量化后進行游程編碼(RunLengthCoding即RLC)和變長編碼(VariableLengthCoding,即VLC),變長編碼的結果送入到視頻發送緩沖區中。與此同時,量化后的DCT系數經過反量化(結果放入內存B中)和反DCT過程形成重建幀,重建幀用作下一幀的參考幀。
如果宏塊進行幀間編碼,則以宏塊為單位進行運動估計,根據運動估計的結果建立預測幀。當前幀和預測幀的差值形成了殘差幀(residue frame),殘差幀的編碼過程與幀內編碼過程相同。
(2)宏塊編碼類型判別算法
在MPEG-4算法中采用了快速運動估計算法,但是在進行宏塊編碼類型判別時計算量仍然很大。為此,本文提出了基于宏塊空間復雜度的判別算法MTJBSC,進一步降低了運動估計過程中的計算量。
在編碼P幀宏塊的時候,首先要決定宏塊是進行幀內編碼還是幀間編碼。在標準MPEG-4算法中是通過以下方法決定的[5]:
設參考宏塊的像素值(Y分量值,以下同)用P(x,y)表示,當前宏塊的像素值用C(x,y)表示,x,y表示宏塊的縱、橫坐標,M,N表示宏塊的寬和高。當前宏塊像素值的方差用EVAR表示,其值為
參考宏塊和當前宏塊的方差用EVMC表示,其值為
EVMC值越小(比如EVMC if(EVMC>EVARandEVMC≥9)then幀內編碼else幀間編碼 顯然,在MPEG-4算法中,為了判斷宏塊的編碼模式進行了大量的計算(對于每一個P幀宏塊都要進行上面的計算)。為了減少計算復雜度,本文提出了基于宏塊空間復雜度(EMBC)的宏塊類型判斷(MTJBSC)算法,用以判斷P幀宏塊的幀內/幀間編碼模式。 定義宏塊的空間復雜度為水平方向上相鄰像素差值的絕對值之和,即 在基于幀間差原理進行視頻壓縮的MPEG標準中,一般都是采用絕對差總合(ESAD)來進行運動估計的。在MPEG標準中,宏塊的ESAD值定義為 式中:m,n為該宏塊的運動向量。 根據上述定義,MTJBSC算法可簡單描述為: 如果宏塊的ESAD小于其EMBC,則該P幀宏塊進行幀間編碼;否則進行幀內編碼。實驗表明,在壓縮質量和壓縮輸出碼率均沒有大的變動的情況下,該算法有效降低了視頻編碼器的計算復雜度,編碼器的壓縮幀率(f/s)得到明顯提高。
評論