基于DSP的數碼相機中的MPEG-4壓縮方案
雖然數碼相機(DSC)投入市場僅幾年時間,但已經使消費類電子成像業發生了翻天覆地的變化。目前,全球售出的相機中大約有三分之一是數碼相機,而且其份額還在穩步上升。隨著多兆象素DSC生成分辨率越來越高的圖像而開始挑戰傳統的膠卷像機,消費類DSC也正提供智能化操作模式,幫助用戶在各種條件下都能拍攝出更好的照片。視頻模式也已經成為消費類DSC的標準功能,使用戶能夠快速拍攝多個照片,以便選擇更好的快照,同時也使他們能夠保存重大事件的簡短剪輯。此外,DSC也開始與手機集成在一起,實現靜止圖片與剪輯隨時隨地的快速傳輸。
隨著瞬息萬變的DSC市場不斷分化,開發商必須不斷充分利用技術創新的優勢來細分其產品。當今其中一項創新就是在基于高性能數字信號處理器(DSP)的消費類DSC中引入MPEG-4視頻壓縮技術。MPEG-4標準使DSC能夠有效提供視頻及其他操作模式,增加所存儲視頻剪輯的數量,并支持視頻圖像強大可靠的傳輸。DSP可以提供低價位相機產品中MPEG-4編碼以及解碼所需要的計算性能,尤其那些具備支持快速圖像處理架構的DSP更是如此。可編程性使開發商在整個DSC產品線中使用相同的DSP平臺,從而通過軟件優化不同產品的成像管道(imagepipe)。
新的壓縮標準
DSC傳統依賴于JPEG壓縮標準,其設計用于存儲靜止圖像,并且已通過互聯網而廣為流行。在壓縮中,JPEG采用離散余弦變換(DCT)與量化技術有效地從包含8×8象素陣列的最小編碼單元(MCU)的數據描述中消除大部分空間冗余。然后此算法采用熵或可變長度編碼(VLC)技術進一步減少存儲與傳輸的圖像數據。圖像解壓的步驟則與此相反。根據圖像內容,盡管壓縮比隨圖像的不同而不同,但是JPEG算法一般情況下可以將象素數據壓縮一個數量級而不丟失視覺完整性。
用于動畫與視頻的各種MPEG標準采用與JPEG相同的幀內技術入手來壓縮基本的靜止圖像或I幀,然后采用附加的幀間技術以消除隨后幀中的暫時冗余。幀間技術事實上涉及將每個連續幀的16×16象素宏塊壓縮到上一個幀的宏塊,然后采用運動估計與補償技術來描述宏塊的幀到幀移動。這些預測幀或P幀只需要描述其從上一幀的改變。然后以應用所決定的間隔定期對I幀進行編碼。
圖1說明了一般MPEG視頻壓縮中所涉及的步驟。圖像頂部從輸入到輸出的幀內壓縮步驟(DCT、量化與VLC)足以生成I幀。為了創建P幀,剛編碼的幀必須在本地幀緩沖器中被解碼并存儲,以便實現過去幀的逐塊壓縮到未來幀(即運動估計),從而實現幀間壓縮。視頻解碼涉及圖下部的步驟(逆量子化、反向DCT、運動補償)。除了圖中所示之外,MPEG標準還具有采用獨立流程的音頻壓縮-解壓算法。
圖1:MPEG視頻壓縮流程圖。
MPEG-4:多媒體標準
MPEG標準在不斷發展,以適應新興的視頻應用。最初的MPEG-1標準開發用于大容量存儲與系統檢索,例如:交互式CD-ROM以及VCD。此后,在MPEG-2中對該標準進行了修改,以支持更高的分辨率、更廣泛的格式以及與HDTV相關的數字編碼。由于在DVD中的應用,MPEG-2更受青睞。在視頻數據庫的要求所驅動下,MPEG-7標準規定了用于信息搜索的內容表述。
MPEG-4開發用于交互式多媒體應用,其中包括那些通過無線連接提供的多媒體應用。它與基本H。263視頻壓縮標準共享算法。與早期的MPEG標準相比,MPEG-4為更高密度的圖像提供了更好的壓縮,并為更強大可靠的傳輸提供了更高的容錯彈性(errorresilience)。另外,MPEG-4支持在幀中引入對象類型,從而可以獨立規定、壓縮、傳輸和重新組合不同的圖像及圖形單元。但是,該標準的對象支持功能仍有待開發切實可行的實施方案。到那時,包括DSC在內的大部分MPEG-4應用可以繼續基于通常情況下與圖像的完整矩形幀對應的單個對象。
評論