視頻壓縮編解碼標準綜述
(3)通用的訪問性
MPEG-4提供了易出錯環境的魯棒性,來保證其在許多無線和有線網絡以及存儲介質中的應用,此外,MPEG-4還支持基于內容的的可分級性,即把內容、質量、復雜性分成許多小塊來滿足不同用戶的不同需求,支持具有不同帶寬,不同存儲容量的傳輸信道和接收端。
這些特點無疑會加速多媒體應用的發展,從中受益的應用領域有:因特網多媒體應用;廣播電視;交互式視頻游戲;實時可視通信;交互式存儲媒體應用;演播室技術及電視后期制作;采用面部動畫技術的虛擬會議;多媒體郵件;移動通信條件下的多媒體應用;遠程視頻監控;通過ATM網絡等進行的遠程數據庫業務等。MPEG-4主要應用如下:
(1)應用于因特網視音頻廣播
由于上網人數與日俱增,傳統電視廣播的觀眾逐漸減少,隨之而來的便是廣告收入的減少,所以現在的固定式電視廣播最終將轉向基于TCP/IP的因特網廣播,觀眾的收看方式也由簡單的遙控器選擇頻道轉為網上視頻點播。視頻點播的概念不是先把節目下載到硬盤,然后再播放,而是流媒體視頻(streaming video),點擊即觀看,邊傳輸邊播放。
現在因特網中播放視音頻的有:Real Networks公司的 Real Media,微軟公司的 Windows Media,蘋果公司的 QuickTime,它們定義的視音頻格式互不兼容,有可能導致媒體流中難以控制的混亂,而MPEG-4為因特網視頻應用提供了一系列的標準工具,使視音頻碼流具有規范一致性。因此在因特網播放視音頻采用MPEG-4,應該說是一個安全的選擇。
(2)應用于無線通信
MPEG-4高效的碼率壓縮,交互和分級特性尤其適合于在窄帶移動網上實現多媒體通信,未來的手機將變成多媒體移動接收機,不僅可以打移動電視電話、移動上網,還可以移動接收多媒體廣播和收看電視。
(3)應用于靜止圖像壓縮
靜止圖像(圖片)在因特網中大量使用,現在網上的圖片壓縮多采用JPEG技術。MPEG-4中的靜止圖像(紋理)壓縮是基于小波變換的,在同樣質量條件下,壓縮后的文件大小約是JPEG壓縮文件的十分之一。把因特網上使用的JPEG圖片轉換成MPEG-4格式,可以大幅度提高圖片在網絡中的傳輸速度。
(4)應用于電視電話
傳統用于窄帶電視電話業務的壓縮編碼標準,如H261,采用幀內壓縮、幀間壓縮、減少象素和抽幀等辦法來降低碼率,但編碼效率和圖像質量都難以令人滿意。MPEG-4的壓縮編碼可以做到以極低碼率傳送質量可以接受的聲像信號,使電視電話業務可以在窄帶的公用電話網上實現。
(5)應用于計算機圖形、動畫與仿真
MPEG-4特殊的編碼方式和強大的交互能力,使得基于MPEG-4的計算機圖形和動畫可以從各種來源的多媒體數據庫中獲取素材,并實時組合出所需要的結果。因而未來的計算機圖形可以在MPEG-4語法所允許的范圍內向所希望的方向無限發展,產生出今天無法想象的動畫及仿真效果。
(6)應用于電子游戲
MPEG-4可以進行自然圖像與聲音同人工合成的圖像與聲音的混合編碼,在編碼方式上具有前所未有的靈活性,并且能及時從各種來源的多媒體數據庫中調用素材。這可以在將來產生象電影一樣的電子游戲,實現極高自由度的交互式操作。
4.MPEG-7標準
MPEG-7標準被稱為“多媒體內容描述接口”,為各類多媒體信息提供一種標準化的描述,這種描述將與內容本身有關,允許快速和有效的查詢用戶感興趣的資料。它將擴展現有內容識別專用解決方案的有限的能力,特別是它還包括了更多的數據類型。換而言之,MPEG-7規定一個用于描述各種不同類型多媒體信息的描述符的標準集合。該標準于1998年10月提出。
MPEG-7的目標是支持多種音頻和視覺的描述,包括自由文本、N維時空結構、統計信息、客觀屬性、主觀屬性、生產屬性和組合信息。對于視覺信息,描述將包括顏色、視覺對象、紋理、草圖、形狀、體積、空間關系、運動及變形等。
MPEG-7的目標是根據信息的抽象層次,提供一種描述多媒體材料的方法以便表示不同層次上的用戶對信息的需求。以視覺內容為例,較低抽象層將包括形狀、尺寸、紋理、顏色、運動(軌道)和位置的描述。對于音頻的較低抽象層包括音調、調式、音速、音速變化、音響空間位置。最高層將給出語義信息:如“這是一個場景:一個鴨子正躲藏在樹后并有一個汽車正在幕后通過。”抽象層與提取特征的方式有關:許多低層特征能以完全自動的方式提取,而高層特征需要更多人的交互作用。MPEG-7還允許依據視覺描述的查詢去檢索聲音數據,反之也一樣。
MPEG-7的目標是支持數據管理的靈活性、數據資源的全球化和互操作性。
MPEG-7標準化的范圍包括:一系列的描述子(描述子是特征的表示法,一個描述子就是定義特征的語法和語義學);一系列的描述結構(詳細說明成員之間的結構和語義);一種詳細說明描述結構的語言、描述定義語言(DDL);一種或多種編碼描述方法。
在我們的日常生活中,日益龐大的可利用音視頻數據需要有效的多媒體系統來存取、交互。這類需求與一些重要的社會和經濟問題相關,并且在許多專業和消費應用方面都是急需的,尤其是在網絡高度發展的今天,而MPEG-7的最終目的是把網上的多媒體內容變成象現在的文本內容一樣,具有可搜索性。這使得大眾可以接觸到大量的多媒體內容,MPEG-7標準可以支持非常廣泛的應用,具體如下:
(1)音視數據庫的存儲和檢索;
(2)廣播媒體的選擇(廣播、電視節目);
(3)因特網上的個性化新聞服務;
(4)智能多媒體、多媒體編輯;
(5)教育領域的應用(如數字多媒體圖書館等);
(6)遠程購物;
(7)社會和文化服務(歷史博物館、藝術走廊等);
(8)調查服務(人的特征的識別、辯論等);
(9)遙感;
(10)監視(交通控制、地面交通等);
(11)生物醫學應用;
(12)建筑、不動產及內部設計;
(13)多媒體目錄服務(如,黃頁、旅游信息、地理信息系統等);
(14)家庭娛樂(個人的多媒體收集管理系統等)。
原則上,任何類型的AV(Audio-Video)材料都可以通過任何類型的查詢材料來檢索,例如,AV材料可以通過視頻、音樂、語言等來查詢,通過搜索引擎來匹配查詢數據和MPEG-7的音視頻描述。下面給出幾個查詢例子:
音樂:在鍵盤上彈幾個音符就能得到包含(或近似)要求曲調的音樂作品列表,或以某種方式匹配音符的圖象,例如,從情感方面。
評論