成功實現高性能數字無線電
下面看看MPEG社區開發的AAC格式,以便了解信源編碼涉及到的一些重要技術。“心理聲學模型” (圖3)和 “時域混疊抵消” (TDAC)可以說是寬帶音頻源編碼領域最初的兩大突破性創新。

圖3. 了解心理聲學音調掩蔽
工業界和學術界開發的“頻帶復制”(SBR,圖4)以及 “空間音頻編碼” 或 “雙耳線索編碼” 技術,可以說是隨后的兩大突破性創新。這兩項突破性的關鍵創新進一步增強了AAC技術,使其具有可擴展編碼性能,從而讓HE-AAC v2和MPEG環繞聲環繞聲實現標準化,受到工業界的熱烈歡迎, like Dolby®、 AC3和 WMA®, 等業界主要標準也采取了相似的步驟,以便在最新媒體編碼中利用類似的技術創新。
“頻帶復制” (SBR)工具將解碼采樣速率變為AAC-LC采樣速率的2倍。參數立體聲 (PS) 工具將單聲道LC流解碼為立體聲。

圖4. 音頻解碼中的AAC-LR、SBR和PS
像所有其它改進計劃一樣,測量技術也在音質改進計劃中發揮了重要作用。音質評估工具和標準,如“音質感知評估(PEAQ)”和“隱藏參考和基準的多刺激法”(MUSHRA)等,幫助提高了技術試驗的評估速度。
優雅降級/容錯性
一般而言,對于給定的流錯誤水平,壓縮程度越高,則音頻偽像越多。例如,MPEG Layer II流比AAC流更能容錯。Layer II頻譜數據部分中的單比特錯誤不會造成任何惱人的偽像,因為最大頻譜值由比特分配值決定。AAC則不然,同樣的單比特錯誤會導致霍夫曼解碼器發生故障并應用幀錯誤隱藏,重復的幀錯誤將使音頻靜音,直到錯誤率降至最小值為止。長時間的靜默會使系統無法保證優雅降級。
在以下附加工具的幫助下,容錯(ER) AAC編碼可以保證系統在發生比特流錯誤時優雅降級:
HCR (霍夫曼碼字重排): 通過將頻譜數據劃分為固定大小的數段來防止錯誤在頻譜數據內傳播。HCR將最重要的數據放在各段的起始位置。
VCB11 (編碼本11的虛擬編碼本): 在特殊碼字映射的幫助下檢測頻譜數據內的嚴重錯誤。
RVLC (可逆可變長度編碼):避免比例因子數據中的錯誤傳播。
ER-AAC特性與UEP一起,可以為DRM提供足夠的容錯性。
DRM規范
通用數字無線電(DRM)是歐洲電信標準協會(ETSI)制定的一種開放標準,適用于數字窄帶音頻的中短波廣播。雖然DRM支持4.5 kHz、5 kHz、9 kHz、10 kHz、18 kHz、20 kHz的帶寬及四種收發模式,但若要兼容現有AM標準,帶寬和比特率必須分別以10 kHz和24 kbps為限。
表1. DRM比特率和帶寬
30 MHz時的帶寬 | 帶寬(kHz) | 比特率(kbps) |
標稱帶寬 | 9 to 10 | 8 to 20 |
半帶寬 | 4.5 to 5 | 2 or 4 |
雙倍帶寬 | 18 to 20 | 20 to 80 |
評論