新聞中心

        EEPW首頁 > 消費電子 > 設計應用 > 多聲道數字音頻系統的編碼及應用

        多聲道數字音頻系統的編碼及應用

        作者: 時間:2009-06-17 來源:網絡 收藏
        1、前言
        對于CD格式來說,大家都知道它具有良好的信噪比、超過80dB以上的動態范圍以及超過15kHz的頻率范圍,這使得它具有良好的質量和滿意的收聽效果,但是它僅僅提供了兩個。多通過的擴展,不僅在質量上與CD不相上下,同時還帶給聽眾身臨其境的感受,而這是傳統單聲道和立體聲無法實現的,因此多聲道音頻已被更多的聽眾接受,同時也逐漸成為

        圖2、傳輸、人耳聽音的實現
        2.1根據聽覺域度對可聞信號進行
          人耳對聲振動的感受,在頻率及聲壓級方面都有一定的范圍,頻率范圍正常人約為20Hz~20kHz,而聲壓級范圍則是如圖聽閾曲線來描述的。意即在這條曲線之下的對應頻率的信號是聽不到的。
        圖16MPEG-2音頻混合后環繞聲兼容性如圖3所示,對于信號A來說,由于其聲壓級超過聽閾曲線的聲壓級域值,所以可以對人耳造成聲振動的感
        受,意即聽到A信號。而對B信號來說,其聲壓級位于聽閾曲線之下,雖然它是客觀存在的,但人耳是不可聞的。因此,可以將類似的信號去除掉,以減少音頻數據率。
        2.2根據掩蔽效應,只對幅度強的掩蔽信號進行
        人耳能在寂靜的環境中分辨出輕微的聲音,但在嘈雜的環境中,同樣的這些聲音則被嘈雜聲淹沒而聽不到了。這種由于一個聲音的存在而使另一個聲音要提高聲壓級才能被聽到的現象稱為聽覺掩蔽效應。
        如圖4所示,雖然B、C兩信號的聲壓級已超過聽閾曲線的范圍,人耳已可以聽到B、C兩信號的存在,但是由于A信號的存在,通過前向掩蔽將C信號淹沒掉,通過后向掩蔽將B信號淹沒掉,從而最終到達人耳引起感覺的只有A信號。因此,可以將類似的B、C信號去除掉以減少音頻數據率。
        2.3量化噪聲使得不必全部編碼原始信號
        類似于人耳的聽閾曲線,由于信號存在著量化噪聲,如圖5所示,對于信號A和B來說,并不一定要將A、B信號進行全部幅度的編碼,而只需將A、B信號與量化噪聲的差值進行編碼就可以達到相同的聽覺效果,因此,在編碼過程中實際量化幅度就可以大大的減少,而減少數據率。


        2.4通過子帶分割來進行優化、編碼
        在傳統的編碼過程中,都是將整個頻帶作為操作對象,采用相同的比特分配對每個信號進行量化。而實際上,由于聽覺曲線的存在及其它因素,對于幅度較小的信號可以分配較少的比特數就可以達到要求,因此將整個頻帶分成多個子頻帶,然后對每個子頻帶的信號獨立編碼,從而使得在每個子頻帶中比特分配可以根據信號自身來適應。
        如圖ABCD四個信號,如果對整個頻帶編碼,對于D信號來說分配16比特來量化則顯得多余浪費,所以如果將ABCD分別置于不同的子帶內,則可在分別所處的子帶內使用最適合的比特數分配給信號來編碼,從而減少數據率,同時如果用于分割的子帶分辨率越高,意即子帶的頻帶相對越窄,那么在子帶中分配的比特數
        就越精確,而減少了比特率。
        2.5不同的實現方式
        當前在數字音頻編碼領域存在著各種不同的編碼方案和實現方式,為了能夠讓大家對此有一個較完整的認識,在本文中僅對當前流行的幾種典型的編碼方法做一個介紹。不管是通過那一種方式實現,其基本的編碼思路方框圖都大同小異,如圖7所示。對于每一個音頻聲道中的PCM音頻信號來說,首先都要將它們映射到頻域中,這種時域到頻域的映射可以通過子帶濾波器(如MPEGLayersI,II,DTS)或通過變換濾波器組(如AC-3,MPEGAAC)實現。這兩種方式的最大不同之處在于濾波器組中的頻率分辨率的不同。
        每個聲道中的音頻采樣塊首先要根據心理聲學模型來計算掩蔽門限值,然后由計算出的掩蔽門限值來決定如何將公用比特區中的比特分配給不同的頻率范圍內的信號,如MPEGLayersI,II,DTS所采用;或由計算出的掩蔽門限值來決定哪些頻率范圍內的量化噪聲可以引入而不需要去除,如AC-3,MPEGAAC所采用。
        然后根據音頻信號的時域表達式進行量化,隨后采用靜噪編碼(如MPEGLayersI,II,DTS,MPEGAAC)。最后,將控制參數及輔助數據進行交織產生編碼后的數據流。解碼過程則首先將編碼后的數據流進行解復用,然后通過比特流中傳輸的控制參數對音頻數據反量化,或通過心理聲學模型參數反向運算得到音頻信號(如AC-3),最后將得到的音頻信號由頻域反變換到時域,完成解碼過程。
        另外多聲道數字音頻編碼技術還充分利用了聲道之間的相關性及雙耳聽覺效應,來進一步去除聲道之間的冗余度和不相關度。去除通道之間的相關度,一種最常用的方法是M/S方式,在這種方式中是將兩個獨立聲道的頻譜相加和相減,根據兩個聲道的相關度大小,來決定是傳輸和/差信號還是傳輸原始信號。
        由于人耳對于頻率超過2-3kHz的聲音定位主要是通過內耳密度差分(IID)實現的,因此為了進一步減少數據率,將各個聲道中頻率超過約定門限值的信號組合后再進行傳輸。這種技術在MPEGLayersI,II,III中,實現強度立體聲編碼;用在AC-3中對兩個聲道或耦合聲道實現多聲道編碼。在MPEGAAC中,則既可實現強度立體聲編碼,又可實現多聲道編碼。
        1、杜比數字AC-3編解碼壓縮過程
        AC-3最早是在1991年的電影“BatmanReturns”中的。它的不僅在電影界占有一席之地,而且它已被北美地區的數字電視及DVD視頻定為其數字音頻實施規范。我們熟知的AC-2,AC-3都是由兩聲道發展而來的,即杜比數字(DolbyDigital)。對于數字音頻信號來說,通過應用數字壓縮算法,來減少正確再現原始脈沖編碼調制(PCM)樣本所需要的數字信息量,得出原始信號經數字壓縮后的表達式。
        3.1AC-3編碼過程
        AC-3編碼器接受PCM音頻并產生相應的AC-3數碼流。在編碼時,AC-3算法通過對音頻信號的頻域表達式進行粗量化,達到高的編碼增益(輸入碼率對輸出碼率之比)。如圖8所示。
        編碼過程的第一步是把音頻表達式從一個PCM時間樣本的序列變換為一個頻率系數樣本塊的序列。這在分析濾波器中完成。512個時間樣本的相互重疊樣本塊被乘以時間窗而變換到頻域。由于相互重疊的樣本塊,每個PCM輸入樣本將表達在兩個相繼的變換樣本塊中。頻域表達式則可以二取一,使每個樣本塊包含256個頻率系數。這些單獨的頻率系數用二進制指數記數法表達為一個二進制指數和一個尾數。這個指數的集合被編碼為信號頻譜的粗略表達式,稱作頻譜包絡。核心的比特指派例行程序用這個頻譜包絡,確定每個單獨尾數需要用多少比特進行編碼。將頻譜包絡和6個音頻樣本塊粗略量化的尾數,格式化成一個AC-3數據幀(FRAME)。AC-3數碼流是一個AC-3數據幀的序列。
        在實際的AC-3編碼器中,還包括下述功能:
        l附有一個數據幀的信頭(header),其中包含與編碼的數碼流同步及把它解碼的信息(比特率、取樣率、編碼的信道數目等)。
        l插入誤碼檢測碼字,以便解碼器能檢驗接收的數據幀是否有誤碼。
        l可以動態的改變分析濾波器組的頻譜分辨率,以便同每個音頻樣本塊的時域/頻域特性匹配的更好。
        l頻譜包絡可以用可變的時間/頻率分辨率進行編碼。
        l可以實行更復雜的比特指派,并修改核心比特分派例行程序的一些參數,以便產生更加優化的比特指派。
        l一些聲道在高頻可以耦合在一起,以便工作在較低比特率時,可得到更高的編碼增益。
        l在兩聲道模式中,可以有選擇的實行重新設置矩陣的過程,以便提供附加的編碼增益,以及當兩信道的信號解碼時使用一個矩陣環繞聲解碼器,還能獲得改進的結果。發展是從85年以后開始的,其中包括了我們熟知的Eureka147DAB(尤里卡147數字音頻廣播)和DVB。不斷發展的數字調制方式及編碼算法都為數字音頻廣播提供了更加有效的傳輸和存儲方式,使得在有限的帶寬中以較低比特率來傳輸聲道數更多、質量更優的音頻信號成為可能。同樣在數字音頻廣播的發展中也充分利用了這些以此為核心的新技術。以前,立體聲廣播起著主導的作用,現在隨著越來越多的多聲道數字音頻系統的應用,在數字音頻廣播領域也已經開始接納并制定相關的音頻標準了。在Eureka147DAB和DVB中,已經包括了多聲道數字音頻的擴展。
        7.1
        Eureka147DAB國際協議是于1986年由16個歐洲成員組織為制定數字音頻廣播標準而制定的標準規范。隨后又有一些新的組織機構加入到這項協議工作中去,并于1995年形成了第一個DAB的標準。在同一年中,世界范圍的DAB論壇也相繼成立,它們的目標就是促進世界各地更多的組織機構采用以Eureka147DAB為藍本的數字音頻廣播的實現。
        Eureka147DAB系統的設計是用來取代現行的FM廣播業務的,它采用COFDM(編碼正交頻分復用)以便于更好地進行移動接收和克服多徑效應,載波采用DQPSK(差值正交相移鍵控)進行調制,通道編碼采用卷積編碼,以滿足可調整碼率的需要。
        Eureka147DAB系統使用1.536MHz的頻譜帶寬來傳輸最大不超過1.5Mb/s的數據,因此對于多聲道來說, 如為6個聲道,則每個聲道的數據率最大不超過256kb/s。對于聲道如何分配及使用,則是根據節目數量/ 數據業務與音頻質量來折衷考慮的。由于早期的Eureka147DAB源編碼的發展沒有反映出當前最新發展的技術,同時由于歷史原因及DAB標準由歐洲制定,而歐洲長期以來都采用的是MPEG技術,考慮到兼容等問題,因此DAB系統中音頻編碼系統采用的是MPEGLayerII編碼方案。不能說MPEGLayerII編碼方案有什么不好,但是如果我們綜觀當前多聲道數字音頻系統的最新發展,不難看出,有更多更好的方案可以被采用,如在提高聲音質量上可采用DTS系統,在增加聲道數目上可采用MPEGAAC系統。
        7.2
        DVB項目是在1993年由220多個世界組織來制定建立的。這些世界組織包括廣播業者、制造商、網絡管理者和致力于發展數字電視標準的各種組織機構。最早的DVB業務是在歐洲開始的,現在DVB標準不僅是歐洲的數字電視標準,而且它也擴展到亞洲、非洲、美洲及澳大利亞等地區,成為這些地區數字電視的選擇標準之一。與此不同的美國采用的是ATSC系統。
        在DVB的標準中規定了三個子系統:DVB-S(衛星)、DVB-C(有線)和DVB-T(地面)系統。DVB-S系統是一種單載波系統,是最早實現的DVB標準,它是建立在正交相移鍵控(QPSK)調制和通道編碼(卷積編碼和里得-所羅門塊編碼)的基礎之上的,典型的碼率為40Mb/s左右。DVB-C系統是以DVB-S系統為基礎建立的,不同的是它采用QAM(正交調幅)調制方式,取代了用于DVB-S中的QPSK調制方式。在DVB-C中如果使用64點QAM調制,則可以實現在8MHz的帶寬中傳輸38.5Mb/s的數據。DVB-T系統與以上兩者都不同的是采用了COFDM的調制方式,而通道編碼則與前兩者基本相同。在DVB-T系統中,可以實現在7MHz的帶寬中傳輸19.35Mb/s的數據。
        DVB系統的源編碼是建立在MPEG-2視頻和MPEG-2系統標準上的。同時在DVB中也提供了與立體聲相兼容的多聲道數字音頻系統。同樣由于歷史及其他一些原因,在DVB音頻部分中仍然采用的是MPEGLayerII多聲道數字音頻系統,在DVB的標準中也同時規定可以采用靈活性更大、質量更高,超過MPEGLayerIIMC系統的多聲道數字音頻系統作為DVB的音頻部分。
        總之,隨著數字廣播的不斷發展,相信這些已經成熟的各種技術都將有它們各自的用武之地。
        8、結語
        在本文中,我們主要討論了當前較流行、較成熟的幾種多聲道數字音頻系統,同時也對它們所采用的編碼方法的主要技術做了詳盡的分析比較。隨著存儲媒體及傳輸帶寬技術的不斷發展,相信多聲道數字音頻系統會逐漸取代傳統的如CD格式的音頻系統;同樣應用于多聲道數字音頻系統中的音頻編碼及傳輸方案也會不斷的進行更新、發展。更多聲道的實現及更高質量的音頻系統實現都會成為可能,如新建立的DVD-Audio音頻技術中的編碼方案已遠遠超越了PCM音頻方式。
        總而言之,我們相信在今后的數字廣播的發展中,不管是DVB、DAB、數字視頻、音頻廣播,還是ATSC數字電視系統等,都將會采用不受帶寬限制(相對而言)、可提供更高質量、更多聲道的多聲道數字音頻系統。

        本文引用地址:http://www.104case.com/article/166943.htm

        3.2AC-3解碼過程
        解碼過程基本上是編碼的逆過程。解碼器必須同編碼數碼流同步,檢查誤碼,以及將不同類型的數據(例如編碼的頻譜包絡和量化的尾數)進行解格式化。運行比特指派例行程序,將其結果用于解數據大包(unpack)和尾數的解量化。將頻譜包絡進行解碼而產生各個指數。各個指數和尾數被變換回到時域成為解碼的PCM時間樣本。

        在實際的AC-3解碼器中,還包括下述功能:
        l假若檢測出一個數據誤碼,可以使用誤碼掩蓋或靜噪。
        l高頻內容耦合在一起的那些聲道必須去除耦合。
        l無論何時已被重新設置矩陣的聲道,必須進行去除矩陣化的過程(在2-聲道模式中)。
        l必須動態的改變綜合濾波器組的分辨率,與編碼器分析濾波器組在編碼過程中所用的方法
        相同。
        3.3杜比數字AC-3編碼數據格式
        經過杜比數字AC-3編碼器的編碼處理,可以將原始的數據PCM信號編碼為杜比數字AC-3音頻數據流。一個AC-3串行編碼的音頻數據流是由一個同步幀的序列所組成。如圖10所示。



        由圖可見,每個同步幀包含六個編碼的音頻樣本塊(AB)其中每個代表256個新的音頻樣本。在每個同步幀開始的同步信息(SI)的信頭中,包含為了獲得同步和維持同步所需要的信息。接著SI后面的是數碼流信息(BSI)的信頭;它包含描述編碼數據流業務的各種參數。編碼的音頻樣本塊之后接 著是一個輔助數據(AUX)字段。在每個同步幀結尾處是誤碼檢驗字段,其中包含一個用于誤碼檢測的CRC字。一個附加的CRC字位于SI信頭中,以供選用。
        AB0~AB5的每一塊代表一個編碼通道,可以被分別獨立解碼,塊的大小可以調整,但總數據量不變。在圖中還有兩個未標出的CRC,其中第一個位于幀的5/8處,另一個位于幀未。之所以如此安排,目的就是可以減少解碼器的RAM需求量,使得解碼器不必完全接收一幀后才解碼音頻數據,而是分成了兩部 分進行解碼。


        上一頁 1 2 3 下一頁

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 麻阳| 农安县| 弥勒县| 德化县| 华宁县| 涞水县| 乐业县| 罗甸县| 平凉市| 乌恰县| 滨州市| 宜阳县| 马尔康县| 周至县| 宁河县| 吐鲁番市| 武安市| 元氏县| 包头市| 松原市| 榆树市| 绥滨县| 娱乐| 长顺县| 吴川市| 依安县| 浪卡子县| 平原县| 黄浦区| 正宁县| 哈尔滨市| 香格里拉县| 德钦县| 金山区| 六盘水市| 兴安盟| 固阳县| 大石桥市| 灵台县| 尤溪县| 苏尼特右旗|