新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > IP電話中的低速率語音編解碼器的實(shí)現(xiàn)

IP電話中的低速率語音編解碼器的實(shí)現(xiàn)

作者：時(shí)間：2006-05-07 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

摘要：G.729.A在TMS320C6201DSP上的實(shí)現(xiàn)方法及提高G.729.A編碼器的運(yùn)行速度的優(yōu)化方法和編程技巧。并介紹了該編碼器的測試結(jié)果。

本文引用地址：http://www.104case.com/article/242328.htm

關(guān)鍵詞：ITU-T G.729.A IP電話編碼器

最近幾年，IP電話技術(shù)突飛猛進(jìn)，已從當(dāng)初PC到PC的機(jī)連接方式發(fā)展到IP電話網(wǎng)關(guān)方式，通過IP電話網(wǎng)關(guān)可以將PBX與因特網(wǎng)連接起來，從而實(shí)現(xiàn)普通話機(jī)通過因特網(wǎng)進(jìn)行通信。因此，IP電話網(wǎng)關(guān)是近年來計(jì)算機(jī)和通信領(lǐng)域中研究的一個(gè)熱點(diǎn)。IP電話網(wǎng)關(guān)的一個(gè)最主要性能指標(biāo)是它的處理密度（即能同時(shí)算是的話路數(shù)）。而IP電話網(wǎng)關(guān)的處理密度主要取決于它所使用的語音編解碼器處理一幀數(shù)據(jù)的延遲大小。目前，IP電話所遵循的標(biāo)準(zhǔn)是H.323，而H.323標(biāo)準(zhǔn)首選語音編碼器是ITU-T G.729.A。ITU-T G.729.A是用于語音和其它聲音信號的壓縮編解碼算法建議，它是G.729的簡化版本，編碼速率為8Kbps，并且有很高的語音質(zhì)量。但是，該編碼器的算法復(fù)雜，一幀語音的處理延遲較大，在很大程度上影響IP電話網(wǎng)關(guān)的處理密度。因此，為了提高IP電話網(wǎng)關(guān)的處理密度，本文在實(shí)現(xiàn)ITU-T G.729.A語音編解碼器時(shí)，采用了目前性能最好的DSP，即TMS320C6201；針對TMS320C6201并行性和流水等特點(diǎn)，深入研究了在TMS320C6201上實(shí)現(xiàn)G.729.A的編解碼器的編程技巧；歸納出一系列減少編解碼器處理延遲的優(yōu)化方法。采用這些優(yōu)先方法和編程技巧，可以將ITU-T G.729.A的每幀編碼運(yùn)行時(shí)間減少到0.47毫秒（按TMS320C6201工作在200MHz計(jì)算），從而可以實(shí)現(xiàn)單片TMS320C6201能同時(shí)處理20路路語音。這一指標(biāo)已到達(dá)了國際上最先進(jìn)的水平；而且，該編解碼器已成功地運(yùn)用在筆者開發(fā)的IP電話網(wǎng)關(guān)中。

1 G.729.A編解碼器的算法

1.1 編碼算法

ITU-T G.729.A標(biāo)準(zhǔn)采用一種稱為共軛結(jié)構(gòu)代數(shù)碼本激勵(lì)線性預(yù)測（Conjugate Structure Algebraic-Code-Excited Linear-Prediction,CS-ACELP）算法來對語音信號進(jìn)行編碼。

在開始編碼之前，先要對輸入的模擬信號進(jìn)行電話帶濾波，然后以8kHz頻率對其進(jìn)行采樣，再將其轉(zhuǎn)換為16位線性PCM碼，作為編碼器的輸入。

編碼器處理語音的單位是幀，1幀為10毫秒語音，包括80個(gè)聲音樣本（采樣頻率為8kHz）。編碼器對每一幀語音信號進(jìn)行分析，抽取出其中的CPLD模型的參數(shù)（線性預(yù)測濾器參數(shù)），自適應(yīng)和固定碼本索引和增益），對這些參數(shù)進(jìn)行編碼和傳送。其編碼過程如圖1所示。

在預(yù)處理階段，輸入信號經(jīng)高通濾波并乘以比例因子，然后對每一幀預(yù)處理之后的信號進(jìn)行一次線性預(yù)測分析，計(jì)算出線性預(yù)測濾波器系數(shù)，其中，線性預(yù)測濾波器系數(shù)定義為：。這些系數(shù)被轉(zhuǎn)化成線譜對（LSP，Line Spectrum Pairs）并用可預(yù)測二階矢量量化法量化成18位。使用合成分析搜索過程選定激勵(lì)信號，使得原始信號和重構(gòu)信號之間的誤差在感覺加權(quán)失真測量中最小。

對每個(gè)子幀（5毫秒，包括40個(gè)樣本）求出其激勵(lì)參數(shù)（固定和自適應(yīng)碼本參數(shù)）。本幀的量化和未量化的線性插值系數(shù)。每一幀根據(jù)感覺加權(quán)語音信號估計(jì)出開環(huán)基音延遲。多面手對每一子幀進(jìn)行以下操作：將線性預(yù)測殘差通過加權(quán)合成濾波器的沖擊響應(yīng)h(n)，使用目標(biāo)信號x(n)和沖擊響應(yīng)h(n)在開環(huán)基音延迂回通過周圍搜索，并進(jìn)行閉環(huán)基音分析（得出自適應(yīng)碼本延遲和增益）。第一個(gè)子幀的基音延遲編碼為8位，第二個(gè)子幀采用差分方法編碼為5位。通過減去（濾波后的）自適應(yīng)碼本貢獻(xiàn)來更新目標(biāo)信號x(n)，新目標(biāo)x'(n)在固定碼本搜索中使用以找到最優(yōu)激勵(lì)。固定碼本激勵(lì)使用一個(gè)17位的代數(shù)碼本。自適應(yīng)和固定碼本的獻(xiàn)增益被矢量量化為7位（對固定碼本增益使用移動(dòng)平均預(yù)測方法）。最后，得到的激勵(lì)信號被用來更新濾波器狀態(tài)。所有這些參數(shù)最后封裝到80位的壓縮數(shù)據(jù)幀中。

1.2 解碼算法

解碼算法

解碼器算法框圖如圖2所示。

首先，從壓縮比特流中取得各參數(shù)的索引，再從這些索引中得出一幀語音的編碼器參數(shù)，包括LSP系數(shù)、2個(gè)部分基音延遲、2個(gè)固定碼本向量、2套自適應(yīng)和固定碼本延遲，這些參數(shù)被用來生成激勵(lì)信號并合成濾波器參數(shù)。LSP系數(shù)經(jīng)插值后，形成每個(gè)子幀的LP濾波器。然后，對每個(gè)子幀進(jìn)行如下處理：

·自適應(yīng)和固定碼本向量乘以各自的增益系數(shù)得到激勵(lì)信號；

·激勵(lì)信號經(jīng)過線性預(yù)測合成濾波器得到重構(gòu)的語音；

·重構(gòu)后的語音信號再經(jīng)過一個(gè)后處理階段，包括基于長時(shí)和短時(shí)合成濾波器的自適應(yīng)濾波器，然后再經(jīng)過高通濾波器并乘以相應(yīng)的比例因子。

2 ITU-T G.729.A編解碼器實(shí)現(xiàn)的關(guān)鍵技術(shù)

2.1 ITU-T G.729.A編解碼器實(shí)現(xiàn)的硬件平臺

ITU-T G.729.A編解碼器實(shí)現(xiàn)平臺是筆者開發(fā)的一種集成式IP電話網(wǎng)關(guān)。這種集成式IP電話網(wǎng)關(guān)的設(shè)計(jì)思想是以PC機(jī)為基礎(chǔ)，集成了市場通用板卡，如LSI/C6200DSP資源卡、Dialogic的語音卡和網(wǎng)關(guān)等，并以這些板卡為硬件平臺，按照相關(guān)協(xié)議，開發(fā)出一套IP網(wǎng)關(guān)軟件。集成式IP電話網(wǎng)關(guān)的硬件基本結(jié)構(gòu)如圖3所示。其中G.729.A編解碼器是由LSI/C6200資源卡上的TMS320C6201 DSP來實(shí)現(xiàn)。

TMS320C6201 DSP是美國TEXAS INSTRUMENT公司生產(chǎn)的目前處理速度最快的定點(diǎn)數(shù)字信號處理器，TMS320C6201 DSP采用VLIW（Very Long Instruction Word）體系結(jié)構(gòu)，其工作頻率最高可達(dá)200MHz，內(nèi)部有1600MIPS[4]。另外，TMS320C6201 DSP分別提供了64KB的內(nèi)部程序RAM和數(shù)據(jù)RAM，片外存儲器可擴(kuò)展到4GB，可連接SDRAM、SBSRAM和Flash Memory。TMS320C6201 DSP還提供了豐富的外圍電路接口，如：Scbus語音總線、MVIP語音總線、HOST接口以及JTAG口等。

2.2 ITU-T G.729.A軟件模塊的設(shè)計(jì)

G.729.A編解碼器運(yùn)行的硬件平臺是TMS320C6201DSP，支持SPOX。SPOX是一種功能很強(qiáng)的實(shí)時(shí)操作系統(tǒng)。在SPOX操作系統(tǒng)的調(diào)度下，可對多路語音進(jìn)行適時(shí)的語音壓縮和解碼。G.729.A編解碼器件主要由調(diào)度及命令解釋模塊、G.729.A數(shù)據(jù)壓縮與解壓縮模塊和接口模塊三部分組成。

（1）調(diào)度及命令解釋模塊

該模塊主要用于解釋HOST發(fā)來的各種命令，如發(fā)送或接收編解碼數(shù)據(jù)，查詢編解碼狀態(tài)以及啟動(dòng)、停止編解碼操作等，該模塊不直接與HOST打交道，而是以SPOX提供的服務(wù)方式，通過接口功能模塊間接地實(shí)現(xiàn)與HOST之間數(shù)據(jù)交換。同時(shí)在SPOX的支持下，完成對多路語音編解碼的適時(shí)調(diào)度。

（2）G.729.A數(shù)據(jù)壓縮與解壓縮模塊

該模塊是ITU-T G.729.A編解碼器的核心模塊，在很大程序上影響編解碼的性能。該模塊實(shí)現(xiàn)了ITU-T G.729.A全部功能。該部分已單獨(dú)形成一個(gè)TMS320C6201函數(shù)庫，可與其他任何部分連接。

（3）接口模塊

該模塊主要實(shí)現(xiàn)TMS320C6201與HOST以及與語音卡之間的數(shù)據(jù)交換，因此該模塊分成兩部分。一部分主要負(fù)責(zé)TMS320C6201 DSP與語音卡之間的數(shù)據(jù)傳輸，它負(fù)責(zé)不斷地將語音卡采取的語音數(shù)據(jù)通過語音總線（如SCbus），采取等時(shí)通信方式送入到LSI/PCI6200資源卡RAM中，或者是將編解碼器解碼后的數(shù)據(jù)經(jīng)SCbus總線送給語音卡。另一部分主要負(fù)責(zé)TMS320C6201 DSP與HOST之間的數(shù)據(jù)交換，一方面要將壓縮后的語音信號由PCI總線送往HOST；另一方面將HOST解包的碼流分類后讀入編解碼器。編解碼器與HOST之間的數(shù)據(jù)交換采用中斷方式進(jìn)行同步。

2.3 ITU-T G.729.A標(biāo)準(zhǔn)在TMS320C6201上實(shí)現(xiàn)的關(guān)鍵技術(shù)

處理密度是衡量IP電話網(wǎng)關(guān)性能好壞的一個(gè)重要指標(biāo)。而一個(gè)IP電話網(wǎng)你在硬件平臺確定的情況下，其處理密度主要取決于它所采用的編解碼器的語音編碼處理延遲，即代碼的執(zhí)行速度。如何提高G.729.A語音編碼的執(zhí)行速度是G.729.A編解碼器實(shí)現(xiàn)的關(guān)鍵技術(shù)問題之一。這此，歸納出一系列編程技巧和優(yōu)優(yōu)方法，較好地解決了這一難題。

（1）G.729.A標(biāo)準(zhǔn)中規(guī)定的算法都是基本算法。因此，在實(shí)現(xiàn)時(shí)，可以用快速算法。例如，相關(guān)系數(shù)的計(jì)算，在G.729.A標(biāo)準(zhǔn)中使用一種最基本的計(jì)算方法，如果采用快速的傅里葉變換技術(shù)或采用分解因子的計(jì)算方法，就可以加快計(jì)算速度。

（2）算法中有很多FIR和IIR運(yùn)算，如：共振峰濾波器、聽覺加權(quán)濾波器、聯(lián)合濾波器等，在設(shè)計(jì)這些濾波器時(shí)，使用較大數(shù)組來放濾波器的系數(shù)。這樣，每計(jì)算一次輸出，不需系數(shù)更新移位，從而可以減少內(nèi)存操作次數(shù)，因此可以通過犧牲存儲器空間來提高代碼的執(zhí)行速度。如：共振峰濾波器是十階濾波器，常規(guī)的實(shí)現(xiàn)方法是設(shè)置一個(gè)長度為10元素的一維數(shù)組來保存最近的10個(gè)共振峰樣本點(diǎn)。濾波器每輸出一個(gè)樣本點(diǎn)，該數(shù)組就需更新一次。對于一個(gè)子幀40個(gè)樣本點(diǎn)，就需進(jìn)行40次更新操作。如設(shè)置長度為70元素的一組數(shù)組，就可以免去更新操作。可以很大程度地操作代碼的運(yùn)行速度。

（3）多使用指針，盡量減少變量之間的反復(fù)拷貝操作。

（4）用查詢靜態(tài)表的方法來代替動(dòng)態(tài)的計(jì)算，從而減少計(jì)算延遲。例如，在設(shè)計(jì)cos()函數(shù)時(shí)，程序在初始化時(shí)就生成一個(gè)512項(xiàng)的cos（）函數(shù)表。當(dāng)需要計(jì)算cos（）函數(shù)值時(shí)，可以采用查表方式來代替動(dòng)態(tài)計(jì)算。

（5）內(nèi)存單元的合理分配。TMS320C6201 DS的片內(nèi)存儲器有64KB數(shù)據(jù)存儲器。由于TMS320C6201從片內(nèi)存儲器讀入一個(gè)字比從片外存儲器讀入一個(gè)字快14倍，因此在編程時(shí)，盡量將經(jīng)常使用的數(shù)據(jù)分配在片內(nèi)存儲器中。

（6）G.729.A在TMS320C6201上定點(diǎn)實(shí)現(xiàn)時(shí)，數(shù)據(jù)精度也是一個(gè)關(guān)鍵問題。在定點(diǎn)信號處理芯片上實(shí)現(xiàn)某些浮點(diǎn)算法時(shí)，可以采取定點(diǎn)數(shù)來表示浮點(diǎn)數(shù)，這樣可以加快運(yùn)行速度，但可能導(dǎo)致運(yùn)算精度不夠。解決的方法是在精度要求比較高的地方，可以將計(jì)算的中間變量用32位表示，甚至用40位表示。

（7）充分利用TMS320C6201的編譯器和優(yōu)化工具來優(yōu)化C和線性匯編代碼，并合理地選擇優(yōu)化參數(shù)。有關(guān)速度的優(yōu)化參數(shù)是：-o3、-pm、-mt、mi等。并盡量用TMS320C6201的線性匯編或匯編語音來實(shí)現(xiàn)G.729.A編解碼器的算法。

（8）充分利用TMS320C6201的特點(diǎn)來編寫代碼。如流水功能，8個(gè)功能單元并行操作功能，32位字讀寫功能以及Intrinsics的使用等，例如：對多重循環(huán)，如最內(nèi)層循環(huán)次數(shù)少而較簡單，可把最內(nèi)層循環(huán)展開，以便外循環(huán)做流水線；對一些簡單循環(huán)而前后沒有因果關(guān)系，合并這些循環(huán)也有利于做流水線。

3 性能測試

分別用二種測試工具對G.729.A編解碼器的處理延遲作了測試。第一種測試工具是C6X Simulator(TMS320C6201的仿真軟件)，測試條件是假設(shè)所有代碼裝在TMS320C6201片同的程序存儲器中；因此，稱之為Non cache測試模式。另外一種測試方式是采用TI公司的C6X的EVM卡（評估卡），測試條件是將TMS320C6201片內(nèi)64KB RAM作為Cache使用；因此稱之為cache模式。二種測試模式的測試結(jié)果如表1所示。

表1 G.729.A編解碼的時(shí)鐘數(shù)

測試項(xiàng)目	C6 仿真器（非緩沖模式）	C6 評估板（非緩沖模式）
編碼（每幀）	86720 cycles	91650 cycles
解碼（每幀）	34120 cycles	37310 cycles

從表1可以看出，如果TMS320C6201工作在頻率為200MHz，即每Cycles的周期為0.5毫秒，可以算出G.729.A編碼一幀（30毫秒）的延遲時(shí)間是0.43～0.46毫秒。因此說，單片TMS320C6201可以同時(shí)處理大約20路G.729.A編碼（當(dāng)前國際最高水平是22路）；而且，編解碼的結(jié)果都嚴(yán)格地通過了G.729.A提供的測試矢量的測試，實(shí)際播放音質(zhì)也很好。

ITU-T G.729.A語音信號壓縮編解碼技術(shù)集成了眾多低速率語音編解碼的優(yōu)點(diǎn)，大大提高了低速率編解碼的語音質(zhì)量，但算法較復(fù)雜。而TMS320C6201 DSP是目前最快的定點(diǎn)數(shù)字信號處理器，如果在編寫程序時(shí)，能充分利用上述關(guān)鍵技術(shù)，就可以充分發(fā)揮TMS320C6201的功能，大大減少G.729.A編解碼的處理延遲，并能保持良好的語音品質(zhì)。將該編解碼應(yīng)用在該IP電話網(wǎng)關(guān)中，在很大程度上提高了IP電話網(wǎng)關(guān)處理密度，改善了IP電話網(wǎng)關(guān)的性能。因此說，本文實(shí)現(xiàn)的G.729.A編解碼器有很大的應(yīng)用價(jià)值。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>