基于PXA255的VoIP語音傳輸系統研究
語音處理的音頻庫函數使用OSS(Open Sound System)。
嵌入式IP終端系統軟件界面采用QT/Embed編程。利用qte的界面編程輔助工具QT Designer能很方便地實現界面規劃布局。由于是可視化編程,能很好地控制界面布局、效果,操作方便。QT Designer生成的界面文件是以XML語言編寫的.ui文件,通過QT附帶的工具UIC,能讓*.ui文件生成*.h和*.cpp的文件格式。使用QTDesigner大大降低了編程的工作量,并且能得到所見即所得的圖形效果。
3 語音編解碼器選型
對語音信號,有許多壓縮算法和標準。這些編碼算法可按照編碼系統碼率大小、輸入信號頻帶寬度、所采用的編碼技術等方面進行分類。編碼系統優劣的評價主要體現在編解碼系統的性能指標上,一個編解碼器系統有輸出聲音的質量、編碼速率、復雜度、遲延和容錯性
等性能指標。
(1)編碼速率。編碼速率指的是編碼器對輸入聲音經過壓縮后每秒的比特數,即壓縮后的傳碼率。這是編碼系統的一個十分重要的指標。降低比特率而維持較高的解碼聲音質量,是語音和音頻信號壓縮編碼的主要任務和主要目標。對電話級別的語音帶寬而言,通常認為比特率超過16kb/s的為高速編碼,而速率在8~16kb/s范圍的為中速率編碼,速率在8kb/s以下的為低速率編碼。
(2)輸出聲音的質量。輸出聲音的質量是指經過編碼系統再經過接收方的解碼后恢復出的聲音質量。衡量輸出聲音質量主要有二個指標:客觀質量和主觀質量。客觀質量法易測量,但往往不能精確反映語音質量。由于聲音的最終接收者是人,所以主觀法更能反映聲音質量的真正好壞,但它測試不易,費時費力。
(3)復雜度。在傳統電話應用中,很少使用壓縮,是因為壓縮算法的復雜度太大,算法執行時間長,算法的延遲也一起帶入到通信系統中。隨著技術的進步,芯片處理速度越來越快。現在工程上一般采用單片數字信號處理器DSP芯片來實時實現語音編解碼。語音編解碼算法的復雜度可由算法所需的計算量、存儲量、硬件尺寸、消耗功率及價格來衡量。
(4)時延。時延指完成編解碼算法所需的時間。對于語音編解碼器來說,時延也是一個非常重要的指標,如果時延太大,聽起來很不舒服。對于時延,不同的應用場合有不同規定,如對長話網不加回波抑制的單向編解碼時延不得大于10ms。對可視電話則放松到不超過500ms。對VOIP語音系統的時延要求不超過300ms。
(5)容錯能力或魯棒性。容錯能力指編解碼系統抗誤差、線路噪聲等各種干擾的能力。
表1對幾種編碼器的比特率、主觀平均意見分法(MOS)、復雜度(以G.711為基準)和時延(幀大小)做了比較。
本系統選用GSM 06.10語音標準算法,該算法在1988年被確定為數字移動通信的語音編碼標準,其編碼速率為13kb/s,算法簡單,運算量小,語音質量高,接近32kb/s的ADPCM(ITU-G.712)。
4 IP語音實時傳輸系統設計
本文采用Intel公司推出的PXA255處理器,該芯片專用于網絡和多媒體。其最高工作頻率可達400MHz,并帶內存管理單元MMU和DSP協處理器,可方便與高清晰的彩色LCD接口,同時該芯片可擴展連接AC97音頻芯片CS4201、高性能網絡接口芯片LANC9196,可方便移植嵌入式Linux和圖形界面等。
評論