基于DSP的G.729語音編解碼器設計
圖3是該算法精簡后的流程圖。
實驗證明,在10幀語音信號的編碼過程中,這部分算法優化后平均可減少15 000次左右的L_mac運算的調用。
3.2.2 去除不必要的溢出判斷
使用CCS中的profiler工具對ITU提供的標準C源碼進行分析,結果表明,該算法大部分運算都集中在basic_op.c文件中的L_add()、L_mult()等幾個基本函數上。進一步分析發現,這些函數在溢出判斷上花費了大量的時間,而實際運算中真正會產生溢出的地方非常少。因此,為了進一步提高代碼效率,在完全不會產生溢出的地方用簡單的基本運算取代函數的調用,這樣即能大大縮短運算時間,還能節省調用函數的開銷。例如:
這段程序中,由于-215≤a[i]≤215-1,-215≤b[i]≤215-1,那么a[i]*b[19-i]顯然不會超出區間[-231,231-1],即這一部分不會產生溢出問題,因此這里的L_mult函數便可簡單替換為:
這雖是一段極小的程序,但經過這樣簡單的置換后卻能減少數十個時鐘周期。在整個代碼中類似的例子很多,優化后的效果非常明顯。
3.2.3 循環優化
對循環的優化一直是代碼優化的重點,一般的循環優化包括:循環合并、循環展開、循環內部的指令盡可能移到循環外等。這些方法在文獻中有詳細的介紹,這里就不再贅述。TMS320C54X系列芯片采用6級流水線結構,可以并行執行多條指令,并在一定條件下可以實現零開銷循環處理。
評論