新聞中心

EEPW首頁 > 手機與無線通信 > 設(shè)計應用 > 基于網(wǎng)絡的嵌入式IP可視電話設(shè)計方案

基于網(wǎng)絡的嵌入式IP可視電話設(shè)計方案

作者：時間：2012-05-15 來源：網(wǎng)絡

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

第3階段是編寫線性匯編代碼從C代碼中抽出對性能影響很大的代碼段，用線性匯編重新編寫這段代碼，然后使用匯編優(yōu)化器優(yōu)化該代碼。

2.1 C代碼的開發(fā)和優(yōu)化

開發(fā)過程中要充分利用Tl公司為用戶提供的功能強大的函數(shù)庫，比如IMAGE.LIB庫中就包含許多常用函數(shù)，可以實現(xiàn)DCT/IDCT變換、DCT量化、自適應濾波等功能。這些函數(shù)都是優(yōu)化過的，完全能夠?qū)崿F(xiàn)軟件流水，效率很高。另外，開發(fā)C語言代碼還需要考慮的要點包括：① 使用適當?shù)臄?shù)據(jù)結(jié)構(gòu)- - 對定點乘法，應盡可能使用short型數(shù)據(jù)；對循環(huán)計數(shù)器應使用int或者無符號int 類型。②使用查找表或常數(shù)值代替通過直接計算得到結(jié)果的語句或函數(shù)。

代碼分析結(jié)果顯示DCT、IDCT 、運動估計占程序總運算量的比重很大，因此這部分是程序優(yōu)化的重點。優(yōu)化C 代碼包括使用編譯器選項、使用內(nèi)聯(lián)函數(shù)、使用軟件流水等。

（1）向編譯器指明不相關(guān)的指令。

為使指令并行操作，編譯器必須確定指令間的相關(guān)性，只有不相關(guān)的指令才可并行執(zhí)行。若編譯器不能確定兩條指令是不相關(guān)的，則只能安排它們串行執(zhí)行。用戶可通過如下方法指明相關(guān)的指令：

①關(guān)鍵字cons t 表示一個變量或一個變量的存儲單元保持不變，使用const 可提高代碼的性能和適應性。

②使用-mt 選項向編譯器說明在代碼中不存在存儲器相關(guān)性，即允許編譯器在無存儲器相關(guān)性的假設(shè)下進行優(yōu)化。

（2）使用內(nèi)聯(lián)函數(shù)（intrinsics）。

可用內(nèi)聯(lián)函數(shù)快速優(yōu)化C 代碼。如在算術(shù)操作中，常對計算的結(jié)果做飽和（saturation）處理，使用intrinsics只須調(diào)用SADD, 一個指令周期便可得到最終結(jié)果。比花費兩個嵌套的條件判斷語句來判斷結(jié)果是否溢出，最后得到結(jié)果效率要高得多。

（3）使用軟件流水。

在編譯時，使用-o2 選項和-o3 選項，編譯器可對循環(huán)代碼實現(xiàn)軟件流水。為填滿軟件流水線，軟件流水結(jié)構(gòu)需要執(zhí)行的最小循環(huán)迭代次數(shù)稱為最小循環(huán)次數(shù)。循環(huán)總數(shù)小于最小循環(huán)次數(shù)時，執(zhí)行不流水形式循環(huán)；循環(huán)總數(shù)大于最小循環(huán)次數(shù)時，執(zhí)行軟件流水形式循環(huán)。可以使用-ms 選項，使編譯器根據(jù)循環(huán)次數(shù)僅產(chǎn)生一種循環(huán)形式；可使用-o3 和-pm 選項，使優(yōu)化器訪問整個程序，了解循環(huán)次數(shù)信息；使用-nassert 內(nèi)聯(lián)函數(shù)，防止冗余循環(huán)產(chǎn)生；使用-mh 選項，消除軟件流水循環(huán)的排空，從而減小代碼尺寸。

由于在嵌套循環(huán)中編譯器僅對最里面的循環(huán)執(zhí)行軟件流水，因此對于執(zhí)行周期很少的內(nèi)循環(huán)進行循環(huán)展開，對外循環(huán)進行軟件流水。

使用軟件流水應當注意的問題：盡管軟件流水循環(huán)可以包含內(nèi)聯(lián)函數(shù)，但不能包含函數(shù)調(diào)用；在循環(huán)中不使用break 語句；循環(huán)控制變量不能與循環(huán)體內(nèi)的語句有關(guān)；如果循環(huán)體內(nèi)復雜的條件代碼需要超過5 個條件寄存器或者32 個以上寄存器，則這個循環(huán)不可進行軟件流水。

（4）片內(nèi)存儲器的分配及DMA技術(shù)的運用。

DM643 內(nèi)部有16 KB 的一級程序緩存、16 KB 的一級數(shù)據(jù)緩存和256 KB 的程序數(shù)據(jù)共享二級緩存，遠小于執(zhí)行程序和待處理圖像數(shù)據(jù)，不可能將程序和圖像數(shù)據(jù)都在片內(nèi)RAM 中緩存，因此合理地配置和使用存儲空間，對系統(tǒng)整體效率影響很大。

提高算法程序執(zhí)行速度的關(guān)鍵是使核心循環(huán)代碼和要訪問的數(shù)據(jù)在第1 次訪問之后全部發(fā)生L1P 和L1D 命中。核心循環(huán)代碼占的空間很小，執(zhí)行過一次之后，完全可以全部在L1P 中緩存，因此，不用考慮代碼如何在存儲器中存放，主要問題是圖像數(shù)據(jù)的存放。

由于L1D 采取LRU （Least Recently Used）分配機制，因此對于小于等于16 KB 的連續(xù)存放的數(shù)據(jù)塊可完全在L1D 中命中。以解碼過程為例，IDCT 和運動補償模塊都是以宏塊為單位進行運算的，IDCT 數(shù)據(jù)類型為short型，運動補償中的預測幀和當前幀的數(shù)據(jù)類型為unsignedchar 型。計算一個宏塊（420 格式）的IDCT 和運動補償要訪問的數(shù)據(jù)大小共需1 536 字節(jié)，運動補償?shù)臄?shù)據(jù)包括預測宏塊和當前宏塊的數(shù)據(jù)，實際解碼中以6 個宏塊（10 KB）作為1 次處理對象。待處理的數(shù)據(jù)要從外部存儲器搬到L2 中連續(xù)的存儲空間，可利用EDMA 與CPU 并行工作的特點，采取Ping??Pong 技術(shù)，使CPU 在處理Ping空間數(shù)據(jù)的同時，由EDMA 將下次要處理的數(shù)據(jù)搬到Pong 空間中；當CPU 處理Pong 空間數(shù)據(jù)時，再由EDMA將Ping 空間已處理好的數(shù)據(jù)搬回外部存儲器，并將下次要處理的數(shù)據(jù)搬到Ping 空間，這樣就可達到CPU 的最大計算能力。Ping、Pong 空間各占用的大小為20 KB, 兩個總共約40 KB.L2 中的剩余空間分出64 KB 留給數(shù)據(jù)空間，用于解碼中常用的解碼表、量化步長、輸入壓縮碼流緩沖區(qū)和輸出碼流緩沖區(qū)等。64 KB 的程序空間用于存儲H. 264 算法中的運動預測、運動補償和中斷服務程序等關(guān)鍵代碼。L2 其余部分配置為Cache, 操作與L1D 類似。

2. 2 編寫線性匯編代碼

為了提高代碼性能，對影響處理速度的關(guān)鍵C 代碼段可以用線性匯編重新編寫。線性匯編代碼類似于匯編代碼，不同的是線性匯編代碼中不需要給出匯編代碼必須指出的所有信息（如所使用的寄存器、指令的并行與否、指令的延遲周期和指令使用的功能單元等），匯編優(yōu)化器會根據(jù)代碼的情況確定這些信息。當然，如果能夠事先確定一些信息（如循環(huán)的執(zhí)行次數(shù)、存儲區(qū)的地址等），則編寫的線性匯編代碼的效率更高。具體的優(yōu)化措施如下：

①使用偽指令向匯編優(yōu)化器提供較為詳細的信息。

②畫出指令的相關(guān)圖，根據(jù)相關(guān)圖合理分配邏輯單元，最大限度地保證指令的并行執(zhí)行。

③充分使用C64x DSP 提供的強大包處理指令處理數(shù)據(jù)（包處理指令可同時處理2 個l6 位數(shù)據(jù)和4 個8 位數(shù)據(jù)）。本系統(tǒng)中使用了AVGU4、MIN2、M AX2、SPACKU4、PACK2、D0T P2、D0T PN2 和UNPKLU4 等指令。C64x DSP 還提供了STDW（STNDW）、LDDW（LDNDW）指令，可一次存取連續(xù)的64 位數(shù)據(jù)。可利用LDDW 指令，將作1 次行變換所需數(shù)據(jù)1 次取來，并將處理后的結(jié)果利用STDW 指令一次存好。這樣大大縮短了代碼長度，提高了代碼效率。

④利用Schedule Table 確定循環(huán)的重復間隔，合理安排功能單元，進行軟件的流水。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解（linux不再難懂）
鎖相環(huán)相關(guān)文章:鎖相環(huán)原理

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 設(shè)計 方案 可視電話 IP 網(wǎng)絡 嵌入式 基于

焦點

更多>>

技術(shù)專區(qū)

關(guān)閉

新聞中心

基于網(wǎng)絡的嵌入式IP可視電話設(shè)計方案

評論

相關(guān)推薦

技術(shù)專區(qū)