新聞中心

基于FPGA IP核的FFT實現

作者：時間：2009-07-10 來源：網絡

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

0 引言
數字信號處理領域中FFT算法有著廣泛的應用。目前現有的文獻大多致力于研究利用FFT算法做有關信號處理、參數估計、F+FT蝶形運算單元與地址單元設計、不同算法的FFT實現以及FFT模型優化等方面。而FPGA廠商Altera公司和Xilinx公司都研制了FFT IP核，性能非常優越。在FFT的硬件實現中，需要考慮的不僅僅是算法運算量，更重要的是算法的復雜性、規整性和模塊化，而有關利用FFT IP核實現FFT算法卻涉及不多。這里從Altera IP核出發，建立了基4算法的512點FFT工程，對不同參數設置造成的誤差問題進行分析，并在EP2C70F896C8器件上進行基于Quartus II的綜合仿真，得到利用FFT IP核的FFT算法高效實現，最后利用Matlab進行的計算機仿真分析證明了工程結果的正確性。

1 算法原理
FFT算法是基于離散傅里葉變換(DFT)，如式(1)和式(2)：

本文引用地址：http://www.104case.com/article/188835.htm

求和運算的嵌套分解以及復數乘法的對稱性得以實現。其中一類FFT算法為庫利一圖基(Cooley-Tukey)基r按頻率抽選(DIF)法，將輸入序列循環分解為N／r個長度為r的序列，并需要logr N級運算。算法的核心操作是蝶型運算，蝶型運算的速度直接影響著整個設計的速度。
基4頻域抽取FFT算法是指把輸出序列X(k)按其除4的余數不同來分解為越來越短的序列，實現x(n)的DFT算法。FFT的每一級的運算都是有N／4個蝶形運算構成，第m級的一個蝶形運算的四節點分別為Xm(k)，Xm(k+N／4m)，Xm(k+2N／4m)以及Xm(k+3N／4m)，所以每一個蝶形運算結構完成以下基本迭代運算：

式(3)～式(6)中：m表示第m級蝶形算法；k為數據所在的行數；N為所要計算的數據的點數；WN為旋轉因子。
將輸入序列循環分解為4點序列的基4分解，使用4點FFT在乘法上更具優勢，Altera的：FFT兆核選用的就是基4運算，若N是2的奇數冪的情況下，FFT IP核則自動在完成轉換的最后使用基2運算。

2 FFT兆核(IP)函數
FFT Core支持4種I／O數據流結構：流(Stream-ing)、變量流(Variable Streaming)、緩沖突發(BufferedBurt)、突發(Burst)。流結構允許輸入數據連續處理，并輸出連續的復數據流，這個過程不需要停止FFT函數數據流的進出。變量流結構允許輸入數據連續處理，并產生一個與流結構相似連續輸出數據流。緩沖突發數據流結構的FFT需要的存儲器資源比流動I／O數據流結構少，但平均模塊吞吐量減少。突發數據流結構的執行過程和緩沖突發結構相同，不同的是，對于給定參數設置，突發結構在降低平均吞吐量的前提下需要更少的存儲資源。

3 FFT處理器引擎結構
FFT兆核函數可以通過定制參數來使用兩種不同的引擎結構：四輸出(Quad-outlput)或單輸出(Signal-output)引擎結構。為了增加FFT兆核函數的總吞吐量，也可以在一個FFT兆核函數變量中使用多個并行引擎。本文建立一個基于QuartusⅡ7.O計算24位512點FFT工程，采用四輸出FFT引擎結構，如圖1所示。

復取樣數據X[k，m]從內部存儲器并行讀出并由變換開關(SW)重新排序，排序后的取樣數據由基4處理器處理并得到復數輸出G[k，m]，由于基4按頻率抽選(DIF)分解方法固有的數字特點，在蝶形處理器輸出上僅需要3個復數乘法器完成3次乘旋轉因子(有一個因子為1，不需要乘)計算。這種實現結構在一個單時鐘周期內計算所有四個基4蝶形復數輸出。
同時，為了辨別取樣數據的最大動態范圍，四個輸出由塊浮點單元(BFPU)并行估計，丟棄適當的最低位(LSB)，在寫入內部存儲器之前對復數值進行四舍五入并行重新排序。對于要求轉換時間盡量小的應用，四輸出引擎結構是最佳的選擇；對于要求資源盡量少的應用，單輸出引擎結構比較合適。為了增加整個FFT吞吐量，可以采用多并行的結構。

4 系統驗證
4．1 工程仿真
選擇CycloneⅡ系列的EP2C70F896C8芯片來實現，先在QuartusⅡ軟件下進行綜合仿真，初始化參數設置FFT變換長度為512點，數據和旋轉因子精度為24 b，選擇緩沖突發的數據流結構，四輸出引擎并行FFT引擎個數為4個，復數乘法器結構為“4／Mults／2Adders”。EP2C70F896C8芯片包括68 416個邏輯單元，31 112個寄存器單元，最大用戶輸入／輸出引腳622個，總RAM達1 152 000 b，其布線資源由密布的可編程開關來實現相互間的連接，這種結構完全符合實現FFT電路的要求。
經綜合和時序分析得知：其工作時鐘頻率
69．58 MHz(period=14．372 ns)，進行一次蝶形運算只需約14 ns，全部512點數據處理完成則需14．372×4×512=29．3μs滿足時序要求。具體綜合結果如圖2所示，為Quartus軟件環境下仿真得到。

圖3則表明了FFT的綜合邏輯結果，為編譯成功后的RTL級電路描述。

fpga相關文章:fpga是什么

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： FPGA FFT IP核

焦點

更多>>

技術專區

關閉

新聞中心

基于FPGA IP核的FFT實現

評論

相關推薦

技術專區