新聞中心

        EEPW首頁 > 嵌入式系統 > 設計應用 > 基于ADSP-TS201S的多DSP并行系統

        基于ADSP-TS201S的多DSP并行系統

        作者: 時間:2012-04-06 來源:網絡 收藏


        0 引言

        本文引用地址:http://www.104case.com/article/257590.htm

        在寬帶雷達信號處理中,存在諸如回波采樣率高、脈沖壓縮(匹配濾波)運算量大、處理流程復雜、實時高分辨目標檢測困難等一系列問題。針對這些問題,采用通 用計算機平臺難以應對運算量大和實時性等高要求,因此,需采用專用的數字信號處理器(DSP)來進行高速運算。盡管當前的數字信號處理器已達到較高水平, 但單片DSP芯片的處理能力還是不能滿足寬帶雷達的性能要求,需要引入并行處理技術,在本設計中使用4片DSP芯片組成并行處理系統。另外,為充分發揮 DSP芯片在復雜算法處理上的優勢及FPGA在大數據量的底層算法上的優勢,設計了一種基于FPGA控制的并行處理系統。

        1 系統設計

        基于FPGA控制的并行處理系統的原理圖如圖1所示。

        整個雷達信號處理系統以高可靠性CPCI工控機為平臺,內置不同功能的信號處理板。板間的數據傳輸通過CPCI接口完成。根據雷達信號處理系統的任務分 配,本系統負責完成中頻數字信號的處理。根據前端信號采集板輸出數據的不同,數據將以串行或并行的方式輸送到本系統中。其中,串行信號通過CPCI的J3 口以差分的形式直接傳輸給DSP2,然后在4片DSP芯片間按照預定的算法進行任務分配和并行處理,處理完畢后通過DSP4寫入兩片擴展連接成32輸出方 式的FIFO中,此時,FPGA直接從FIFO中讀取數據,完成與CPCI接口芯片PCI9656的時序轉換后將數據發送到PCI9656,通過CPCI 總線經J1和J2口傳輸到雷達系統的其他功能模塊。對于并行信號而言,32位帶寬的信號首先通過J3口發送到F-PGA內部寄存器中FPGA接收到數據后 將數據寫入輸入緩存區,并在完成一幀后給并行DSP輸出中斷。當并行DSP采樣到中斷后,從數據緩存區讀取數據,完成處理后,將數據傳輸到緩存 區,FPGA再通過相同的處理方式經CPCI接口的J1口和J2口將數據傳輸到雷達系統的其他功能模塊。

        2 DSP芯片選型

        根據系統的性能要求,通過比較各種高性能DSP處理器,并著重對構成并行處理系統的性能和便捷性進行分析,確定選用AD公司的ADSP Tiger SHARC系列處理器中的TS201S組成。因為該系列的處理器在構成并行處理系統時其本身就提供了實現互連所需的片內總線仲裁控制和特有的鏈路口,可以以各種拓撲結構互連DSP,滿足大運算量和片間通信靈活的要求。此外,選用ADSP Tiger SHARC還可以降低外圍設計的復雜度,增強系統的穩定性。

        TS201S芯片(600 MHz)主要性能指標:

        (1)運行速度:1.67 ns指令周期;每周期可執行4條指令;
        (2)DSP內部有2個運算模塊,支持的運算類型有:32 b和40 b浮點運算;8 b,16 b,32 b以及64 b定點運算;
        (3)每秒可執行12×109次16 b定點運算或3.6×109次浮點運算;
        (4)采用單指令多數據(SIMD)模式,每秒可提供4.8×109次的40 b乘加運算;
        (5)外部總線DMA傳輸速率1.2 GB/s(雙向);
        (6)4個鏈路口,每個鏈路口最高提供1.2 GB/s的傳輸速率,可同時進行DMA傳輸;
        (7)多處理器處理能力,具有支持多處理器無縫連接的片內仲裁邏輯,多處理器采用統一尋址的方式訪問,可以通過簇總線(ClusterBus)或鏈路口(Link Ports)方便地構成多處理器系統。
        (8)片上SDRAM控制器,片上DMA控制器(提供14條DMA通道)。

        3 DSP并行處理結構設計

        之間的數據傳輸通道可選擇的方式有如下兩種:高速鏈路口(LINK)方式和高速外部總線口(簇總線)。因此,由多ADSP- TS201 S組成的DSP并行處理系統從數據傳輸方式來看,不外乎有以下三種模型:高速鏈路口(LINK)耦合模型;高速外部總線口(簇總線)耦合模型;高速鏈路口 (LINK)與高速外部總線口(簇總線)混合耦合模型。

        3.1 基于鏈路口的多DSP并行處理系統

        在這種連接方式下,各DSP用LINK口連接在一起,進行通信控制和數據交換,系統結構簡單、連線少、可擴展性強,在DSP具有多個 LINK口的情況下,可靈活組成線型、星型、環型、網絡型或超立方體型等多種拓撲結構。具有4個全雙工的鏈路口通信端口。一個鏈路 口單向通信包含4位數據加上時鐘與握手信號一共12條引線,雙向共要24條引線。在內核時鐘為600 MHz時,單向數據傳輸率最高可達600 MB/s,雙向數據傳輸率可達1.2 GB/s,由于鏈路口通信是點對點的,所以具有很高的傳輸可靠性,但在傳輸數據時的共享性不如總線形式。

        3.2 基于共享總線的多DSP并行處理系統

        共享總線就是系統中所有DSP的外部總線(地址、數據和訪問控制總線)都直接連接在一起,各DSP片內存儲器和寄存器以及掛接在總線上的 外部存儲器、外設都作為共享資源被各個DSP訪問。的外部總線為32 b,數據總線可以配置成32 b或者64 b。外部端口的運行速度最高可以到125 MHz,數據吞吐量可以高達1 GB/s。為了與不同外部設備連接,ADSP-TS201S外部端口支持快速(流水線)、慢速和SDRAM協議。且支持以DMA方式進行數據傳輸。另 外,ADSP-TS201S并行總線的最大特點是它具有無縫連接能力,無論是與SRAM、SDRAM、還是與處理器連接,只需要將相應管腳對應連接就能簡 單方便的構成一個最多由8個DSP構成的多處理器系統,充分共享8個DSP的內部資源和外部的EPR-OM,SRAM,SDRAM等資源。

        3.3 基于外部總線共享和鏈路口混合耦合的多DSP并行處理系統

        為兼顧數據速率、資源共享、易于控制以及DSP之間通信靈活等方面,在本設計中采用混合耦合模型的并行處理系統。將4個ADSP-TS201S的總線口都 相互連接好,各DSP的高速鏈路口也都相連,建立DSP到DSP的點對點通道與DSP間資源共享的工作塊模式。4片SDRAM中,每兩片擴展連接成64 位,掛接到64位數據總線上,2片FLASH也通過總線訪問。控制總線連接到FPGA,由FPGA統一控制4片DSP之間以及DSP與外部存儲器之間的數 據傳輸。4片DSP的工作塊連接方式如圖2所示。

        4 FPGA與外設接口設計

        4.1 FPGA選型

        現場可編程邏輯門陣列(Field Programmable Gate Array,FPGA)是在專用ASIC的基礎上發展而來的,它克服了專用ASIC不夠靈活的缺點。其內部的具體邏輯功能可以根據需要配置,對電路的修改 和維護很方便。目前,FPGA的容量已經跨過了百萬門級,使得FPGA成為解決系統級設計的重要選擇方案之一。現在FPGA已經成為多種數字信號處理應用 的強有力的解決方案。由于可編程方案的靈活性,DSP系統設計可以適應日益變化的標準、協議和性能需求。Vir-tex-5系列是當前市場上最新,功能最 強大的FPGA,它采用65 nm芯片制造工藝,具有先進的高性能和理想應用的FPGA結構。主要性能指標如下:

        (1)強大的時鐘管理能力;
        (2)片上集成高達36 Kb的塊RAM和FIFO存儲器資源;
        (3)高性能并行Select I/O技術和先進的DSP48Eslice;
        (4)靈活地加載和配置方案以及在所有設備上的系統監測能力;
        (5)集成100 Mb/s~3.75 Gb/s的Rocket I/OGTP收發器,150Mb/s~6.5 Gb/s的Rocket I/OGTX收發器;
        (6)強大的片上微處理器PowerPC440。
        綜合處理板功能需求,性能分析、系統兼容以及I/O管腳需求等各因素,FPGA選擇Xilinx公司的Vir-tex-5系列XC5VSX50TFF1136芯片。

        4.2 FPGA設計

        根據系統功能要求,FPGA的任務主要分為4大部分。

        (1)控制數據在系統中的傳輸邏輯

        在設計時,將圖2控制總線中的所有信號都連接到FPGA中,由FPGA來統一調度數據在DSP之間以及DSP與外部存儲器之間的傳輸。這樣為任務并行處理 的分配和雷達信號流水線式的處理在處理算法上提供了最大程度的簡便,并能充分發揮DSP處理復雜算法的運算能力。

        (2)控制數據緩存區(FIFC))的數據寫入與讀取,通過外部中斷IRQ控制DSP與FPGA之間的數據傳輸

        由于外部4片FIFO每兩片擴展接成32位輸出/輸入方式,因此FPGA與FIFO進行數據傳輸時采用單向數據傳輸方式。在單向數據傳輸時采用數據塊方式 傳輸,通過將握手信號連接到DSP的IRQx來產生中斷或者FLAGx,FPGA將從外部處理板接收到的數據寫入輸入緩存區,并在完成一幀后給并行DSP 輸出中斷,DSP從FIFO讀取完一幀數據后通過握手信號向FPGA告知可以進行下一幀數據的傳送。

        (3)控制通過LINK口與DSP之間的通信

        鏈路口通信有自己的通信協議,FPGA電路只需要按照鏈路口的通信協議進行設計。ADSP-TS201S的鏈路口采用的是獨立的發送和接收通道,因此對應 的FPGA也采用不同的接收電路和發送電路。FPGA接收或者發送DSP鏈路口邏輯電路都主要由兩部分組成:接收/發送模塊和接收緩沖/發送緩沖。接收模 塊用來與DSP鏈路口發送通道進行接口和數據拆包處理,發送模塊用來與DSP鏈路口接收通道進行連接和數據打包處理;接收緩沖/發送緩沖分別是用來配合接 收模塊和發送模塊進行傳輸時作為數據緩沖區,并實現與系統中其他接口或者FPGA中的其他模塊的接口的數據傳輸功能。

        (4)控制CPCI接口模塊與CPCI總線間的數據傳輸

        CPCI接口模塊由PCI9656組成,在FPGA中劃定一個獨立的功能模塊作為實現CPCI總線協議的接口控制器。該控制器主要包含一個FIFO控制邏 輯,完成本地板卡與CPCI總線之間的數據傳輸。主要完成以下功能:與PCI9656配合實現CPCI總線對目標設備的讀和寫、緩沖CPCI總線與 FIFO之間傳送的數據、控制FIFO的讀寫。本地讀寫CPCI總線只需對FIFO進行讀寫操作即可。

        4.3 CPCI傳輸接口設計

        為了保證本系統與后面板上其他處理系統的數據傳輸速率和效率,在設計中采用PCI9656作為CPCI接口芯片。PCI9656作為專門 的I/O加速器,支持CPCI格式傳輸,數據傳輸時鐘主頻最高為66 MHz,數據傳輸帶寬為64 b。其峰值傳輸速率可達528 MB/s,通過系統框圖可以看到,在設計中使用了CPCI的J1,J2,J3,J4四個接口,根據CPCI傳輸協議,J1和J2為64位PCI數據傳輸接 口。J3,J4為自定義方式接口,設計中定義J3為處理板和后面板的數據傳輸接口,J4為上下處理板間的數據傳輸接口。

        4.4 外部設備接口設計

        本系統通過公用總線連接的存儲器資源有:4個擴展應用的SDRAM,2個FLASH,2對擴展應用的FIFO,以及DSP片內存儲器資源。所有存儲器資源都通過統一的地址空間映射來進行區分。ADSP-TS201S的32位地址總線提供了高達4 GB的尋址空間,可以劃分為4部分:

        (1)主機尋址空間。地址映射范圍0X80000000~0XFFFFFFFF,用于片外主機接口的地址映射空間。
        (2)外部存儲塊空間。地址映射范圍0X30000000~0X7FFFFFFF,用于處理器外圍設備存儲器接口地址空間映射,包括通用的存儲器設備和SDRAM存儲器。設計中主要對此空間進行劃分,為外部存儲器分配單獨和惟一的地址空間。
        (3)多處理器空間。地址映射范圍0XOC000000~0X2FFFFFFF,主要用于多處理器構成的系統各個處理器間相互共享內部存儲空間映射。
        (4)片內存儲空間。地址映射范圍0X00000000~0X03FFFFFF,定義內部存儲器空間映射。

        外部存儲器可以分為SDRAM尋址空間和外部通用存儲空間。設計中,擴展連接的SDRAM將分配占用SDRAM尋址空間,而外部FLASH和FIFO將分配占用通用存儲空間。

        每兩片SDRAM擴展連接為64位形式,設計用MSSD0和MSSDl分別作為每兩片SDRAM的共用片選信號的控制信號,對應SDRAM尋址空間為0X4000 0000~0X44000000和0X50000000~OX54000000,可以分別獲得128 MB的存儲器尋址范圍,滿足SDRAM尋址要求。

        外部兩片FLASH的尋址空間劃分分別通過MS0_AB與BMS_AB和MS0_CD與BMS_CD這兩組信號作為片選信號,分配尋址空間為0X30000000~0X34 000000和0X34000000~0X348000000,尋址空間范圍為128 MB。

        外部4片FIFO,每兩片擴展接成32位輸出/輸入方式,在進行地址映射時,實際上可以映射到一個地址尋址空間,而通過控制讀寫信號來進行區分,使用 MSl信號作為FIFO使能信號,獲得分配的尋址空間0X38000000~0X40000000。為方便邏輯控制,MS1信號腳連接到FPGA上,通過 FPGA的邏輯譯碼來獲得對FIFO的尋址控制。

        另外,將ADSP TS201S的高八位地址線也連接到FPGA上,通過邏輯譯碼進一步可以獲得較為細致的地址劃分方案,為設計帶來更多的靈活性,同時也確保了設計的可靠性。

        5 系統軟件設計

        由于系統硬件是基于DSP+FPGA的結構,相應的軟件也分為兩個功能模塊。FPGA主要完成整個系統的數據傳輸邏輯控制,因此FPGA具體的處理流程嵌套在DSP的信號處理流程中。4片DSP主要完成信號的處理,大致的系統設計流程如圖3所示。

        4片DSP并行工作時,總線仲裁策略指定DSPl為主處理器,由它完成系統的初始化、數據程序配置、與CPCI工控機主機通信等,并參與運算工作。當系統 接收到數據時,首先判斷信號的傳輸方式,若是并行信號,由FPGA進行相應處理后寫入FIFO中,同時通過外部中斷告知DPS-l,隨即DSPl發出中斷 申請,總線仲裁令DSP1獲得總線控制權,讀取FIFO中的數據并轉存至公共存儲區;然后DSP1通過LINK口與其他DSP通信,進行任務分配,其他 DSP依次循環獲得總線控制權,讀取數據進行處理然后再存入存儲區;最后,由DSP4控制將存儲區里的數據寫入FIF-O,同時通知FPGA讀取并完成時 序轉換后傳輸到PCI9656,由PCI9656將數據傳輸到CPCI總線,完成這一幀數據的處理。若系統接收到的數據是由J3口傳輸來的串行信號,則先 由DSP2發出中斷申請,總線仲裁令DSP2獲得總線控制權,將接收到的數據轉存至公共存儲區;然后通過同樣的方式在4片DSP間進行任務分配和處理,由 DSP4寫入FIFO,最后由FPGA和PCI9656聯合將數據傳輸到CPCI總線,完成串行信號的處理。

        6 結語

        本文介紹了一種基于PFGA的多DSP并行處理系統的設計,重點對DSP并行結構設計進行了分析,并介紹了FPGA設計和外部設備接口設計。實際應用表 明,該多DSP并行處理系統應用于寬帶雷達信號處理時,能夠滿足任務中的各項指標,還能完成設計外的其他功能,并且易于控制,穩定可靠。本文提供的系統設 計方案能夠為處理寬帶雷達信號的其他研究人員提供一定的參考。



        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 泰宁县| 台山市| 滕州市| 扎鲁特旗| 宁强县| 夏邑县| 永年县| 桂阳县| 通化县| 永新县| 河池市| 榆树市| 亳州市| 永顺县| 钟祥市| 屏山县| 涪陵区| 册亨县| 定日县| 措美县| 宜阳县| 富阳市| 桃园市| 左贡县| 阿坝县| 邹城市| 长兴县| 手游| 新野县| 榆社县| 浪卡子县| 修水县| 盐城市| 富宁县| 姜堰市| 安阳市| 钟山县| 乌拉特中旗| 南宫市| 逊克县| 芦山县|