新聞中心

        EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 使用帶有片上高速網(wǎng)絡(luò)的FPGA的八大好處

        使用帶有片上高速網(wǎng)絡(luò)的FPGA的八大好處

        作者: 時間:2020-06-04 來源:電子產(chǎn)品世界 收藏

        輕松支持硬件虛擬化

        本文引用地址:http://www.104case.com/article/202006/413858.htm

        Speedster7t NoC通過利用NAP及其AXI接口,為設(shè)計人員提供了在單個FPGA中創(chuàng)建虛擬化安全硬件的獨特能力。將可編程邏輯設(shè)計直接連接到NoC只需要在邏輯設(shè)計中實例化一個NAP及其AXI4接口即可。每個NAP還具有一個相關(guān)的地址轉(zhuǎn)換表(),該表將NAP上的邏輯地址轉(zhuǎn)換為NoC上的物理地址。NAP的允許可編程邏輯模塊使用本地地址,同時將NoC定向事務(wù)映射到NoC全局存儲映射所分配的地址。此項重新映射功能可以以多種方式使用。例如,它可以用于允許加速引擎的所有相同副本使用基于零的虛擬尋址,同時將數(shù)據(jù)流量從每個加速引擎發(fā)送到不同的物理存儲位置。

        每個條目還包含一個訪問保護(hù)位,以防止該節(jié)點訪問被禁止的地址范圍。該功能提供了一種重要的進(jìn)程間安全機制,可防止同時在一個Speedster7t FPGA上運行的多個應(yīng)用或多個任務(wù)干擾分配給其他應(yīng)用或任務(wù)的存儲模塊。這種安全機制還有助于防止由于意外、偶然甚至是故意的存儲地址沖突而導(dǎo)致系統(tǒng)崩潰。此外,設(shè)計人員可以使用此方案阻止邏輯功能訪問整個存儲設(shè)備。

        Memory Space:存儲空間

        image.png

        圖5:致力于開發(fā)同一個FPGA的多個設(shè)計團(tuán)隊

        簡化團(tuán)隊協(xié)同設(shè)計

        基于團(tuán)隊的協(xié)同化FPGA設(shè)計并不是一個新的概念,但是底層架構(gòu)和布線依賴于FPGA的其他部分,從而使得實現(xiàn)這個簡單概念非常具有挑戰(zhàn)性。一旦一個團(tuán)隊完成了設(shè)計的一部分,另一個設(shè)計其他部分的團(tuán)隊在嘗試訪問設(shè)備另一端的資源時,通常會遇到挑戰(zhàn),因為需要在已經(jīng)完成的設(shè)計部分進(jìn)行布線。同樣,對一部分已進(jìn)行設(shè)計布線的FPGA的區(qū)域或大小進(jìn)行更改,可能會對所有其他FPGA設(shè)計模塊產(chǎn)生連鎖影響。

        使用Speedster7t NoC,可以將設(shè)計模塊映射到FPGA的任何部分,并且可以對資源分配進(jìn)行更改,而不會影響其他FPGA模塊的時序、布局或布線。由于器件中所有的NAP都支持每個設(shè)計模塊無限制地訪問NoC進(jìn)行通信,因此使得基于團(tuán)隊的設(shè)計成為可能。因此,如果一個設(shè)計的某個部分在規(guī)模上有所增大,只要有足夠的FPGA資源可用,數(shù)據(jù)流就會由NoC自動管理,從而使設(shè)計人員不必?fù)?dān)心是否滿足時序,以及對其他團(tuán)隊成員正在進(jìn)行的設(shè)計的其他部分可能帶來的后續(xù)影響。

        Design Team:設(shè)計團(tuán)隊

        image.png

        圖6:獨立的I/O和邏輯驗證

        通過獨立的接口和邏輯驗證加快設(shè)計速度

        Speedster7t NoC的另一個獨特功能是支持設(shè)計人員獨立于用戶邏輯去配置和驗證I/O連接。例如,一個設(shè)計團(tuán)隊可以驗證PCIe至GDDR6的接口,而另一個設(shè)計團(tuán)隊可以獨立地驗證內(nèi)部邏輯功能。這種獨立操作之所以能夠?qū)崿F(xiàn),是因為NoC的外圍部分連接了PCIe、GDDR6、DDR4和,而不會消耗任何FPGA資源。這些連接可以在不使用任何HDL代碼的情況下進(jìn)行測試,從而可以同時獨立地驗證接口和邏輯。該功能消除了驗證步驟之間的依賴關(guān)系,并實現(xiàn)了比傳統(tǒng)FPGA架構(gòu)更快的總體驗證速度。

        Design Team 1: I/O Verification:設(shè)計團(tuán)隊1:I/O驗證

        Design Team 2: Logic Verification:設(shè)計團(tuán)隊2:邏輯驗證

        image.png

        圖7:分組模式下的數(shù)據(jù)總線重排

        采用分組模式(Packet Mode)簡化400 Gbps以太網(wǎng)應(yīng)用

        在FPGA中實現(xiàn)高速400 Gbps以太網(wǎng)數(shù)據(jù)通路所面臨的挑戰(zhàn)是找到一種能夠滿足FPGA性能要求的總線位寬。對于400G以太網(wǎng),全帶寬運行的唯一可行選擇是運行在724 MHz的1,024位總線,或運行在642 MHz的2,048位總線。如此寬的總線難以布線,因為它們在FPGA架構(gòu)內(nèi)消耗了大量的邏輯資源,即使在最先進(jìn)的FPGA中也會在這樣的速率要求下產(chǎn)生時序收斂挑戰(zhàn)。

        但是,在Speedster7t架構(gòu)中,設(shè)計人員可以使用一種稱為分組模式(packet mode)的新型處理模式,其中傳入的以太網(wǎng)流被重新排列為四個較窄的32字節(jié)數(shù)據(jù)包,或者四條獨立的以506 MHz頻率運行的256位總線。這種模式的優(yōu)點包括:當(dāng)數(shù)據(jù)包結(jié)束時減少了字節(jié)的浪費,并且可以并行傳輸數(shù)據(jù),而不必等到第一個數(shù)據(jù)包完成后才開始第二個數(shù)據(jù)包的傳輸。Speedster7t FPGA架構(gòu)的設(shè)計旨在通過將以太網(wǎng)MAC直接連接到特定的NoC列,然后使用用戶實例化的NAP從NoC列連接到邏輯陣列中,從而啟用分組模式。使用NoC列,數(shù)據(jù)可以沿著該列被發(fā)送到FPGA架構(gòu)中的任何位置,以便進(jìn)一步處理。使用ACE設(shè)計工具配置分組模式,可大大簡化用戶設(shè)計,并在處理400 Gbps以太網(wǎng)數(shù)據(jù)流時提高了效率。

        Packet:數(shù)據(jù)包

        Byte:字節(jié)

        image.png

        圖8:使用分組模式的400 Gbps以太網(wǎng)

        降低邏輯占用并提高整體FPGA性能

        與以前的傳統(tǒng)FPGA相比,Speedster7t NoC具有更大的靈活性和更簡單的設(shè)計方法。一個潛在的好處是NoC會自動減少給定設(shè)計所需的邏輯量,設(shè)計可以使用NoC代替FPGA邏輯陣列來進(jìn)行模塊間布線。ACE設(shè)計工具自動管理將設(shè)計單元連接到Speedster7t NoC的復(fù)雜性,因此設(shè)計人員無需編寫HDL代碼即可實現(xiàn)生產(chǎn)率。這種方法簡化了實現(xiàn)時序收斂的耗時挑戰(zhàn),同時又不會由于FPGA邏輯陣列內(nèi)的布線擁塞而降低整體應(yīng)用性能。NoC還可以在不犧牲FPGA性能的情況下提高器件利用率,并且可以顯著增加可用于計算的查找表(LUT)數(shù)量。

        為了強調(diào)這一優(yōu)勢,我們創(chuàng)建了一個支持二維輸入圖像卷積的示例設(shè)計。每個模塊都使用Speedster7t機器學(xué)習(xí)處理器(MLP)和BRAM模塊,每個MLP在一個周期內(nèi)執(zhí)行12次int8乘法。將40個二維卷積模塊鏈接在一起,以利用器件中幾乎所有可用的BRAM和MLP資源。總共有40個二維卷積示例設(shè)計實例并行運行,使用了94%的MLP、97%的BRAM、但僅使用了8%的LUT。在總的可用LUT中,其余92%的LUT仍可被用于其他功能。

        隨著更多的實例被內(nèi)置于器件中,單個單元模塊的最高頻率()不會降低。該設(shè)計能夠保持性能,因為進(jìn)出每個二維卷積模塊的數(shù)據(jù)可以直接從連接到NoC的NAP訪問GDDR6內(nèi)存,而無需通過FPGA邏輯陣列進(jìn)行布線。

        image.png

        圖9:一個帶有40個二維卷積模塊實例的Speedster7t器件

        結(jié)論

        Speedster7t NoC實現(xiàn)了FPGA設(shè)計過程的根本轉(zhuǎn)變。Achronix是第一家實現(xiàn)二維片上網(wǎng)絡(luò)(2D NoC)的FPGA公司,該2D NoC可以連接所有的系統(tǒng)接口和FPGA邏輯陣列。這種新型架構(gòu)使Achronix公司的FPGA特別適用于高帶寬應(yīng)用,同時顯著提高了設(shè)計人員的生產(chǎn)率。由于NoC管理了FPGA中設(shè)計的數(shù)據(jù)加速器和高速數(shù)據(jù)接口之間的所有網(wǎng)絡(luò)功能,因此設(shè)計人員只需要設(shè)計其數(shù)據(jù)加速器并將其連接到NAP原語即可。ACE和NoC負(fù)責(zé)其他所有事務(wù)。通過使用NoCFPGA設(shè)計人員將受益于:

        ●   在整個FPGA邏輯陣列中簡化高速數(shù)據(jù)分發(fā)

        ●   自動將PCIe接口連接到存儲器

        ●   在獨立的FPGA邏輯陣列模塊上實現(xiàn)安全的局部重新配置

        ●   輕松支持硬件虛擬化

        ●   簡化團(tuán)隊化設(shè)計

        ●   通過獨立的接口和邏輯驗證加快設(shè)計速度

        ●   采用分組模式簡化400 Gbps以太網(wǎng)應(yīng)用

        ●   降低邏輯占用并提高整體FPGA性能

        image.png

        Achronix半導(dǎo)體公司


        上一頁 1 2 下一頁

        關(guān)鍵詞: ATT FCU SRAM FMAX

        評論


        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 定远县| 察隅县| 紫云| 佳木斯市| 景谷| 临泽县| 红原县| 香河县| 三河市| 沧州市| 固镇县| 揭阳市| 文水县| 扶绥县| 黔江区| 永登县| 石泉县| 城口县| 观塘区| 墨脱县| 铜鼓县| 绥棱县| 子洲县| 卢湾区| 邛崃市| 济宁市| 荣昌县| 桃园县| 汉川市| 天水市| 南宁市| 航空| 龙泉市| 巫溪县| 竹北市| 凌海市| 长汀县| 瑞金市| 濉溪县| 通化市| 莱州市|