新聞中心

        EEPW首頁 > 嵌入式系統(tǒng) > 業(yè)界動態(tài) > 英特爾:下一代DNN到來時 未來FPGA能將敗GPU

        英特爾:下一代DNN到來時 未來FPGA能將敗GPU

        作者: 時間:2017-03-24 來源:量子位 收藏
        編者按:當下一代DNN到來時,F(xiàn)PGA的表現(xiàn)能否擊敗GPU?英特爾對比兩代FPGA以及最新的TITAN X GPU,結果顯示目前DNN算法的趨勢可能有利于FPGA。

          在最近的國際研討會(IS)上,加速器架構實驗室(AAL)的Eriko Nurvitadhi博士,發(fā)表題為《Can s beat GPUs in Accelerating Next-Generation Deep Neural Networks》的報告,分享了的最新研究。

        本文引用地址:http://www.104case.com/article/201703/345681.htm

          這一研究,主要評估在DNN(深度神經(jīng)網(wǎng)絡)算法領域,兩代FPGA(Intel Arria10和Intel Stratix 10),與NVIDIA TITAN X Pascal GPU相比性能如何。


        英特爾:下一代DNN到來時 未來FPGA能將敗GPU

          △ 深度神經(jīng)網(wǎng)絡概述

          英特爾表示在應用領域,F(xiàn)PGA在DNN研究中表現(xiàn)非常出色,可用于需要分析大量數(shù)據(jù)的AI、大數(shù)據(jù)或機器學習等領域。使用經(jīng)修剪或緊湊的數(shù)據(jù)類型與全32位浮點數(shù)據(jù)(FP32)時,測試的Intel Stratix 10 FPGA的性能優(yōu)于GPU。

          除了性能外,F(xiàn)PGA還具有強大的功能,因為它們具有適應性,通過重用現(xiàn)有的芯片可以輕松實現(xiàn)更改,從而讓團隊在六個月內(nèi)從一個想法進入原型。

          而構建一個ASIC需要18個月。

          FPGA重要性正在提升


        英特爾:下一代DNN到來時 未來FPGA能將敗GPU

          △ FPGA非常適用于DNN

          硬件:與高端GPU相比,F(xiàn)PGA具有卓越的能源效率(性能/瓦特),但還有不被熟知的高峰值浮點性能。FPGA技術正在迅速發(fā)展。即將推出的英特爾Stratix 10 FPGA提供超過5,000個硬件浮點單元(DSP),超過28MB的片上RAM(M20K),與高帶寬內(nèi)存等特性。

          基于14nm工藝的英特爾Stratix 10在FP32吞吐量方面達到峰值9.2TFLOP/s。相比之下,最新的Titan X Pascal GPU的FP32吞吐量為11TFLOP/s。

          新興的DNN算法:更深的網(wǎng)絡提高了精度,但是大大增加了參數(shù)和模型大小。這增加了對計算、帶寬和存儲的需求。因此,新興趨勢是采用緊湊型低精度數(shù)據(jù)類型,遠低于32位。16位和8位數(shù)據(jù)類型正在成為新常態(tài),也得到DNN軟件框架(例如TensorFlow)的支持。

          新興的低精度和稀疏DNN算法比傳統(tǒng)的密集FP32 DNN提供了數(shù)量級的算法效率改進,但是它們引入了難以處理的不規(guī)則并行度和定制數(shù)據(jù)類型。這時FPGA的優(yōu)勢就體現(xiàn)出來了。這種趨勢使未來FPGA成為運行DNN,AI和ML應用的可行平臺。

          研究所用的硬件和方法


        英特爾:下一代DNN到來時 未來FPGA能將敗GPU

          GPU:使用已知的庫(cuBLAS)或框架(Torch with cuDNN)

          FPGA:使用Quartus Early Beta版本和PowerPlay

          研究一:矩陣乘法(GEMM)測試

        英特爾:下一代DNN到來時 未來FPGA能將敗GPU

          矩陣乘法(GEMM)測試的結果。GEMM是DNN中的關鍵操作,上述四個不同類型的測試表明,除了在FP32 Dense GEMM測試中,Stratix 10與TITAN X仍有差距。另外三項測試中新一代英特爾FPGA的表現(xiàn)都優(yōu)于GPU。

          研究二:使用三元ResNet DNNs測試

        英特爾:下一代DNN到來時 未來FPGA能將敗GPU


          三進制DNN最近提出約束神經(jīng)網(wǎng)絡權重為+1,0或-1。這允許稀疏的2位權重,并用符號位操作代替乘法。與許多其他低精度和稀疏的DNN不同,三元DNN可以提供與現(xiàn)有技術DNN(即ResNet)相當?shù)木取?/p>

          上圖右半部分,顯示了英特爾Stratix 10 FPGA和TITAN X GPU的ResNet-50的性能和性能/功耗比。即使對于保守的性能估計,英特爾Stratix 10 FPGA已經(jīng)比實現(xiàn)了TITAN X GPU性能提高了約60%。在性能/功耗比方面,英特爾Stratix 10比TITAN X要好2.3倍到4.3倍。

          結論

          再說一次,這個研究報告出自英特爾,這個研究團隊還指出,除了DNN之外,F(xiàn)PGA在其他不規(guī)則應用程序以及延遲敏感程序(如ADAS)等領域也有機會。



        關鍵詞: 英特爾 FPGA

        評論


        相關推薦

        技術專區(qū)

        關閉
        主站蜘蛛池模板: 尼木县| 绵竹市| 太康县| 曲周县| 静乐县| 灵石县| 通州市| 桑日县| 汉川市| 肃北| 溧阳市| 从江县| 吴忠市| 滨海县| 琼海市| 博罗县| 丹寨县| 炉霍县| 拉萨市| 贞丰县| 德钦县| 镇巴县| 中阳县| 盱眙县| 广平县| 汉阴县| 肇庆市| 连云港市| 塔城市| 疏勒县| 沂源县| 化德县| 贵阳市| 阿拉善盟| 陇西县| 平阳县| 竹溪县| 吴堡县| 怀来县| 灵璧县| 溆浦县|