新聞中心

        EEPW首頁 > 嵌入式系統 > 業界動態 > 加速云基于FPGA的加速解決方案搞定高算力AI應用場景

        加速云基于FPGA的加速解決方案搞定高算力AI應用場景

        作者:左小木 時間:2018-04-19 來源:電子產品世界 收藏

        人工智能()和的不斷發展帶來對超高計算力的需求,使得相應硬件組成和算法架構也在不斷在創新中尋求突破,以達到新應用所需的計算能力。

        本文引用地址:http://www.104case.com/article/201804/378661.htm

        就近幾年的發展來看,高計算能力的處理器從硬件架構上基本可以分為三個陣營——GPU、和ASIC。相較于GPU、ASIC而言,的低延時、確定延時、高性能功耗比、靈活可配置計算精度、高速通信互聯I/O接口等特性,為其在產品設計及性能對比中屢屢拿下可觀戰績。

        近日,致力于異構和業務卸載的方案供應商杭州云信息技術有限公司基于推出兩大系列硬件產品——SC-OPS和SC-VPX,兩個IP庫——FDNN(深度學習庫)和FBLAS(數字加速庫),以及三大解決方案——深度學習解決方案、高性能計算機數字信號處理解決方案和邊緣計算解決方案。

        兩大系列硬件加速產品

        SC-OPS是加速云推出的全球首張Intel Stratix 10 FPGA加速卡,采用Intel最新14nm工藝的Stratix10GX2800 FPGA器件,集成了2753K LE和9.2T FLOPS單精度浮點處理能力,板載8組DDR4 2133MHz72bit顆粒,支持ECC,支持32GB內存容量和1092Gbps的訪問帶寬。單板支持12個200維雙精度線性方程求解,運算時間為466μs,其性能是x86系統的60~120倍;采用AlexNet卷積神經網絡,單卡可以實現4500幀/s以上圖像分類,廣泛應用于數據中心、云計算、機器視覺、深度學習、高性能計算、仿真、金融等領域。

        SC-VPX是一款超高計算密度的VPX刀片加速平臺,采用Intel Stratix 10 GX2800器件,兼容GX1650,6U整機可以支持92T/50TFLOPS單精度浮點運算能力,整機可以通過交互版互聯構筑更大的系統,同時系統可以擴展各種接口卡和存儲卡(單卡4TB容量,2GB讀寫性能),可以通過各種卡組合擴展各種應用。基于SC-VPX加速平臺可以構造業界先進、靈活、高效的信號處理和深度學習架構,主要定位高校研究所等單位的雷達,通信,深度學習相關領域的產品原型快速搭建和算法開發與應用。

        兩大IP庫

        深度學習加速庫FDNN是國內首個支持通用卷積神經網絡的FPGA加速庫,基于RTL級代碼,包含卷積、池化、全連接、非線性函數等參數可配置的深度學習基礎庫,兼容CAFFE/TensorFlow模型數據的參數可配置的CNN/DNN/RNN庫,后向更新算法、隨機初始化算法及SGD算法的參數可配置的深度學習訓練庫,以及VGG 16、GoogleNet、LeNet、YOLO、SSD、ResNet、Faster-RCNN各種常見模型。可以提供很高的性能和靈活配置特性。

        而高性能計算加速庫FBLAS是業界高性能的RTL級數學加速庫,含有矩陣運算、線性方程求解、微分方程求解、傅里葉變換(FFT)、三角函數、超越函數等多種運算可供直接調用,同時兼容OpenBlas庫接口。

        三大解決方案

        深度學習加速解決方案。由于FPGA具有很高的性能功耗比,而且基于門級電路設計使得FPGA是一個超低延時和確定延時的方案,FPGA可編程及動態可重構可以適應深度學習未來算法變化,IO可編程性可以滿足更多業務需求。為此,加速云推出一整套基于FPGA的深度學習加速方案,包括SC-OPM/SC-OPF/SC-OPS加速卡及FDNN加速庫,滿足客戶對深度學習高性能、靈活性加速要求。為了方便客戶使用高層語言開發,加速云提供基于FPGA完整的OpenCL異構開發環境,快速實現用戶自定義的深度學習加速方案。同時加速云也提供快速深度神經網絡定制加速服務。如下圖所示為某電商平臺采用加速云深度學習解決方案的OCR(Optical CharacterRecognition,光學字符識別)方案。

        數字信號處理解決方案。加速云的SC-OPS和SC-OPX產品針對5G通信和雷達等數字信號處理系統的要求,結合Intel最新14nm工藝的 Stratix10 FPGA系列,提供了一套完整的硬件和軟件相結合的數字信號處理解決方案,借助于自家的FBLAS數據加速庫,能夠實現高性能矩陣運算(矩陣乘、轉置、求逆、QR分解)和超高速FFT,以及具有高性能算法參數可配置的特點實現了多重信號分類(MUSIC)和自適應數字波束形成(ADBF)的核心算法,提高了5G通信和雷達抗干擾能力。另外,為了方便客戶使用高層語言開發,加速云提供基于FPGA完整的OpenCL異構開發環境,快速實現用戶自定義的信號處理加速方案。如下圖為采用加速云數字信號解決方案的ADBF(自適應數字波束形成)解決方案的相關性能。

        邊緣計算解決方案。現在工業控制領域面臨著三大趨勢:日益復雜的控制算法、低延時和高帶寬的工業控制總線,以及人工智能的工業應用,這對工業控制處理系統提出了包括高計算性能、強實時性、多IO接口能力等更高的要求。針對此,加速云采用高性能Intel Arria10 GX660器件的智能工控解決方案具有模塊化設計、強實時特性、高性能的算法IP加速和完整的OpenCL異構開發環境,可以實現新一代高性能邊緣計算網關,應用于各種工業環境。

        基于FPGA的異構計算將是計算架構的未來趨勢

        加速云創始人兼CEO鄔剛表示:“人工智能已經進入我們的生活,但是未來發展還存在瓶頸,需要硬件技術和算法方面的突破。異構計算是計算架構的未來趨勢,而FPGA 是實現異構計算的完美選擇。加速云創新的異構計算加速平臺解決方案,具有高性能、高效率、低延時特性以及可編程性和遠程可重構能力,非常適合云上的彈性業務的需求。我們希望能夠通過我們的技術,幫助更多的企業實現深度學習,在時代贏得先機。”



        關鍵詞: FPGA 加速 AI 大數據

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 松阳县| 民和| 德惠市| 八宿县| 肇州县| 安泽县| 印江| 峨山| 蒙城县| 玉环县| 安塞县| 黔西| 古丈县| 特克斯县| 南乐县| 西宁市| 阿勒泰市| 通河县| 余干县| 定南县| 平果县| 贵州省| 宜宾市| 东宁县| 甘德县| 上犹县| 克拉玛依市| 城固县| 和田市| 都江堰市| 浏阳市| 如皋市| 安新县| 浪卡子县| 弥渡县| 大田县| 大足县| 杭锦旗| 凤冈县| 聂拉木县| 陆良县|