四面出擊 Xilinx加速FPGA 在“超七大”數據中心中的主流應用
客戶, 合作伙伴, 標準,產品及工具! 2014 - 2016,兩年多的時間, 賽靈思從上述四大方面步步為營, 為 FPGA 在超大規模數據中心的應用做出了歷史性的貢獻, 尤其是今年全球超算大會SC 2106 上推出的可重配置的加速堆棧,為其在數據中心、機器學習等領域取代 GPU、CPU 甚至同類FPGA 提供了加速引擎。
本文引用地址:http://www.104case.com/article/201701/343256.htm回溯到2014年之前,在數據中心的領域,賽靈思都是一個陌生的名字, 短短不到三年的時間,賽靈思就已經在這個領域實現了無數里程碑式的突破,市場也獲得了迅速的發展,同時也成為眾多技術龍頭聯手的重要合作伙伴。
從客戶而言 — 全球七大超大規模云服務公司,已有3家采用了賽靈思FPGA,其中的百度于今年10月宣布,其已設計出賽靈思UltraScale? FPGA池,以加速機器學習推斷。
合作伙伴關系 — 高通公司和IBM宣布與賽靈思就數據中心加速開展戰略合作。與IBM的通力合作已構建了存儲網絡加速框架CAPI SNAP,能幫助開發人員采用賽靈思FPGA更方便地加速 NoSQL等應用。
標準上的領導地位 — 賽靈思一直引領著智能緩存一致性互聯標準CCIX開發的行業計劃。2016 年5月賽靈思、AMD、ARM、華為、IBM、Mellanox和高通聯手結為CCIX聯盟,5個月來該計劃的成員數量已是成立之初的3倍。
面向數據中心的軟件定義工具和產品 — 針對 FPGA 加速的SDAccel 軟件定義開發環境于 2014年發布。2016年11月,賽靈思發布采用高帶寬存儲器和 CCIX 技術的最新16nm Virtex? UltraScale?+ FPGA產品細節。
讓我們回顧一下最近兩年賽靈思在推動數據中心應用而發布的相關新聞:
2014-2015年
-2014年11月18日,Xilinx 宣布推出針對 OpenCL、 C和 C++的 SDAccel開發環境,將數據中心的單位功耗性能提高達25倍。
SDAccel是賽靈思SDx?系列的最新成員,將業界首款支持OpenCL、C和 C++內核任意組合的架構優化編譯器、庫、開發板完美結合在一起,在FPGA 上首次實現了完全類似CPU/GPU的開發和運行時間體驗。
https://china.xilinx.com/china/ch_prs_rls/2014/SDAccel.html
-2015年1月16日,Xilinx面向OpenCL、C和C++的SDAccel開發環境順利通過Khronos一致性測試。
賽靈思宣布,其面向OpenCL?、C和C++的SDAccel?開發環境順利通過Khronos OpenCL 1.0標準一致性測試。OpenCL標準為軟件開發人員提供了一個統一的編程環境,使其能夠編寫高效且可移植的代碼,從而能夠在賽靈思FPGA上輕松加速一系列各種算法的運行。
https://china.xilinx.com/china/ch_prs_rls/2015/sdaccelpress.html
-2015 年 11 月 19 日,Xilinx與IBM宣布戰略合作,攜手加速數據中心應用。
IBM和賽靈思聯合宣布開展一項多年戰略協作,在IBM POWER系統上運用賽靈思FPGA加速工作負載處理技術,以打造更高性能、更高能效的數據中心應用。雙方團隊聯手開發開放式加速基礎架構、軟件和中間件,以滿足機器學習、網絡功能虛擬化(NFV)、基因分析、高性能計算(HPC)和大數據分析等新興應用的需求。
http://china.xilinx.com/china/ch_prs_rls/2015/ibmstrategy.html
-2015年10月8日,高通和賽靈思聯手提供擁有更高效率和性能的異構計算解決方案,滿足下一代云計算架構演進的技術需求。
雙方宣布進行戰略技術合作,將在Qualcomm Technologies服務器平臺上,通過基于 FPGA的動態工作負載加速,提供具備全新效率與性能水平的、業界領先的異構計算解決方案。此次戰略合作覆蓋從板卡級到高度集成解決方案的多代產品。目標應用包括計算加速、大數據分析、機器學習、存儲和CloudRAN。
2016年-至今
-2016年2月15日,Xilinx發布數據中心生態系統投資計劃。
新計劃專門針對新興工作負載應用解決方案,如機器學習、圖像及視頻處理、數據分析、存儲數據庫加速以及網絡加速等,致力于進一步壯大云計算及NFV加速解決方案。計劃由“Xilinx 技術投資 (Xilinx Technology Ventures)”全權執行。
http://china.xilinx.com/china/ch_prs_rls/2016/datacenterecosystem.html
-2016年4月8日,Xilinx攜手IBM,通過SuperVessel OpenPOWER 開發云平臺實現 FPGA 加速。
內置在 SuperVessel中的賽靈思 SDAccel?開發環境,支持用C、C++和OpenCL實現FPGA加速,將為包括大數據分析和機器學習等性能要求嚴苛應用的開發提供支持。
http://china.xilinx.com/china/ch_prs_rls/2016/SuperVesselOpenPOWER.html
-2016年 5月25日,Xilinx宣布七大技術龍頭聯手,合力為數據中心及其它市場推出開放式加速架構。
AMD、ARM、華為、IBM、Mellanox、高通和賽靈思公司在最新加速器緩存一致性互聯 (CCIX)規范上互相聯手,支持多處理器架構和加速器無縫共享數據。
http://china.xilinx.com/china/ch_prs_rls/2016/joinforces.html
-2016年5月27日, Xilinx宣布擴大16nm UltraScale+產品路線圖,為數據中心新增加速強化技術。
結合16nm UltraScale+可編程邏輯與高帶寬顯存(HBM)存儲器和新型加速器互聯技術,滿足異構計算要求,支持新近宣布推出的加速緩存一致性互聯(CCIX)技術。
http://china.xilinx.com/china/ch_prs_rls/2016/16nmroadmap.html
-2016年10月18日, Xilinx宣布CCIX聯盟成員增長 3倍并推出相關規范。
CCIX聯盟成員數量已經迅速增至原來的三倍,且發布了聯盟成員相關規范。作為CCIX 聯盟創始成員,AMD、ARM、華為、IBM、邁絡思(Mellanox)、高通和賽靈思對新成員的加入表示了熱烈的歡迎。通過密切的協作,成員公司已經達成一致的CCIX規范標準,通過運用當今現有的生態系統,并加以改進,使其支持更高帶寬、更低時延和全面的一致性,從而滿足數據中心的互聯需求。
-2016年10月20日,Xilinx宣布百度數據中心采用Xilinx FPGA加速機器學習應用。
中文互聯網搜索引擎提供商百度正在采用賽靈思FPGA加速其中國數據中心的機器學習應用。賽靈思FPGA提供的功耗效率讓加速器能部署于整個數據中心,而且可將單位功耗性能比提升10-20倍。百度優化的FPGA平臺是專門針對圖像和語言識別等機器學習應用而精心打造。此外,百度還計劃采用這些平臺來開發商業可行的自動駕駛汽車。
-2016年11月14日,Xilinx發布采用高帶寬存儲器和CCIX技術的新型 16nm Virtex UltraScale+ FPGA細節,四款新器件革命性地將存儲器帶寬提升了20倍,可以充分滿足計算密集型應用的需求。
采用HBM和CCIX技術的新型16nm Virtex? UltraScale+? FPGA,擁有最高存儲器帶寬,相比DDR4 DIMM將存儲器帶寬提升了20倍,而相比競爭性存儲器技術,則將單位比特功耗降低4倍。這些新型器件專為滿足諸如機器學習、以太網互聯、8K視頻和雷達等計算密集型應用所需的更高存儲器帶寬而打造,同時還提供CCIX IP,支持任何 CCIX處理器的緩存一致性加速,滿足計算加速應用要求。
-2016年11月14日,領先的HPC (高性能計算)云平臺提供商Nimbix宣布與Xilinx 聯手擴展FPGA 負載加速在云端的應用。
Nimbix 宣布在其Nimbix云平臺上已經提供賽靈思SDAccel? 開發環境,可以提供按需 開發、測試和部署基于 FPGA的加速工作負載。
https://www.nimbix.net/blog/2016/11/14/nimbix-xilinx-expand-fpga-cloud/
-2016年11月15日, Xilinx可重配置加速堆棧提供業界最高計算效率,比CPU快40倍,其它 FPGA快2-6倍
賽靈思推出可重配置加速堆棧方案,可以幫助全球最大的云端服務供應商們快速開發和部署加速平臺。專門針對云級應用而設計的基于FPGA的賽靈思可重配置加速堆棧,包括庫、框架集成、開發板并支持OpenStack。通過賽靈思FPGA,該可重配置加速堆棧方案提供了業界最高的計算效率:比x86服務器CPU高出40倍;比競爭型FPGA方案高出6倍。
評論