博客專欄

        EEPW首頁 > 博客 > 燧原科技推中國最大AI計算芯片!公布最新產品路線圖

        燧原科技推中國最大AI計算芯片!公布最新產品路線圖

        發布人:芯東西 時間:2021-07-09 來源:工程師 發布文章
        國產云端AI芯片走向落地新競賽。

        作者 |  心緣
        編輯 |  漠影
        芯東西7月7日報道,在2021世界人工智能大會期間,上海燧原科技推出第二代云端AI訓練芯片邃思2.0及訓練產品云燧T20/T21,以及全新升級的馭算Topsrider 2.0軟件平臺。邃思2.0是迄今中國最大的AI計算芯片,采用日月光2.5D封裝的極限,在國內率先支持TF32精度,單精度張量TF32算力可達160TFLOPS。同時,邃思2.0也是首個支持最先進內存HBM2E的產品。



        云燧T20/T21基于邃思2.0而打造,由8000多張第二代云燧訓練卡組成的云燧智算集群2.0,單精度最高算力達1.3EFLOPS,即130000TFLOPS。燧原科技成立于2018年3月,此前已相繼推出首款云端AI訓練芯片邃思、首款云端AI訓練加速卡云燧T10和AI推理加速卡云燧i10,以及配套的“馭算”軟件平臺。


        成立至今,燧原科技連續獲得過5輪融資,累計融資額近32億元人民幣。其最新一筆融資為今年1月完成的18億人民幣C輪融資,由中信產業基金、中金資本旗下基金、春華資本領投。


        公布最新五年產品路線圖


        燧原科技創始人、COO張亞林公布了燧原產品定理:燧原的每一代產品必須比前一代在“平均業務”中每瓦性能提升超3倍,軟件后向兼容可靠。


        現場,張亞林還發布了燧原科技的最新路線圖。到2023年,燧原科技計劃打造3款云端訓練計算產品、3款云端推理計算產品,將性能功耗比提升至初代的14倍,并同步升級Matrix集群。



        同一時期,馭算Topsrider軟件平臺從全棧模塊發展到訓推一體,繼而走向泛AI生態。


        燧原科技創始人兼CEO趙立東分享道,下面這些落地場景將形成燧原科技今年的收入。


        燧原研發團隊的主要成員均擁有15年以上的高端芯片及相關軟件生態系統開發和量產經驗,曾成功開發并量產多顆大型芯片。截至今年5月,其團隊規模已經超過500人,其中近90%為研發團隊,博士及碩士占比近70%。目前燧原已獲得52項專利,其中包括45項發明專利,同時有近30項專利正在申請中。這些專利內容涵蓋了芯片的運算單元、核心功能模塊、到封裝及系統集群,以及軟件的架構和優化。超大規模智算集群,最高算力達1.3E


        今天,燧原科技推出與友商合作打造的全新產品品牌云燧智算集群CloudBlazer Matrix 2.0,集合8192張云燧訓練卡,可實現最高1.3E(130000T)的單精度智能算力集群


        “在全世界還沒有人能達到在單精度算力上用8000張卡實現超過1E的算力?!睆垇喠终f,這代表著燧原科技正式用集群化產品登上中國智能計算和新基建算力的舞臺。同時,云燧智算集群能驅動綠色數字化,液冷PUE可降到1.5以下,大幅提升整個集群的能效。燧原與合作伙伴的聯合開發,一起構建超大規模的液冷智能數據中心,以響應國家“低碳算力”和“綠色一體化智能計算”的戰略方向。

        國內最大AI芯片,五大特性解讀


        燧原云燧智算集群2.0包括邃思DTU 2.0、云燧T20和T21訓練產品、新一代馭算軟件,能有效降低AI超算集群的整體復雜度和成本。其中,燧原科技第二代云端AI訓練芯片邃思DTU 2.0經過了全新升級迭代,其計算能力、存儲和帶寬、互聯能力較第一代訓練產品有巨大提升,對超大規模的模型支持能力獲得顯著增強。


        1、封裝:中國最大的計算芯片張亞林介紹道,邃思2.0是中國最大尺寸的計算芯片,采用2.5D高級封裝技術,突破了臺灣頂級封裝合作伙伴的封裝歷史極限,共整合9顆芯片,實現57.5mm x 57.5mm的封裝尺寸。

        2、計算:TF32精度峰值算力達160TFLOPS邃思2.0進行了大規模的架構升級,新一代全自研的GCU-CARA全域計算架構針對AI計算的特性進行深度優化,夯實了支持通用異構計算的基礎。該芯片支持全面的計算精度,涵蓋從FP32、TF32、FP16、BF16到INT8。張亞林說,這是中國首款支持單精度張量TF32數據精度的AI芯片,算力達160TFLOPS。在單精度FP32下,邃思2.0的峰值算力達到40 TFLOPS;同時該芯片支持定點整數精度,峰值算力達320TOPS。

        3、數據:植入完全可編程的數據流數據被認為是AI在芯片處理上僅次于計算的部分,因為數據流的處理會直接決定計算的效率,燧原科技在整個芯片內部,植入了完全可編程的數據流。軟件指令驅動的傳輸和數據計算,保證了數據的吞吐量,以及不同模型下的效率,完全支撐標量、向量和張量的高效數據處理,以及多地址廣播。4、存儲:率先支持HBM2E先進存儲邃思2.0的中心是主芯片,在邊緣有4顆三星最先進的存儲芯片HBM2E,高配支持64GB內存,最大帶寬達1.8TB/s。據悉,這是中國首款支持世界最先進存儲HBM2E和單芯片64GB內存的產品。5、互聯:高速互聯支撐算力擴展GCU-LARE全域互聯技術是燧原專為AI訓練集群研發的互聯技術,提供雙向300 GB/s互聯帶寬,支持數千張云燧CloudBlazer加速卡互聯,可實現優異的線性加速比。


        訓練卡算力比肩友商旗艦


        云燧T20和云燧T21是基于邃思2.0打造的兩款AI訓練加速板卡。具體參數如下:

        燧原科技還現場展示了T20的Benchmark,由圖可見,云燧T20 TF32精度性能平均2.5倍于友商次旗艦。

        在多類模型測試中,云燧T20與友商旗艦性能幾乎不分伯仲。


        軟件平臺同步升級:更高更快更通用


        此次同步升級的馭算Topsrider,是燧原科技自主知識產權的計算及編程平臺。張亞林介紹道:“升級后的馭算軟件平臺更加便捷易用和客戶友好,燧原科技也可針對客戶的場景和業務模型提供軟件定制化服務和優化,打造差異化解決方案?!?/span>

        總體來說,馭算Topsrider2.0有三大特點:更高性能算力、更便捷高效開發、更靈活通用支持。升級的馭算平臺通過軟硬件協同架構設計,充分發揮邃思2.0的性能,并借助側寫工具、自動化調整等功能進一步釋放硬件算力,同時,其高效并行通信庫支持超大集群高線性加速比。該平臺對開發者很友好。開放升級的編程模型和可擴展的算子接口,為客戶模型的優化提供了快捷的自定義算子開發能力。馭算也提供完善編譯器和工具鏈支持、開箱即用的圖形化整合開發環境、動態形狀自動編譯和高性能運行支持。當前馭算Topsrider2.0基于算子泛化技術及圖優化策略,可支持主流深度學習框架下的各類模型訓練和ONNX模型轉換;設備虛擬化方面,最大可支持4個MID用戶。
        公布“燎原”計劃,構建通用異構計算生態


        面向生態建設,燧原科技創始人兼CEO趙立東宣布推出燧原異構計算生態“燎原”計劃,有原始創新、標準化、生態共建三大特征。這一計劃的目標是以AI為起點,構建通用異構計算生態,構建標準化技術體系,共建完整生態服務數字中國。

        除了在深度學習計算、通用人工智能領域外,燎原計劃還會透過通用異構計算來涵蓋科學和工程計算,以及視覺計算相關的視頻編解碼和圖形渲染等。趙立東說,這個表列將根據市場發展和需求不斷增加。


        “燧原已經在原始創新的路上了,但是,所有的事情必須要腳踏實地。”趙立東說,“這才能夠使得我們真正實現自主可控、原始創新,真正建立中國強大的人工智能算力。路雖遠,行則將至。事雖難,不做不成?!?/span>結語:國產云端AI芯片走向落地新競賽


        完全自研的軟硬件架構,使得燧原科技在知識產權和產品升級迭代上可以自主掌控方向和節奏。成立三年以來,燧原科技嚴格遵循每年推出一款云端計算新品的節奏,完成了大芯片、軟件全棧、系統集群從產品定義、設計驗證、流片到產品的最終商業落地。這樣的研發速度和落地能力,在國內云端AI芯片創企中當屬前排。如今云端AI芯片賽道持續受到資本的青睞,更多的新興初創公司選擇涌入其中,賽道正變得愈發擁擠。與此同時,隨著更多云端AI芯片產品開始走向落地,誰能脫穎而出,將交給市場來說話。


        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: AI計算

        技術專區

        關閉
        主站蜘蛛池模板: 吉安县| 和政县| 肥城市| 芜湖市| 赞皇县| 饶阳县| 舞钢市| 汉中市| 商河县| 湘乡市| 凤台县| 原阳县| 平武县| 喜德县| 桓仁| 大厂| 谢通门县| 抚松县| 诸城市| 孙吴县| 祁门县| 清苑县| 隆尧县| 云南省| 若尔盖县| 桐城市| 唐山市| 湘阴县| 鸡西市| 边坝县| 镇平县| 邮箱| 柘荣县| 英吉沙县| 荥阳市| 崇左市| 巴中市| 共和县| 同江市| 法库县| 广州市|