博客專欄

        EEPW首頁 > 博客 > 企業 | 中國最大的計算芯片亮相,突破封裝極限

        企業 | 中國最大的計算芯片亮相,突破封裝極限

        發布人:旺材芯片 時間:2021-07-09 來源:工程師 發布文章

        在近年來興起的國產芯片發展浪潮中,成立于2018年的燧原科技必然是當中不得不提的一個。


        作為一家專注人工智能領域云端算力平臺,開發自主知識產權的高算力、高能效比、可編程的通用人工智能訓練和推理產品的企業,燧原科技自2018年成立以來,就獲得了多家領先資本的青睞。截止今年,公司已經獲得了32億人民幣的投資。在這些資金的推動下,公司在產品方面也獲得了高速發展。



        如上圖所示,燧原在成立次年,就推出了公司的第一代訓練芯片“邃思1.0”和“云燧T10/T11”人工智能訓練加速卡。并在接下來的一年里獲得了客戶和行業的認可。到了近日,燧原科技又帶來了公司新一代的芯片“邃思2.0”和全新的“云燧T20/T21”。給相關應用的性能帶來了大幅度提升。從某種程度看,燧原的這些產品還刷新了中國芯片的記錄。


        中國最大的計算芯片


        “我們新發布的邃思2.0是中國最大的計算芯片,與競爭對手的最新旗艦相比,邃思2.0也毫不遜色”,燧原科技COO張亞林在發布會上強調。從他的介紹我們可以看到,燧原科技的新一代芯片采用了2.5D封裝,在其中整合了9顆芯片。這樣的設計也使得整個芯片的整體封裝尺寸做到了驚人的57.6mm×57.6mm,達成國內領先的成就。
        據介紹,邃思2.0進行了大規模的架構升級,采用了新一代全自研的GCU-CARA全域計算架構,針對人工智能計算的特性進行深度優化,夯實了支持通用異構計算的基礎;支持全面的計算精度,涵蓋從FP32、TF32、FP16、BF16到INT8,并成為中國首款支持單精度張量TF32數據精度的人工智能芯片。單精度FP32峰值算力達到40 TFLOPS,單精度張量TF32峰值算力達到160 TFLOPS,以上數據均為國內第一。

        此外,通過對HBM2E存儲的采用,燧原科技讓“邃思2.0”擁有了海量的吞吐能力。
        從張亞林的介紹我們得知,邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64 GB內存,帶寬達1.8 TB/s。值得一提的是,“邃思2.0”是中國第一顆支持世界最先進存儲HBM2E和單芯片64 GB內存的產品。

        在發布邃思2.0的同時,燧原科技還帶了公司的全新產品路線圖。張亞林在會上更是公布了燧原產品定理。他表示,燧原的每一代產品必須比前一代在“平均業務”中將每瓦性能提升三倍以上。在成本方面,也會更有優勢。軟件更是必然會后向兼容可靠。

        基于這樣的思路,燧原發布了公司訓練計算產品和推理計算產品的路線圖。張亞林表示,公司的下一代訓練芯片將在2023年面世,每瓦性能會比邃思2.0提升兩倍。屆時還會有推理芯片同步亮相,其性能也將獲得大幅提升。

        不輸友商旗艦的加速卡


        得益于邃思2.0的優越性能,燧原科技打造出了不輸友商旗艦的加速卡云燧T20/T21.

        如上圖所示,燧原科技第二代通用人工智能訓練加速卡“云燧T20”是一個全高全長的PCIE板卡,在FP 32/TF 32下的峰值算力可以做到134.4T(單精度張量)和33.6T(單精度)。在BF16/FP16下的峰值算力則能做到134.4T。INT8的峰值算力更是達到了268.8T。這樣的數據讓其在與友商的旗艦相比,也能夠做到不相上下。這對于一個成立僅幾年的公司而言,是一個難得的成就。

        至于采用OAM模組模式設計的云燧T21,如上圖所示,也在多個模式下擁有杰出的表現。
        除了在計算能力上有了大幅度的提升,燧原科技同時還在互聯與軟件上同步投入,這讓公司能夠在降低開發者開發門檻的同時,還能提升板卡在系統中的性能。

        據介紹,燧原在新產品中引入GCU-LARE全域互聯技術,作為一項公司專為人工智能訓練集群研發的互聯技術,GCU-LARE能提供雙向300 GB/s互聯帶寬,支持數千張云燧CloudBlazer加速卡互聯,實現優異的線性加速比。
        與此同時,燧原自主知識產權的計算及編程平臺馭算TopsRider也獲得了升級。

        燧原方面表示,通過軟硬件協同架構設計,全新的馭算TopsRider能夠充分發揮邃思2.0的性能;基于算子泛化技術及圖優化策略,能支持主流深度學習框架下的各類模型訓練;再通過利用Horovod分布式訓練框架與GCU-LARE互聯技術相互配合,為超大規模集群的高效運行提供解決方案。開放升級的編程模型和可擴展的算子接口,為客戶模型的優化提供了自定義的開發能力。

        在發布兩款加速卡的同時,燧原還介紹了一個基于公司訓練卡打造的超大規模智算集群。張亞林告訴記者,這個名為云燧智能集群(CloudBlazer Matrix 2.0)的產品包含了8192張云燧訓練卡,可實現最高1.3E的算力。放眼全球,這在之前是沒有人能做到的。“這代表著燧原正使用集群化產品登上中國智能計算和新基建算力舞臺”,張亞林強調。

        共推生態


        在產品發布會的同期,燧原科技CEO趙立東還帶來了公司在生態方面的計劃。
        他首先指出,在工業4.0“智造”時代,人工智能是關鍵動力。但因為摩爾定律放緩,產業必須會加快在異構計算的投入。那就意味著以芯片為核心的算力是工業4.0兵家必爭之地。基于這個考慮,燧原科技推出了異構計算生態——“燎原”計劃。
        趙立東表示。“燎原”計劃的目標有三個,分別是以人工智能為起點,構建通用異構計算生態;構建標準化的技術體系以及共建完整生態服務數字中國。而“燎原”計劃的內涵也包括繁榮開放的開發者生態、健康互利的產業生態和持續創新的教科研生態。
        趙海東進一步指出,經過幾年的發展,燧原科技已經發展起了一個研發人員接近90%的超過五百人團隊。這個擁有深厚水平的團隊也圍繞芯片的方方面面,為公司積累下了52項專利(包括45項發明專利),公司同時還有近30項專利正在申請。
        從當前的行業現狀看來,無論是在云端AI芯片,還是云端推理芯片,都擁有巨大的成長基于。尤其是對于中國的相關從業者而言,更是機會多多。而對于跑得比較快的燧原來說,他們正處于一個前所未有的好位置,未來也值得期待。
        來源:半導體行業觀察

        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。

        電容式接近開關相關文章:電容式接近開關原理


        關鍵詞: 計算芯片

        技術專區

        關閉
        主站蜘蛛池模板: 宣化县| 四子王旗| 会泽县| 肃宁县| 环江| 海阳市| 清原| 东辽县| 江津市| 景东| 东宁县| 中山市| 宁明县| 边坝县| 保定市| 肃北| 大宁县| 新营市| 双柏县| 义马市| 平潭县| 昌江| 靖西县| 汾阳市| 尼玛县| 泉州市| 永德县| 建湖县| 疏附县| 长沙县| 恭城| 高青县| 罗甸县| 阿城市| 陕西省| 大同市| 溧水县| 鹰潭市| 济南市| 河源市| 郴州市|