新聞中心

EEPW首頁 > 嵌入式系統 > 編輯觀點 > 國產GPU供不應求——國產之光性能超乎想象

國產GPU供不應求——國產之光性能超乎想象

作者：EEPW 時間：2024-04-10 來源：EEPW

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

國產GPU供不應求——國產之光性能超乎想象

本文引用地址：http://www.104case.com/article/202404/457390.htm

AI屆春晚—英偉達GTC大會在3月召開，B100/B200晶片的亮相，刷新了計算新速度，隨著人工智能技術的日新月異，從數據處理到算法優化，再到應用場景的拓展，每一步都可能帶來新的市場機會。從智能硬件到云計算，再到物聯網等多個領域，AI技術的深入應用都將成為市場的關注焦點。AI對算力的要求是需要大量的并行及重復計算，GPU正好有這個專長，時勢造英雄，因此GPU就出山擔此重任。

臺積電董事長劉德音預測：未來 15 年每瓦 GPU 性能提升 1000 倍，GPU 晶體管數破萬億

就在近期，在一則對英偉達CEO黃仁勛的最新專訪中，黃仁勛表示：當下我們正處于生成式人工智能革命的開端，機器人基礎模型可能即將出現，新一代GPU性能超乎想象，今年到明年，GPU都會供不應求！

如何構建比英偉達更好的GPU

面對國外的行業龍頭，國內GPU在對標的同時也在不斷進步，縮小與頭部公司的差距，在我看來，GPU 有傳統 2D/3D 圖形渲染 GPU 和專注高性能計算的GPU兩條主要的發展路線。隨著國家的政策支持及廠商的大力投入，國產GPU 廠商在圖形渲染 GPU 和高性能計算 GPGPU 領域上均推出了較為成熟的產品，在性能上不斷追趕行業主流產品，在特定領域達到業界一流水平。在軟件支持方面，國產GPU企業正在積極與主流操作系統、開發環境以及圖形處理軟件等進行適配，確保用戶能夠流暢地使用各種應用軟件。同時，一些企業還在推動GPU在人工智能、云計算等新興領域的應用，為國產GPU生態注入新的活力。

生態方面國產廠商大多兼容英偉達 CUDA，融入大生態進而實現客戶端導入。

我國移動GPU和桌面GPU兩大主要終端應用場景市場持續保持增長。全球GPU的市場已經達到了448億美元，我國約占全球市場規模的24.7%。互聯網、政府側、服務、電信、金融、制造、教育等領域是GPU算力需求較大的領域，目前國產GPU企業都在積極朝大模型方向布局，包括訓練和推理。另外軟件和生態建設也在加速推進。

AI芯片短缺，業界：未來中國將發展自己的高端GPU

沐曦

沐曦于2020年9月成立于上海，致力于為異構計算提供全棧GPU芯片及解決方案，可廣泛應用于人工智能、智慧城市、自動駕駛、數字孿生、元宇宙等前沿領域。公司擁有技術完備、設計和產業化經驗豐富的團隊，核心成員平均擁有近20年高性能GPU產品端到端研發經驗。

公司擁有完全自主研發的GPU IP、指令集和架構，以及兼容主流GPU生態的完整軟件棧（MXMACA），產品具備高能效、高通用性。目前已推出MXN系列GPU（曦思）用于AI推理，MXC系列GPU（曦云）用于AI訓練及通用計算，以及MXG系列GPU（曦彩）用于圖形渲染，可滿足數據中心對高能效和高通用性的算力需求。

沐曦擁有目前國內出生于全球頂級GPU廠商的全建制團隊，擁有二十年高性能GPU從設計到量產交付的全流程經驗。作為初創公司，成立一年內獲得四輪共數十億人民幣的融資。2021年8月25日，公司獲得十億人民幣融資，由國調基金和中網投領投，和利資本、紅杉中國等跟投。通過此輪融資，進一步加強了沐曦在高性能GPU領域的研發投入。

對標英偉達 A100，國產計算 GPU 沐曦 MXC500 僅用 5 小時成功點亮

海光信息

海光信息主要從事高端處理器、加速器等計算芯片產品和系統的研發、設計和銷售。公司的產品包括海光通用處理器（CPU）和海光協處理器（DCU），具有成熟而豐富的應用生態環境，內置專用安全硬件，可滿足互聯網、金融、能源等行業的廣泛應用需求。

其系列產品海光 8100 采用先進的 FinFET 工藝，以GPU架構為基礎，兼容通用的“類 CUDA”環境以及國際主流商業計算軟件和人工智能軟件，可充分挖掘應用的并行性，發揮其大規模并行計算的能力。

摩爾線程

摩爾線程成立于2020年，是一家以全功能GPU芯片設計為主的集成電路高科技公司，能夠為廣泛的科技生態合作伙伴提供強大的計算加速能力，致力于打造為下一代互聯網提供多元算力的元計算平臺。

值得一提的是，摩爾線程的創始人是原NVIDIA全球副總裁、中國區總經理張建中先生。核心創建團隊基本都來自NVIDIA，擁有完整的高端芯片人才團隊，全面覆蓋GPU芯片IP研發、系統軟硬件設計、生態建設和市場營銷等。

2022年，摩爾線程就推出了GPU統一系統架構MUSA，發布并量產“蘇堤”和“春曉”兩顆全功能GPU芯片，這也是國內采用現代GPU架構，唯一內置圖形渲染、視頻編解碼、AI計算加速、物理仿真、科學計算四大引擎的全功能高端GPU芯片。

12月19日發布的摩爾線程MTT S4000是專為計算而生的加速卡，基本代表國產計算卡的領軍水平。從圖中可以看到這款卡的一些基本參數。其中，FP32（單精）達到25TFLOPS, FP16（半精）達到100TFLOPS，片間互聯達到240GB/s。作為對比，NVIDIA的RTX4080的FP16和FP32均為48.74TFLOPS，而H100則達到了FP16為1979TFLOPS，FP32為67TFLOPS的算力；華為的晟騰910的FP16算力為320TFLOPS。

近日，無問芯穹發布了“無穹Infini-AI”大模型開發與服務平臺，并宣布與摩爾線程達成深度戰略合作。

摩爾線程首個千卡KUAE智算中心落地

國內首家：摩爾線程推出 GPU 云桌面產品，支持最高 20 路 1080p 30 幀并發

壁仞科技

壁仞科技創立于 2019 年，在 GPU、DSA（專用加速器）和計算機體系結構等領域具有深厚的技術積累。公司致力于開發原創性的通用計算體系，建立高效的軟硬件平臺，同時在智能計算領域提供一體化的解決方案。

2022 年 8 月公司發布的通用 GPU 芯片 BR100 創下全球通用 GPU 算力記錄，峰值算力達到國際廠商在售旗艦產品 3 倍以上。BR100 率先采用 Chiplet 技術、新一代主機接口PCIe 5.0、支持 CXL 互連協議，確立了公司在國內廠商間的技術領先地位。公司堅持自主研發，同步推出原創架構“壁立仞”和自研BIRENSUPA 軟件平臺，實現了 BR100 性能的大幅提升。

以壁仞科技于 2022 年8 月發布的首款 GP GPU BR100 為例，該芯片采用 Chiplet 技術，16 位浮點算力達到 1000T 以上、8 位定點算力達到 2000T 以上，單芯片峰值算力達到 PFLOPS級別，是國際廠商在售旗艦產品的 3 倍以上，創造了全球通用 GPU 的算力記錄。

770億晶體管的中國第一算力通用GPU芯片！壁仞科技BR100亮相海外

壁仞科技首次參與權威AI評測MLPerf 獲多項全球第一

不僅如此，國內也有一些廠商，依靠著IP及豐富的產品類型，不斷在GPU領域活躍著。

寒武紀

寒武紀是國內領先人工智能芯片設計企業，搭建廣泛覆蓋終端、云端、邊緣端場景的智能芯片產品體系。公司面向終端、云端、邊緣端三大場景，分別研發推出終端智能處理器IP（智能處理器的產品級實現方案，由核心架構、代碼、文檔等組成）、云端智能芯片及加速卡（用于加速特定領域應用程序的板卡產品，以計算芯片為核心部件）、邊緣智能芯片及加速卡等產品，適用于各類智能終端、云服務器、邊緣計算設備等，并為該三類產品，研發推出統一的基礎系統軟件平臺，為客戶提供豐富芯片產品與系統軟件解決方案，致力構建云、邊、端一體的智能生態。

寒武紀推出的新款智能加速卡 MLU370-X8/M8、訓練整機玄思 1001智能加速器(MLU-X1001)。首次將雙芯片四芯粒思元370整合在MLU370-X8智能加速卡中，提供了兩倍于標準思元370加速卡的內存、編解碼資源，同時搭載MLU-Link?多芯互聯技術。在YOLOv3、Transformer、BERT和ResNet101訓練任務中， 8卡并行平均性能達350W RTX GPU的155%。

寒武紀1A、寒武紀1H應用于華為海思等旗艦智能手機芯片內，已集成在超過1億臺智能手機及其他智能終端中。思元系列芯片及對應加速器產品，已應用在中科曙光、浪潮、聯想等多家廠商的服務器中。基于此，公司產品輻射互聯網、云計算、能源、教育、金融、電信、交通、醫療等行業，支持人工智能行業各類中小企業發展。

在2023年度中國AI芯片先鋒企業TOP 30中，寒武紀入選。寒武紀入選2023中國AI芯片先鋒企業TOP30

寒武紀子公司與中國一汽合作，聚焦智能駕駛芯片研發與應用

寒武紀入選2022年度人工智能領航企業TOP50

芯原股份

芯原依托自主半導體 IP，為客戶提供平臺化、全方位、一站式芯片定制服務和半導體 IP 授權服務，擁有獨特的“芯片設計平臺即服務”經營模式。公司可提供高清視頻、物聯網連接、數據中心等多種一站式芯片定制解決方案，擁有自主可控的圖形處理器 IP、神經網絡處理器 IP 等五類處理器 IP 及 1400 多個數模混合 IP 和射頻 IP，可快速打造出從定義到測試封裝完成的半導體產品，業務范圍覆蓋消費電子、汽車電子、物聯網等多種應用領域。據 IPnest 在 2021 年的統計，芯原的半導體 IP 銷售收入排中國大陸第二，全球第七，其中公司的圖形處理器 IP 排名全球前三。

公司的GPU IP已被眾多主流和高端的汽車品牌所采用，同時，公司基于約 20年 Vivante GPU 的研發經驗，所推出的 Vivante 3D GPGPU IP 還可提供從低功嵌入式設備到高性能服務器的計算能力，滿足廣泛的人工智能計算需求。

芯原攜最新的高效能IP應用亮相2024年國際嵌入式展

采用芯原NPU IP的AI類芯片已在全球出貨超過1億顆

賽昉基于RISC-V的JH-7110智能視覺處理平臺采用了芯原的顯示處理器IP

嘉楠基于RISC-V的端側AIoT SoC采用了芯原的ISP IP和GPU IP

近些年國產GPU正在蓬勃發展，不過相較于國際巨頭，仍然存在較大差距。近年來，大模型快速發展，國產GPU在大模型訓練方面的不足也凸顯出來，在大模型訓練及軟件和生態方面都面臨諸多挑戰，舉個例子，多媒體和圖形處理都屬于單精度浮點計算（FP32）的計算需求，雙精度浮點計算能力FP64是進行高算力計算的硬性指標。英偉達的A100同時具備上述兩類能力，而國內大多GPU只能處理單精度浮點計算。

但在人工智能、物聯網等多下游領域快速發展情況下，我國數據中心端、云廠商以及智算領域對GPU需求也極為旺盛，在中美貿易戰、全球芯片供應不穩定的情況下，我國發展AI行業，形成自主可控的芯片供應體系，為國產GPU提供了進入市場的機會。所以整體看來，國產GPU市場空間還是相當廣闊的。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： GPU AI 摩爾線程 NVIDIA

焦點

更多>>

技術專區

關閉

新聞中心

國產GPU供不應求——國產之光性能超乎想象

評論

相關推薦

技術專區