英偉達H20芯片解禁!還將推出新款中國特供版GPU
7月14日,英偉達新聞室發布恢復向中國銷售H20芯片,并宣布推出全新完全合規的中國特供版GPU。
黃仁勛還向客戶更新了最新進展,指出英偉達正在重新提交銷售H20 GPU的申請,美國政府已向英偉達保證將發放許可證,公司希望盡快開始交付。最后,黃仁勛宣布推出一款全新完全合規的RTX PRO GPU,稱其“是智能工廠和物流領域數字孿生人工智能應用的理想選擇”。
H20芯片是英偉達為繞過美國出口管制、專門為中國市場定制的“降配版”AI加速器,雖性能不及H100或B100,但仍遠超大多數國產GPU,且在大模型訓練和推理場景中擁有實戰價值。4月,美國政府叫停專為中國市場研發的H20芯片出口許可,導致英偉達超百億美元的損失。黃仁勛曾多次強調中國市場的重要性。根據英偉達最新的年度報告,在截至2024年1月26日的財年中,中國市場為其創造了170億美元的營收,占其總銷售額的13%,是英偉達實現增長的關鍵市場。
有消息稱,H20替代版B30在性能再度縮水之后將于9月發售,其FP16性能大致在80出頭,FP8接近200出頭,互連帶寬約為1.5–1.6TB。從整體性能看,B30顯然并不適合用于訓練,雖然H20勉強還能用于訓練(比如靠內存解決方案、FP8精度以及傳統方法),尚非完全不可行,但B30的訓練能力較弱。在模型推理方面,例如圖像、語音等當前主要應用,可能還有部分文本模塊推理,B30具備一定確定性,尤其是未來整合多模態處理(圖像、語音、視頻)等方向上。
值得注意的是,隨著機架式方案逐漸出現,類似互連架構的推理部署方案成為一個不錯的選項,但是GB30的情況尚不明確,機架式方案的實際推進時間也未可知,仍存在較多不確定性。目前最合理的方向,仍是推動算力租賃,如果算力租賃全面放開,將是未來公司算力供給架構的重大轉變。
因而,對比B30的不確定性,一旦H20確認出口放行,不僅將為英偉達在華業務打開重要缺口,為英偉達業績增長帶來強勁動能,還可緩解中國AI大模型企業的算力焦慮。
評論