華為將推出 CloudMatrix 384,據稱可提供 2× NVIDIA GB200 NVL72 吞吐量
據經濟日報報道,華為計劃于 2025 年世界人工智能大會(WAIC)首次推出其 CloudMatrix 384 系統,該大會將于 26 日在上海開幕。正如 Tom’s Hardware 所強調的那樣,CloudMatrix 384 是一個機架級 AI 系統,由 384 個 Ascend 910C 處理器組成,通過全光、全互連的網狀網絡互連。
盡管單個 Ascend 910C 芯片的性能僅約為 NVIDIA Blackwell 的三分之一,但報告指出華為通過在每個系統中部署大量芯片來彌補這一限制。這種方法使 CloudMatrix 384 實現了約 300 PFLOPs 的密集 BF16 計算能力——幾乎是 NVIDIA GB200 NVL72 的兩倍,該報告強調后者提供約 180 PFLOPs。
Tom’s Hardware 還指出,該系統提供了 2.1 倍的內存總帶寬和超過 3.6 倍的高帶寬內存(HBM)容量,同時依賴于 HBM2E 內存。
同時,與依賴銅線互連的傳統系統不同,CloudMatrix 使用全光基礎設施進行機架內和機架間的通信,從而實現極高的總帶寬。CloudMatrix 384 是一款可擴展的企業級系統,配備容錯功能,適合高要求的 AI 工作負載,正如 Tom’s Hardware 所指出的。
CloudMatrix 384 的效率挑戰
然而,它的效率較低:每 FLOP 功耗是 NVIDIA 解決方案的 2.3 倍,每 TB 內存帶寬效率是 1.8 倍,每 TB HBM 內存效率是 1.1 倍,正如 Tom’s Hardware 所述。盡管如此,Tom’s Hardware 指出,在中國,能源豐富但先進硅片獲取有限,華為的人工智能戰略似乎與當地條件非常契合。
正如 Igor’s Lab 引用 Financial Times 所指出的,CloudMatrix 384 的單價為 800 萬美元。其高昂的價格和巨大的功耗需求使得中小企業難以負擔。因此,該系統預計將主要作為大型企業的優質解決方案。報告還稱,據報道已有十家中國主要企業采用了該系統,并將其集成到現有的數據中心基礎設施中。
評論