英偉達發布最強AI超算:4608個H100 GPU

英偉達周四發布了一段視頻,首次向公眾展示了其最新的面向企業的超級計算機Eos的架構,Eos是專為數據中心規模的高級人工智能開發而設計的,也是該公司速度最快的人工智能超級計算機。
Eos 機器目前由 Nvidia 自己使用,在最新的 Top 500 榜單中,它被評為世界上性能最高的超級計算機的第 9 位,該榜單以 FP64 為衡量標準;在純 AI 任務中,它很可能是速度最快的超級計算機之一。同時,它的藍圖也可用于為其他公司建造面向企業的超級計算機。
"Nvidia在視頻中表示:"每天,EOS都在迎接Nvidia數千名從事人工智能研究的內部開發人員的挑戰,幫助他們解決以前無法解決的問題。
Nvidia的Eos配備了576個DGX H100系統,每個系統包含8個Nvidia H100 GPU,用于人工智能(AI)和高性能計算(HPC)工作負載。該系統總共裝有1,152個英特爾至強Platinum 8480C(每個CPU有56個內核)處理器和4,608個H100 GPU,使Eos在HPC和AI方面分別達到了Rmax 121.4 FP64 PetaFLOPS和18.4 FP8 ExaFLOPS性能。
Eos(依托于DGX SuperPOD架構)的設計專為人工智能工作負載和可擴展性而打造,因此它采用了Nvidia的Mellanox Quantum-2 InfiniBand with In-Network Computing技術,該技術的數據傳輸速度高達400 Gb/s,這對于有效訓練大型人工智能模型和擴大規模至關重要。
除了強大的硬件,Nvidia 的 Eos 還配備了強大的軟件,該公司表示,這些軟件也是專為人工智能開發和部署而設計的。因此,Nvidia 的 Eos 可以應對從類似 ChatGPT 的生成式人工智能到人工智能工廠等各種應用。
"Eos擁有一個集成的軟件棧,其中包括AI開發和部署軟件,包括協調和集群管理、加速計算存儲和網絡庫,以及針對AI工作負載優化的操作系統,"Nvidia在視頻中說。"Eos是Nvidia DGX超級計算機(如Saturn 5和Selene)知識的結晶,是Nvidia人工智能專業技術的最新實例。通過創建像Eos這樣的人工智能工廠,企業可以承擔他們最苛刻的項目,并在今天和未來實現他們的人工智能愿望。"
我們不知道 Eos 的成本是多少,而且 Nvidia DGX H100 系統的定價是保密的,取決于很多因素,比如數量,這也無濟于事。與此同時,考慮到每臺 Nvidia H100 的成本可能在 3 萬至 4 萬美元之間,這取決于數量,因此我們可以大致估測出其有多昂貴。來源:芯榜
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。