博客專欄

        EEPW首頁 > 博客 > 馬斯克啟動“全球最強AI集群”:集成10萬個英偉達H100 GPU!

        馬斯克啟動“全球最強AI集群”:集成10萬個英偉達H100 GPU!

        發布人:芯智訊 時間:2024-08-28 來源:工程師 發布文章

        image.png

        7月23日消息,特斯拉、“X”、xAI CEO 埃隆·馬斯克 (Elon Musk)近日在“X”平臺上宣布,自己已經啟動了“世界上最強大的 AI 集群”,以在今年12 月之前創建“世界上最強大的AI”——該系統在單個結構上將集成10萬個英偉達(Nvidia)H100 GPU。

        馬斯克表示,當地時間凌晨4:20左右開始,在xAI團隊、X團隊、Nvidia和支持公司的努力下,其孟菲斯超級計算工廠“Supercluster”開始正常運行——它在一個RDMA結構上有10萬個液冷H100,是世界上最強大的人工智能訓練集群!

        今年 5 月,馬斯克曾表示在 2025 年秋季之前開設超級計算工廠,當時,馬斯克匆匆忙忙地開始了Supercluster的工作,需要購買英偉達“Hopper”H100 GPU。這似乎表明,當時這位科技大亨沒有耐心等待 H200 芯片推出,更不用說即將推出的基于 Blackwell 的 B100 和 B200 GPU。盡管預計較新的 Nvidia Blackwell 數據中心 GPU 將在 2024 年底之前發貨。

        那么,根據最新的消息來看,原本計劃在2025年秋季開業的超級計算工廠,現在有望提前近一年的時間實現了。但目前下結論還為時尚早。但今年早些時候,路透社和The Information交談的消息人士似乎更有可能在項目時間上說錯了時間節點。此外,隨著 xAI Supercluster的啟動和運行,關于為什么 xAI 沒有等待更強大或下一代 英偉達GPU 的問題也得到了解答。

        Supermicro 為 xAI 提供了大部分硬件,該公司的首席執行官 Charles Liang 也對馬斯克的帖子發表了評論稱,“與馬斯克的孟菲斯團隊合作真是太棒了!為了實現目標,我們的執行必須盡可能完美、盡可能快、盡可能高效、盡可能環?!罅康钠D苦工作。”

        在隨后的推文中,馬斯克解釋說,新的Supercluster”將“從各個方面訓練世界上最強大的人工智能”。從之前的意向聲明來看,xAI 的 100,000 個 H100 GPU 安裝功能現在將針對 Grok 3 模型進行訓練。馬斯克表示,改進后的LLM應該在“今年12月之前”完成訓練階段。

        從規模上看,新的xAI的Supercluster在GPU算力上將會超越目前最強的超級計算機,比如Frontier(37,888個AMD GPU),Aurora(60,000個Intel GPU)和Microsoft Eagle(14,400個Nvidia H100 GPU)。

        編輯:芯智訊-浪客劍


        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: 芯片

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 武邑县| 寻乌县| 鄂伦春自治旗| 红原县| 永兴县| 土默特左旗| 汝南县| 陇南市| 博爱县| 陆川县| 赫章县| 三原县| 基隆市| 太湖县| 大余县| 如东县| 阿荣旗| 阿鲁科尔沁旗| 河池市| 保山市| 普兰县| 永州市| 广昌县| 开化县| 峨山| 南川市| 通榆县| 阿勒泰市| 平远县| 恭城| 紫金县| 中宁县| 桦川县| 三亚市| 威宁| 新民市| 乐陵市| 清镇市| 绩溪县| 武平县| 屏南县|