OpenAI 和 Oracle 達成協議,將建造龐大的 Stargate 數據中心,整個項目將支持 200 萬個 AI 芯片
(圖片來源:Oracle)
在關于 Stargate 項目,該項目涉及與 OpenAI、Oracle 和 SoftBank 的合作 提出的一些擔憂中,包括基礎設施支持的細節不足。公司逐漸披露了它們的意圖,周二,OpenAI 和 Oracle 宣布計劃在美國建設額外的 4.5 吉瓦(GW)的 Stargate 數據中心基礎設施,將 OpenAI 的總計劃容量推至 5 GW。有趣的是,盡管 SoftBank 是 Stargate 項目的一部分,但它并未參與這次建設融資。
根據一月份宣布的計劃,OpenAI、Oracle 和 Softbank 計劃建造每個面積為 500,000 平方英尺(46,450 平方米)的 20 個數據中心。然而,他們打算如何為數據中心供電尚不明確,因為美國的基礎設施似乎沒有足夠的備用容量來為 AI 服務器、冷卻系統和網絡設備提供電力,除非再建造一些額外的設施。
宣布的 4.5 吉瓦的基礎設施確實主要指的是電力供應能力,這是目前限制 AI 發展的主要因素之一。
OpenAI 聲稱其 5 吉瓦的擴展基礎設施將使其數據中心能夠支持超過 200 萬個 AI 處理器,但并未透露該基礎設施是用于支持 1.4 千瓦的 Blackwell Ultra 處理器還是 3.6 千瓦的 Rubin Ultra 處理器。如果 5 吉瓦的基礎設施僅用于支持 AI 顯卡,那么它將能夠支持 357.1 萬個 Blackwell Ultra 顯卡或 138.8 萬個 Rubin Ultra 顯卡。然而,AI 加速器通常只消耗整個數據中心功率的一半,且未考慮電源使用效率(PUE),因此實際支持的顯卡數量可能會更低。
新建 4.5 吉瓦容量的設施可能位于德克薩斯州、密歇根州、威斯康星州和懷俄明州,盡管確切位置仍在確定中。這除了德克薩斯州阿比林正在建設的現有設施外,該設施被視為 OpenAI 的驗證概念設施,以確保其大規模和快速部署基礎設施的能力。OpenAI 認為從阿比林學到的經驗將有助于后續設施的實施。
阿比林設施的部分區域——Stargate I——現已開始運作,因為 Oracle 上個月開始安裝基于 Nvidia GB200 平臺的機架。OpenAI 已開始利用該基礎設施進行早期階段的 AI 訓練和推理任務,作為其下一代研究計劃的一部分。
評論