液冷數據中心數量將快速增長
預計未來兩年內,液冷數據中心的數量將從不到1%的市場份額增長到所有安裝量的30%左右。如此驚人增長背后的原因顯而易見 —— 處理器的功率每6個月就會快速增長,每個機架的功率也隨之增長。因此,數據中心溫度不斷升高,而空氣冷卻技術已走到了盡頭。超大規模數據中心運營商不再考慮是否應該使用液冷技術,而是想知道應該使用哪種技術,以及能夠多快啟動并運行。
本文引用地址:http://www.104case.com/article/202505/470200.htm如下圖所示,液體冷卻主要分為兩類:浸入式和直接芯片式,每種冷卻方式都有單相和雙相兩種方案。人們通常將直接芯片式冷卻稱為“冷板冷卻”,因為它使用的冷板直接放置在CPU或GPU的頂部。而浸入式冷卻則使用大型重型水箱代替標準機架,并在水箱內注入液體。服務器和設備直接浸入液體中。
浸入式冷卻概述:充滿液體的容器
浸沒式液體冷卻有兩種類型。單相浸沒式冷卻使用儲罐中的油性液體吸收熱量。加熱后的液體上升到儲罐頂部,然后被泵送到熱交換單元,該單元冷卻液體并將其送回容納硬件的儲罐。
單相浸沒式的優缺點如下:
· 優點: 能夠消除服務器100%的熱量。
· 缺點:由于油液上升到油箱頂部并被泵送冷卻的速度較慢,因此它只能冷卻最大功耗為500瓦的處理器和芯片。大型笨重的油箱需要大量的數據中心基礎設施投資,維護成本高昂,并且經常需要停機。油液在高溫下也可能易燃,由于油箱體積較大,需要進行大量維護。由于所有設備都直接浸入液體中,因此設備損壞也存在風險。
兩相浸入式冷卻采用低沸點的介電流體代替油。熱量使流體沸騰,產生蒸汽 ,蒸汽上升到水箱頂部,由管道網絡提供流動的冷卻水。蒸汽冷凝后滴回水箱。
雙相浸泡的優缺點如下:
· 優點:這種方法可以有效地去除 100% 的熱量,并且使用電介質液體可以確保 IT 設備的安全。
· 缺點:大型笨重的儲罐需要大量的數據中心基礎設施投資,維護成本高昂,并且經常需要停機。儲罐內的組件不僅需要與介電液體兼容以防止損壞,而且儲罐內的沸騰過程通常會將主板、焊接和其他設備上的物質蒸發掉。這一過程可能會損害設備的使用壽命,而且隨著物質的脫落,需要不斷過濾,這需要大型過濾器。儲罐需要定期維護,并且打開儲罐時,介電液體的蒸汽會釋放到大氣中。
直接芯片液冷概述:位于GPU/CPU頂部的冷板
直接芯片冷卻由位于CPU或GPU頂部的冷板組成。與浸入式冷卻(將設備浸入大型水箱中的液體中)不同,直接芯片冷卻中使用的液體包含在緊湊的冷板內。
直接芯片液體冷卻包括單相或雙相工藝。單相直接芯片冷卻使用水或水-乙二醇混合物作為冷卻板中的冷卻劑。水保持液態,這種方法的散熱能力取決于水流量。
以下是單相直接芯片冷卻的優缺點:
· 優點: 冷板無需使用浸入式冷卻所需的大型、昂貴的水箱。
· 缺點: 如果冷卻板中的水沒有持續過濾和維護,使用水會帶來腐蝕風險,一次泄漏就可能對服務器造成災難性的后果。由于冷卻依賴于持續的水流,芯片溫度越高,所需的水流量就越大。這種設計需要高壓和高流量、更大的管道、管子和連接器,以及耗電的泵來持續輸送水。
與單相直接芯片冷卻不同,雙相直接芯片冷卻不使用冷板中的水,而是使用導熱流體,這對于IT設備而言是100%安全的。GPU和CPU產生的熱量使導熱流體在低溫下沸騰,吸收熱量并使芯片保持恒溫。這個過程類似于沸水使鍋底保持在100?C,只是溫度較低。當冷板內的液體沸騰時,冷板中的液體永遠不會超過沸點。這種效果使該技術具有高度可擴展性,可用于冷卻未來溫度更高的芯片。
以下是兩相直接芯片冷卻的優缺點:
· 優點:這種方法幾乎不需要對數據中心基礎設施進行任何改動,導熱流體也無需過濾、平衡或更換。液體處于封閉系統中,這意味著它不會釋放到大氣中。冷板和服務器中不使用水,消除了漏水的風險,而且由于液體的溫度永遠不會超過沸點,即使芯片未來溫度升高,它也能無縫運行。
· 缺點:液冷僅用于CPU/GPU散熱。其他組件(例如內存和I/O)仍然需要風冷。
液體冷卻市場正變得像芯片一樣火爆
根據最近的研究報告,液體冷卻市場預計將從2024年的56.5億美元增長到2034年的484.2億美元。這種巨大增長的原因很明顯:隨著人工智能工廠和數據中心內部的熱量上升到前所未有的水平,根本沒有其他方法來支持人工智能的建設。
幸運的是,正如本文所強調的,有許多不同類型的液冷技術可用于散熱,每種技術都有其優缺點。隨著芯片功率的不斷提升,確保所選的冷卻解決方案能夠適應下一代芯片至關重要。數據中心、AI工廠和超大規模計算中心需要決定哪種解決方案更適合他們當前的需求,并滿足他們近期的需求。最終,這一選擇將基于性能、成本、功耗、易用性、可擴展性和可持續性。
評論