液冷數(shù)據(jù)中心數(shù)量將快速增長(zhǎng)
預(yù)計(jì)未來(lái)兩年內(nèi),液冷數(shù)據(jù)中心的數(shù)量將從不到1%的市場(chǎng)份額增長(zhǎng)到所有安裝量的30%左右。如此驚人增長(zhǎng)背后的原因顯而易見 —— 處理器的功率每6個(gè)月就會(huì)快速增長(zhǎng),每個(gè)機(jī)架的功率也隨之增長(zhǎng)。因此,數(shù)據(jù)中心溫度不斷升高,而空氣冷卻技術(shù)已走到了盡頭。超大規(guī)模數(shù)據(jù)中心運(yùn)營(yíng)商不再考慮是否應(yīng)該使用液冷技術(shù),而是想知道應(yīng)該使用哪種技術(shù),以及能夠多快啟動(dòng)并運(yùn)行。
本文引用地址:http://www.104case.com/article/202505/470200.htm如下圖所示,液體冷卻主要分為兩類:浸入式和直接芯片式,每種冷卻方式都有單相和雙相兩種方案。人們通常將直接芯片式冷卻稱為“冷板冷卻”,因?yàn)樗褂玫睦浒逯苯臃胖迷贑PU或GPU的頂部。而浸入式冷卻則使用大型重型水箱代替標(biāo)準(zhǔn)機(jī)架,并在水箱內(nèi)注入液體。服務(wù)器和設(shè)備直接浸入液體中。
浸入式冷卻概述:充滿液體的容器
浸沒式液體冷卻有兩種類型。單相浸沒式冷卻使用儲(chǔ)罐中的油性液體吸收熱量。加熱后的液體上升到儲(chǔ)罐頂部,然后被泵送到熱交換單元,該單元冷卻液體并將其送回容納硬件的儲(chǔ)罐。
單相浸沒式的優(yōu)缺點(diǎn)如下:
· 優(yōu)點(diǎn): 能夠消除服務(wù)器100%的熱量。
· 缺點(diǎn):由于油液上升到油箱頂部并被泵送冷卻的速度較慢,因此它只能冷卻最大功耗為500瓦的處理器和芯片。大型笨重的油箱需要大量的數(shù)據(jù)中心基礎(chǔ)設(shè)施投資,維護(hù)成本高昂,并且經(jīng)常需要停機(jī)。油液在高溫下也可能易燃,由于油箱體積較大,需要進(jìn)行大量維護(hù)。由于所有設(shè)備都直接浸入液體中,因此設(shè)備損壞也存在風(fēng)險(xiǎn)。
兩相浸入式冷卻采用低沸點(diǎn)的介電流體代替油。熱量使流體沸騰,產(chǎn)生蒸汽 ,蒸汽上升到水箱頂部,由管道網(wǎng)絡(luò)提供流動(dòng)的冷卻水。蒸汽冷凝后滴回水箱。
雙相浸泡的優(yōu)缺點(diǎn)如下:
· 優(yōu)點(diǎn):這種方法可以有效地去除 100% 的熱量,并且使用電介質(zhì)液體可以確保 IT 設(shè)備的安全。
· 缺點(diǎn):大型笨重的儲(chǔ)罐需要大量的數(shù)據(jù)中心基礎(chǔ)設(shè)施投資,維護(hù)成本高昂,并且經(jīng)常需要停機(jī)。儲(chǔ)罐內(nèi)的組件不僅需要與介電液體兼容以防止損壞,而且儲(chǔ)罐內(nèi)的沸騰過程通常會(huì)將主板、焊接和其他設(shè)備上的物質(zhì)蒸發(fā)掉。這一過程可能會(huì)損害設(shè)備的使用壽命,而且隨著物質(zhì)的脫落,需要不斷過濾,這需要大型過濾器。儲(chǔ)罐需要定期維護(hù),并且打開儲(chǔ)罐時(shí),介電液體的蒸汽會(huì)釋放到大氣中。
直接芯片液冷概述:位于GPU/CPU頂部的冷板
直接芯片冷卻由位于CPU或GPU頂部的冷板組成。與浸入式冷卻(將設(shè)備浸入大型水箱中的液體中)不同,直接芯片冷卻中使用的液體包含在緊湊的冷板內(nèi)。
直接芯片液體冷卻包括單相或雙相工藝。單相直接芯片冷卻使用水或水-乙二醇混合物作為冷卻板中的冷卻劑。水保持液態(tài),這種方法的散熱能力取決于水流量。
以下是單相直接芯片冷卻的優(yōu)缺點(diǎn):
· 優(yōu)點(diǎn): 冷板無(wú)需使用浸入式冷卻所需的大型、昂貴的水箱。
· 缺點(diǎn): 如果冷卻板中的水沒有持續(xù)過濾和維護(hù),使用水會(huì)帶來(lái)腐蝕風(fēng)險(xiǎn),一次泄漏就可能對(duì)服務(wù)器造成災(zāi)難性的后果。由于冷卻依賴于持續(xù)的水流,芯片溫度越高,所需的水流量就越大。這種設(shè)計(jì)需要高壓和高流量、更大的管道、管子和連接器,以及耗電的泵來(lái)持續(xù)輸送水。
與單相直接芯片冷卻不同,雙相直接芯片冷卻不使用冷板中的水,而是使用導(dǎo)熱流體,這對(duì)于IT設(shè)備而言是100%安全的。GPU和CPU產(chǎn)生的熱量使導(dǎo)熱流體在低溫下沸騰,吸收熱量并使芯片保持恒溫。這個(gè)過程類似于沸水使鍋底保持在100?C,只是溫度較低。當(dāng)冷板內(nèi)的液體沸騰時(shí),冷板中的液體永遠(yuǎn)不會(huì)超過沸點(diǎn)。這種效果使該技術(shù)具有高度可擴(kuò)展性,可用于冷卻未來(lái)溫度更高的芯片。
以下是兩相直接芯片冷卻的優(yōu)缺點(diǎn):
· 優(yōu)點(diǎn):這種方法幾乎不需要對(duì)數(shù)據(jù)中心基礎(chǔ)設(shè)施進(jìn)行任何改動(dòng),導(dǎo)熱流體也無(wú)需過濾、平衡或更換。液體處于封閉系統(tǒng)中,這意味著它不會(huì)釋放到大氣中。冷板和服務(wù)器中不使用水,消除了漏水的風(fēng)險(xiǎn),而且由于液體的溫度永遠(yuǎn)不會(huì)超過沸點(diǎn),即使芯片未來(lái)溫度升高,它也能無(wú)縫運(yùn)行。
· 缺點(diǎn):液冷僅用于CPU/GPU散熱。其他組件(例如內(nèi)存和I/O)仍然需要風(fēng)冷。
液體冷卻市場(chǎng)正變得像芯片一樣火爆
根據(jù)最近的研究報(bào)告,液體冷卻市場(chǎng)預(yù)計(jì)將從2024年的56.5億美元增長(zhǎng)到2034年的484.2億美元。這種巨大增長(zhǎng)的原因很明顯:隨著人工智能工廠和數(shù)據(jù)中心內(nèi)部的熱量上升到前所未有的水平,根本沒有其他方法來(lái)支持人工智能的建設(shè)。
幸運(yùn)的是,正如本文所強(qiáng)調(diào)的,有許多不同類型的液冷技術(shù)可用于散熱,每種技術(shù)都有其優(yōu)缺點(diǎn)。隨著芯片功率的不斷提升,確保所選的冷卻解決方案能夠適應(yīng)下一代芯片至關(guān)重要。數(shù)據(jù)中心、AI工廠和超大規(guī)模計(jì)算中心需要決定哪種解決方案更適合他們當(dāng)前的需求,并滿足他們近期的需求。最終,這一選擇將基于性能、成本、功耗、易用性、可擴(kuò)展性和可持續(xù)性。
評(píng)論