從48V到800V:數(shù)據(jù)中心高壓直流電源的嚴峻挑戰(zhàn)
數(shù)據(jù)中心(特別是那些推動 AI 最新創(chuàng)新的數(shù)據(jù)中心)正在消耗越來越多的電力。高盛 (Goldman Sachs) 目前的研究表明,數(shù)據(jù)中心消耗了當今全球 2% 的電力,預(yù)計到 2030 年,這一數(shù)字將增加到 10%。
本文引用地址:http://www.104case.com/article/202505/470557.htm這暴露了數(shù)據(jù)中心傳統(tǒng)電力電子設(shè)備的缺點,從為服務(wù)器柱提供交流電的配電系統(tǒng),到提供直流電源的穩(wěn)壓器,再到作為這一切核心的高性能 AI 芯片。數(shù)據(jù)中心的電源架構(gòu)必須進行重大變革,以應(yīng)對 AI 不斷增長的電源需求,反過來,電子設(shè)計人員將不得不解決許多挑戰(zhàn)。
代溝:數(shù)據(jù)中心供電的演變
要了解數(shù)據(jù)中心電源的發(fā)展方向,現(xiàn)在了解電源架構(gòu)的構(gòu)建非常重要。圖 1 顯示了您可以稱為“第一代”電源架構(gòu)的主要構(gòu)建塊。在這種情況下,三相交流電(通常為 480 V 線對線電壓)進入數(shù)據(jù)中心并為不間斷電源 (UPS) 供電。UPS 支持備用電池,并有助于為服務(wù)器機架提供穩(wěn)定的交流電壓。在服務(wù)器機架內(nèi)部,使用每個服務(wù)器刀片中的通用冗余電源將交流電壓整流并降至 12 V。
1. 數(shù)據(jù)中心第一代 Power Architecture。
幾十年來,這種架構(gòu)一直是數(shù)據(jù)中心供電的行業(yè)標準,如今的大部分系統(tǒng)仍然采用這種配置。這種架構(gòu)中的典型服務(wù)器機架將支持 10 到 15 kW 的功率。
大約十年前,整個技術(shù)行業(yè)開始推動提高數(shù)據(jù)中心的效率。巨大的云數(shù)據(jù)中心的興起有助于提高功率水平,這導致了“第二代”架構(gòu)的出現(xiàn)(圖 2)。
2. 升級到 48 V 總線的第二代電源架構(gòu)與 12V 相比,總電流降低了 4 倍,功率損耗降低了 16 倍。
這個新系統(tǒng)與第一代有幾個不同。服務(wù)器電源的輸出電壓增加到 48 V,同時將電源整合到電源架中,也稱為“開放式機架”電源。機架中還集成了本地備用電池單元。
所有這些改進都使功率轉(zhuǎn)換級的效率提高了 5%,同時增加了可交付的功率。在云計算數(shù)據(jù)中心中,典型的機架將具有 40 kW 到超過 100 kW 的功率。
但是,隨著耗電的 AI 芯片開始在數(shù)據(jù)中心占據(jù)主導地位,第二代架構(gòu)正在達到其物理極限。AI 數(shù)據(jù)中心的單個機架功率需求攀升至 600 kW 至 1 MW。如今,AI 工作負載需要大量的計算,這需要縮短圖形處理單元 (GPU)、中央處理器 (CPU) 和網(wǎng)絡(luò)交換機之間的物理連接距離。這種配置意味著大而笨重的電源需要從 IT 機架中移出。
這就是為什么第三代架構(gòu)引入了 sidecar 的概念,它基本上是一個單獨的機架,僅用于通過母線連接連接到服務(wù)器機架的電源(圖 3)。
3. 隨著 AI 處理器突破當今數(shù)據(jù)中心的功率極限,科技公司正在將 AC-DC 電源重新安置到單獨的電源機架或 sidecar 中。
數(shù)據(jù)中心高壓直流電源的設(shè)計挑戰(zhàn)
現(xiàn)在我們已經(jīng)回顧了未來數(shù)據(jù)中心的發(fā)展方向,我們可以討論高壓直流配電的挑戰(zhàn)和一些潛在的解決方案。電源設(shè)計人員和系統(tǒng)工程師需要問自己一長串問題,其中一些我們甚至可能還沒有考慮過。但這里有幾個需要關(guān)注:
最佳輸出電壓電平是多少?+400 V、+800 V、±400 V?
隔離在系統(tǒng)中的作用是什么?高壓輸出是否絕對必要?
適合 sidecar 的電源轉(zhuǎn)換拓撲有哪些?那么在服務(wù)器機架中呢?
如果將電源移出 IT 機架的主要動機是提高計算密度,為什么必須更改電源的輸出電壓呢?簡單的答案與將電力從 sidecar 輸送到 IT 機架的母線有關(guān)。如果服務(wù)器機架需要 600 kW 的功率來運行計算密集型工作負載,例如 AI 訓練和推理,則需要 12500 A 的電流(不考慮任何傳輸損耗)才能在 48 V 下提供該功率。
由于所需的電流密度,該母線排的物理尺寸將非常大,重量接近 200 磅。這些母線排還需要液體冷卻,從而增加了成本和復(fù)雜性。相反,如果將配電電壓提高到 800 V DC,則 600 kW 機架只需要 750 A 的電流。該電流水平將允許空氣冷卻,并將每個母線排的重量減輕 85%。
配電電壓必須增加 — 這一點很清楚。但是什么是正確的電壓電平?+400V、+800V 或 ±400V 電壓電平已用于當今的電動汽車 (EV) 和相關(guān)充電基礎(chǔ)設(shè)施。
+400 V 電壓非常有意義,因為它已經(jīng)在當今的數(shù)據(jù)中心中得到廣泛應(yīng)用:大多數(shù)單相 AC-DC 電源中的功率因數(shù)校正 (PFC) 級在 LLC 級將其降壓至 48 V 或 12 V 之前輸出 +400 V,并且電氣元件隨時可用。工程師還從安全角度對 400 V 以及設(shè)計中的爬電距離和間隙間距有深入的了解。但是,如果功率水平增加得更多,母線可能會成為一個問題。
+800 V 電平是總線電壓的另一個可行選項,因為它將允許更小的母線和更高的配電效率。不過,這是一個相對較新的組件生態(tài)系統(tǒng)。工程師將不得不解決一系列有關(guān)安全性和間距的技術(shù)問題。第三個選項是將前兩個選項組合在一起,然后選擇 ±400 V。它的主要缺點是該電壓需要復(fù)雜的控制以確保負載平衡。
隔離:如何在高壓直流電源系統(tǒng)中處理
考慮所有三個電壓選項很重要,但另一個問題會影響您的選擇:隔離。
隔離和絕緣有兩個目的:一個是確保最終用戶的安全,另一個是保持接地回路分離。這兩者都對于數(shù)據(jù)中心架構(gòu)非常重要。由于所需的功率水平,最好并聯(lián)多個較小的電源,確保這些電源共享電流。
圖 4 說明了輸出電壓和隔離方案的幾個選項。第一種選擇是最直接的選擇,因為它涉及將 PFC 級變成單獨的電源單元 (PSU)。盡管它有優(yōu)勢,但公司是否會接受它仍然存在不確定性。當并聯(lián)多個非隔離式 AC-DC 電源時,還存在電流共享和平衡問題。與具有額外隔離級的其他選項相比,第一個選項提供最高效率和最低成本。
4. 顯示了高壓直流電源架構(gòu)中的不同隔離方法。
第二個、第三個和第四個選項在 AC-DC 級之后引入隔離,以解決電流平衡問題。第三種和第四種選擇使用分離式軌產(chǎn)生 ±400 V,主要區(qū)別在于所需的母線數(shù)量(3 對 2)。第四個選項需要一些額外的控制,以確保 ±400 V 上的負載平衡。
電源拓撲:平衡成本、速度、效率和隔離
另一個決定涉及 AC-DC 整流器使用什么拓撲。許多因素都會驅(qū)動拓撲的選擇,包括成本、效率、負載瞬態(tài)和隔離。
兩級方法,其中一級處理整流器,另一級管理隔離,是設(shè)計電源系統(tǒng)最傳統(tǒng)和最流行的方法。整流器有許多眾所周知的拓撲結(jié)構(gòu),例如 Vienna 整流器、T 型逆變器或有源中性點鉗位。
同樣,隔離式 DC-DC 級(例如三相 LLC 或全橋 LLC)可用于實現(xiàn)穩(wěn)壓和隔離。這種方法的一大優(yōu)點是,通過在整流器和隔離式 DC-DC 級之間增加額外的電容,能夠輕松處理瞬態(tài)和線路壓降事件的能量存儲。
另一種可能的方法是使用單級來處理 AC-DC 整流和隔離。這也稱為矩陣轉(zhuǎn)換器。圖 5 顯示了單級矩陣轉(zhuǎn)換器的簡化原理圖。
德州儀器 (TI)5. 用于單級絕緣 AC-DC 電源的矩陣轉(zhuǎn)換器內(nèi)部。
這種類型的轉(zhuǎn)換器可以通過減少導通路徑中的開關(guān)數(shù)量以及縮小開關(guān)和磁性元件的總數(shù)來提高效率,從而降低成本。不過,除了對浪涌電壓的擔憂外,在儲能方面還出現(xiàn)了一些潛在的缺點。
矩陣轉(zhuǎn)換器也是雙向開關(guān)的完美應(yīng)用,有助于降低成本并進一步提高效率。盡管如此,要實現(xiàn)這種類型的設(shè)計,必須解決許多問題和技術(shù)細節(jié)。
向高壓直流配電的轉(zhuǎn)變必將給數(shù)據(jù)中心電源帶來許多變化。解決復(fù)雜問題和改進電源的機會正在發(fā)生。為了滿足新處理器的電源需求,未來的數(shù)據(jù)中心將依賴于今天做出的決策。
評論