智算中心發展趨勢淺析
本文分享自天翼云開發者社區《智算中心發展趨勢淺析》,作者:3****m
從國家到地方再到各類市場主體,都在大力推進算力資源布局建設,智算中心發展呈現算力的規模需求快速增加、圍繞算法的服務模式持續完善、普適樸實普惠的服務生態逐步構建、綠色低碳的發展格局加速形成等新趨勢。
(一)智能算力的發展需求快速擴大
算力資源是數字經濟發展的重要底座。隨著數字經濟蓬勃發展,數字化新事物、新業態、新模式推動應用場景趨向多元化發展,算力規模不斷擴大,算力需求持續攀升。
智能算力需求規模快速增長。5G、工業互聯網、物聯網、人工智能等信息技術加速發展帶動數據量爆炸式增長。隨著人工智能技術的高速發展,智能化正以前所未有的速度重塑各行各業,我國算力結構也隨之不斷演化,對智能算力的需求與日俱增。數據顯示,2021年中國智能算力規模達155.2 EFLOPS(FP16), 預計到2026年中國智能算力規模將達到1,271.4 EFLOPS。2021- 2026 年期間,預計中國智能算力規模年復合增長率達52.3%,同期通用算力規模年復合增長率為18.5%。
智算中心建設布局浪潮快速掀起。智算中心能夠提供大規模數據處理和高性能智能計算支撐,將經濟、社會、產業中各種模型、經驗固化下來,形成新的生產力,并支撐智能化的產業、服務和治理。智算中心是具有強公共屬性的開放服務,能夠實現對大區域的數字化輻射帶動,成為經濟發展的新動力引擎。隨著“東數西算”工程、新型基礎設施等國家政策規劃出臺,我國智算中心掀起落地熱潮。當前我國超過30個城市正在建設或提出建設智算中心,整體布局以東部地區為主,并逐漸向中西部地區拓展。未來,隨著我國智算中心布局的持續優化與完善,以及人工智能應用場景的不斷創新和解鎖,智能算力需求將得到更大釋放,智算中心的賦能作用將被進一步激發。
復雜場景計算需要多元算力的開發生態體系。智算中心的芯片、服務器、固件、操作系統等可能由多方提供,易存在多型號硬件無法兼容、軟件投入和應用難以支撐上層業務發展等問題,嚴重制約了智算中心的應用。因此,智算中心應該兼容適配更多技術體系,通過開源、開放的方式建立可兼容底層硬件差異的異構開發方式,突破異構算力適配、異構算力調度等關鍵技術,加速基礎軟件、商用軟件和開源軟件的生態構建,與各領域的知識模型、機理模型、物理模型相疊加,做到從硬件到軟件、從芯片到架構、從建設模式到應用服務開放化、標準化,打通人工智能軟硬件產業鏈,從而加速人工智能算力技術和產業生態形成。
(二)通用智能的算法模型快速演進
人工智能算法結構日益復雜、參數和樣本規模持續擴大, 算法的快速演進正改變傳統計算范式。大模型加速人工智能在千行百業中應用。大規模、大參數量預訓練模型的出現不斷提升人工智能模型的認知能力。 “預訓練大模型+下游任務微調”的新范式已成為解決人工智能技術落地難問題的突破口,加速推進人工智能實用化、通 用化和普惠化發展進程。自2011年以來,全球人工智能領軍 企業和研究機構紛紛加入人工智能大模型研究,人工智能模 型參數急劇增長。在短短三四年時間內,參數規模快速從億級突破至萬億級。代表性大模型如谷歌發布的BERT,OpenAI發布的GPT-3、ChatGPT等。通過構建大模型提升人工智能處理性能、增強人工智能通用性、加速人工智能廣泛應用已成為各界共識,未來大模型將覆蓋更多生產生活領域,賦能千行百業的智能化升級。
多模態智能計算成為實現通用人工智能的關鍵。每一種信息的來源或者形式,都可以稱為一種模態。例如,人有觸覺、聽覺、視覺、嗅覺,信息的媒介有語音、視頻、文字等。多模態更貼合人類對多感知模態的認知過程,通過多種模態的數據,可以突破自然語言處理和計算機視覺的界限,在圖文生成、看圖問答等視覺語言任務上具有更強的表現。當前,多模態大模型引發了業界廣泛的關注,并在 以文生圖等領域取得了巨大進步,代表性模型有OpenAI發布的DALLE-2等。
(三)普適普惠的服務生態逐步構建
智算中心作為經濟社會重要的算力載體,正向標準化、低成本、低門檻方向發展,形成集算力、算法、數據、運營于一體的服務生態,使智能計算可以像水電一樣,成為社會基本公共服務,造福社會大眾,讓千行百業共享智算中心建設成果。
算法應用普適化。在經濟活動各環節的智能化升級中,人工智能需要與各行業的業務流程、信息系統、生產系統等深度結合才能產生價值,存在一定應用門檻,在一定程度上阻礙了各行業的智能化轉型升級。依托智算中心的超大規模預訓練能力,各行業人工智能應用將不必從零開始開發。人工智能模型可以實現在眾多場景通用、泛化和規模化復制,只需結合領域數據進行調整和增量,即可形成具有良好精度和性能的下游應用,助力各行業智能化升級,實現智能算法應用的普適化。
(四)綠色低碳的發展格局加速形成
在“碳中和、碳達峰”目標背景下,建設技術先進、綠色低碳的智算中心成為踐行綠色發展理念的大勢所趨。
算力基礎設施的能效指標更加嚴格具體。我國數據中心總體上還處于小而散的粗放建設階段,大型、超大型數據中心占比不高。據統計,2021年度全國數據中心PUE為1.49,有相當數量的數據中心PUE超過1.8甚至2.0。為約束大型算力基礎設施的能效,國家發改委、科技部、工信部、國家能源局等多部門陸續出臺文件,對新建大型、超大型數據中心的PUE要求已從2017年的1.5降至2021年的1.3以下,國家樞紐節點PUE更是要求進一步降到1.25以下。“東數西 算”工程要求東部地區PUE目標不超過1.25,西部地區不超過1.2,能效指標更加嚴格。
節能降耗的先進技術成為發展重點。智算中心具有高功率密度屬性,隨著服務器主流芯片的功耗不斷增長,用于AI訓練的機器單機柜功率密度將大幅增加,傳統的風冷模式已無法滿足智算中心的制冷散熱需求,液冷技術的應用為智算中心綠色化運轉提供了解決思路。液冷是指借助高比熱容的液體作為熱量傳輸介質滿足服務器等IT設備散熱需求的一種冷卻方式,比傳統風冷具備更強的冷卻能力,其冷卻力是空氣的1,000-3,000倍,熱傳導能力是空氣的25倍。同等散熱時,液冷系統相比傳統風冷系統約節電30%-50%,數據中心PUE值可降至1.2以下,甚至趨于1。
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。