新聞中心

        EEPW首頁 > 新聞縱覽 > 內置AI加速器,第五代英特爾至強打造更可靠性能和更出色能效

        內置AI加速器,第五代英特爾至強打造更可靠性能和更出色能效

        作者: 時間:2024-02-28 來源: 收藏

        第五代英特爾至強鉑金 8592+處理器憑借優化SoC,更大緩存和更快內存,在運行諸多工作負載時具備與眾不同的優勢,尤其是AI工作負載。

        本文引用地址:http://www.104case.com/article/202402/455779.htm

        優點:

        · 主流型號上擁有額外的八個核心

        · 高端型號上的三級緩存容量增大了三倍

        · AI工作負載中具備領先性能

        · 在多線程和輕線程工作負載中均有出色表現

        · 支持英特爾AMX、AVX-512、VNNIBFloat 16

        · 支持CXL Type 3存儲設備

        英特爾數據中心產品始終具備與眾不同的優勢。于去年12月最新推出的第五代英特爾至強可擴展處理器(以下簡稱第五代至強),在一眾基準測試中,展現出強大性能提升。而且,這款最新產品的發布也展示出英特爾正在持續推動自身產品路線圖發展并踐行對客戶的承諾

        第五代至強的旗艦型號上比上一代增加了四個核雙插槽服務器提供128核心256線程。其三級緩存亦增加三倍,并為高性能型號配備了更快的DDR5-5600。結合其有針對性的改進,包括對芯片架構的新設計,相較上一代產品,第五代至強可將AI推理性能提升42%,在進行通用計算時將整體性能提升高達21%,并在一系列客戶工作負載中將每瓦性能提升高達36%

        第五代至強采用Intel 7制程工藝,是該節點的升級版本,并使用了增強Raptor Cove微架構。第五代至強擁有許多創新和設計升級,遠超我們對新一代產品的期待。其中,英特爾從第四代至強芯片的復雜四芯粒設計,轉變為更簡單的雙die設計,總共包含610億個晶體管,新的die提供了更一致的延遲性。盡管經過重新設計,第五代至強仍然與現有的四代至強Eagle Stream平臺的兼容性,從而縮短了驗證時間,使新的處理器能夠快速在市場上應用

        第五代至強在整體核心數量上雖然并未創造業界紀錄,但英特爾的芯片仍能滿足大部分市場的需求,而且得益于其內置加速器和在AI工作負載中的性能表現,英特爾能夠以兼具性能和能效的優勢組合贏得更多客戶青睞

        第五代英特爾至強處理器規格和售價

        第五代英特爾至強處理器系列包括32SKU主要分為,包括為云、網絡、存儲、長使用壽命、單路通用及液冷通用。該系列也被劃分為鉑金、金、銀和銅四個子等級。值得注意的是,第五代英特爾至強可擴展處理器最多支持雙路,沒有八插槽版本。但同時,英特爾還提供了不同級別的內存支持,八通道速度從DDR5-4400擴展到DDR5-5600。

        英特爾為每種類型的工作負載都設置了不同的SKU,第五代至強的32SKU較之52SKU的上一代至強,在產品組合上已經精簡了很多

        對于第五代至強,英特爾繼續推動加速技術的發展,這些技術可以直接購買或通過“即用即付”的模式進行購買。芯片上專門設計的幾大加速器區域旨在大幅提升多種工作的性能,例如壓縮、加密、數據移動和數據分析,這些工作通常需要使用獨立的加速器才能展現出領先性能。每個芯片可以啟用不同數量的加速器設備,但+型號的芯片默認情況下每種類型的加速器都至少啟用一個

        第五代至強標準型號的TDP從125W到350W不等,但液冷通用版本則最高可達385W。

        第五代至強鉑金8592+擁有64核心和128線程,比60個核心的第四代至強8490H多了四個核心。然而,8592+比第四代通用旗艦型號8480+多了個核

        正如其后綴+所表示的,8592+激活了內置個加速器。額外付費后,每種加速器都可以升級到四個加速處理單元,通常由原始設備制造商提供,因此價格有所不同。

        8592+的核心基頻為2.0 GHz,但可以在所有核心上提升到3.0 GHz,或在單個核心上提升到3.8 GHz。該芯片配備了320MB的L3緩存,大小是上一代產品的三倍多。英特爾提升三級緩存容量的決定將有利于運行多種工作負載,但也有個前提條件。正如我們將在下文中介紹的,第五代至強處理器可以采用三種不同的芯片配置,只有最高端的芯片配置(40個核心及以上)具有三倍的緩存容量。與此同時,32核及更低的型號所使用的芯片通常與上一代處理器的緩存容量相同。

        至強處理器現在在1DPC(每通道一個DIMM)模式下最高支持DDR5-5600,在2DC模式下支持DDR5-4800,比上一代的DDR5-4800有所改進。英特爾還將UPI鏈路調整為20GT/s,比以前的16 GT/s略有提高。

        所有的第五代至強具備以下特性:

        lLGA4677插槽/ Eagle Stream平臺

        l超線程

        l八通道DDR5內存:頂配型號運行速度高達DDR5-5600(1DPC)和DDR5-4800(2DPC),但速度會因型號而異

        l80PCIe 5.0通道

        l每個插槽最高6TB內存

        l支持CXL Type 3內存

        lAMX,AVX-512,VNNI,BFLOAT 16

        lUPI速度從16 GT/S提高到20 GT/S

        AI工作負載

        生成式AI的熱議度與日俱增,但數據中心中使用的人工智能模型多種多樣盡管目前,我們仍然使用GPU來訓練AI大模型和運行大多數大型生成式AI模型。然而,大多數AI推理一直在數據中心CPU上運行,我們預計這一趨勢不僅會繼續,而且還會穩步攀升

        AI領域的發展瞬息萬變,因此要對其在數據中心里的性能進行標準化衡量始終具備挑戰性。而且,批處理大小和其他測試參數在實際部署中也會有所不同。因此,在這些并沒有優化到我們在實際部署中期望的水平的時候,如下基準測試僅供參考一些數據中心和企業會采用現成的AI模型進行微調,因此,雖然該方法適用于通用性能測試,但所采用的模型等因素也會相應不同。

        顯然,英特爾啟用 AMX、AVX-512、VNNI 和 Bfloat16 等AI增強功能,為AI用戶奠定了堅實的基礎。在TensorFlow ResNet-50測試中,第五代至強8592+的速度比64核的第四代霄龍9554快18%但在AlexNet和GoogLeNet模型中,這兩款芯片的速度不相上下。令人驚訝的是,96核的第四代霄龍9654在三個TensorFlow工作負載中均排名墊底,這意味著其chiplets陣列可能無法為此類模型提供最低延遲和最佳可擴展性。

        MLpack中,我們發現8592+在完成任務的速度上,比兩款用于對比其他處理器都要快40%。三個ONNX推斷基準測試也都突顯出第五代至強加速的優勢。

        關鍵的是,我們注意到第五代至強在除了GoogleNet模型外所有工作負載中,相對于上一代60核的8490H有了大幅度的性能提升。因此整體來看第五代至強性能表現出眾而從其他一些第三方基準測試中可以看出AMX為英特爾在利用指令集的模型中提供了顯著的領先優勢。正如我們在許多基準測試中看到的,更高的核心數量并不是所有類型工作負載的萬能選擇——尤其是在像AI這樣對延遲敏感的工作負載中

        第五代至強利用其AI加速內置加速引擎,為廣泛工作負載提供了顯著優勢。而且,第五代至強在包括AI工作負載在內的多個工作負載中均具備領先優勢,這也為即將在2024年推出的具備多達288核心的Sierra Forest,以及緊隨其后發布的Granite Rapids奠定了良好的基礎。





        關鍵詞:

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 正镶白旗| 炎陵县| 井冈山市| 永泰县| 岐山县| 深泽县| 望都县| 江津市| 乌恰县| 霍邱县| 涿鹿县| 婺源县| 罗甸县| 沁源县| 成武县| 桐柏县| 施秉县| 筠连县| 清镇市| 武宣县| 全南县| 巴彦淖尔市| 夏河县| 皋兰县| 安乡县| 邵武市| 隆化县| 沙坪坝区| 华安县| 紫云| 洛隆县| 涡阳县| 额敏县| 汝州市| 墨竹工卡县| 泰安市| 大埔县| 红河县| 大兴区| 丰镇市| 祁门县|