新聞中心

        EEPW首頁 > 智能計算 > 新品快遞 > 美光 DDR5 搭配第四代 AMD EPYC 處理器官方基準測試:內存帶寬翻倍

        美光 DDR5 搭配第四代 AMD EPYC 處理器官方基準測試:內存帶寬翻倍

        作者:瀟公子 時間:2022-12-20 來源:IT之家 收藏

        IT之家 12 月 19 日消息,據發(fā)布,與  雙方在奧斯汀建立聯合服務器實驗室,以減少服務器內存驗證時間,在產品驗證和發(fā)布期間共同進行工作負載測試。

        本文引用地址:http://www.104case.com/article/202212/441817.htm

        目前適用于數據中心的 內存和第四代 EPYCTM (霄龍)處理器均已出貨,官方對其進行了一些常見的高性能計算(HPC)工作負載基準測試。

        長期以來,超級計算機承擔著高性能計算工作負載。此類大規(guī)模的數據密集型工作負載需要運行 TB 級的數據量以進行數百萬個并行操作,以解決人類世界的難題,如天氣和氣候預測;地震建模;化學、物理和生物分析等。

        隨著計算機架構的進步,此類工作負載往往托管在超大型“可橫向擴展”的高性能服務器集群中。這些服務器集群需要集合最強大的算力、架構、內存和存儲基礎設施,以滿足關鍵工作負載對可擴展性、低延遲和高性能的需求。然而隨著服務器 CPU 的性能和吞吐量不斷增長,DDR4 無法提供足夠的內存帶寬,來滿足不斷增長的高性能內核。

        美光 DDR5 搭配第四代 AMD EPYC 處理器官方基準測試:內存帶寬翻倍

        為緩解這一瓶頸,美光 內存與采用了 Zen 4 服務器架構的第四代 EPYC 處理器聯合,使服務器 CPU 能夠更好地匹配內存產品,滿足數據密集型工作負載對性能和效率的需求。IT之家獲悉,美光對最新的 AMD Zen 4 96 核 CPU 和美光 進行了行業(yè)內高性能計算工作負載基準測試,所有結果均顯示性能提升了兩倍。

        STREAM1  是常見的基準測試工具,用于測量高性能計算機的內存帶寬,可捕獲高性能計算系統(tǒng)的峰值內存帶寬。

        該工作負載使用的軟件堆棧

        ● Alma 9 Linux kernel 5.14

        ● STREAM.f,2021 年 11 月 29 日發(fā)布版本

        美光 DDR5 搭配第四代 AMD EPYC 處理器官方基準測試:內存帶寬翻倍

        測試設置

        ● DDR4 系統(tǒng)搭配第三代 64 核 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng) 2 的 RDIMM 內存槽插滿,共 64GB

        ● DDR5 系統(tǒng)搭配第四代 96 核 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng) 3 的 RDIMM 內存槽插滿,共 64GB

        測試結果

        ● DDR5 系統(tǒng)每插槽內存帶寬翻倍,達到 378 GB / s

        ● 該結果意味著客戶能運行更大規(guī)模的人工智能 / 機器學習 (AI / ML) 項目,或利用 DDR5 增加的內存帶寬進行更多高性能計算。

        美光 DDR5 搭配第四代 AMD EPYC 處理器官方基準測試:內存帶寬翻倍

        此次測試使用的高性能計算工作負載代碼針對天氣和氣候。WRF 模型在一些支持高性能浮點處理、高內存帶寬、低延遲網絡等傳統(tǒng)高性能計算架構中表現良好,測試對象為橫向分辨率為 2.5 公里的美國大陸地區(qū) (CONUS)。

        該工作負載使用的軟件堆棧

        ● Alma 9 Linux kernel 5.14

        ● WRF 2.3.5 & 4.3.3

        ● Open MPI v4.1.1

        測試設置

        ● DDR4 系統(tǒng)搭配第三代 64 核 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng) 2 的 RDIMM 內存槽插滿,共 64GB

        ● DDR5 系統(tǒng)搭配第四代 96 核 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng) 3 的 RDIMM 內存槽插滿,共 64GB

        測試結果

        ● 美光 DDR5 搭配第四代 AMD EPYC 處理器,可實現 1.3567 時間步 / 秒 VS DDR4 系統(tǒng)的 2.8533 時間步 / 秒

        ● 速度更快意味著可使用更大的數據庫或運行更多模型以進行天氣預測,進而改善預測的準確度。

        OpenFOAM 是一種計算流體動力學 (CFD) 的開源高性能計算工作負載,廣泛應用于多個行業(yè),有助于縮短開發(fā)時間并降低成本。從消費類產品設計到航空航天設計,OpenFOAM 能夠模擬不同應用中的物理互動,包括摩托車風擋湍流。

        在該模擬中,OpenFOAM 能夠計算摩托車和騎手周圍的穩(wěn)定氣流。OpenFOAM 能夠根據用戶指定的進程數進行負載均衡計算,以此將網格分解成多個部分并分配給不同的進程求解。求解完成后,再將網格和解重新組合為單個域。

        該工作負載使用的軟件堆棧

        ● OpenFOAM CFD 軟件?(版本 8),其中摩托車網格尺寸為:600 x 240 x 240

        ● Alma 9 Linux kernel 5.14

        ● Open MPI v4.1.1

        測試設置

        ● DDR4 系統(tǒng)搭配第三代 64 核 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng) 2 的 RDIMM 內存槽插滿,共 64GB

        ● DDR5 系統(tǒng)搭配第四代 96 核 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng) 3 的 RDIMM 內存槽插滿,共 64GB

        測試結果

        測試結果表明美光 DDR5 產品組合將 OpenFOAM 性能提高了 2.4 倍。OpenFOAM 為五大高性能計算軟件平臺之一,擁有大型開源社區(qū)。該軟件廣泛應用于大學和研發(fā)中心,可利用高帶寬內存和擁有密集內核的高性能 CPU,實現高度的并行操作。

        CP2K 是一款開源量子化學工具,適用于許多應用,包括固態(tài)生物系統(tǒng)模擬。CP2K 能夠為不同的建模方法提供通用的框架。此次測試對象為水 (H2O) 的密度泛函理論 (DFT),模擬盒子中共包含 6,144 個原子(2,048 個水分子)。

        該工作負載使用的軟件堆棧

        ● H2O-DFT-LS.NREP4 及 H2O-DFT-LS

        ● Alma 9 Linux kernel 5.14

        測試設置

        ● DDR4 系統(tǒng)搭配第三代 64 核 3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng) 2 的 RDIMM 內存槽插滿,共 64GB

        ● DDR5 系統(tǒng)搭配第四代 96 核 3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng) 3 的 RDIMM 內存槽插滿,共 64GB

        測試結果

        測試結果表明美光 DDR5 產品組合將分子動力學性能提高了 2.1 倍。隨著內核數和內存帶寬增加,此類工作負載的性能也顯著提升。

        總結

        目前只針對少量高性能計算工作負載進行測試,因此以上只是初步成果。將高性能高帶寬內存與最新的服務器處理器(如第四代 AMD EPYC 處理器)相結合,可為高性能計算客戶創(chuàng)造新的可能。

        1 在 STREAM 基準測試中配置了 25 億個向量的 STREAM Benchmark—— 運行在一臺單 AMD CPU 系統(tǒng)上

        2 AMD DDR4 系統(tǒng)為一臺 64 核 AMD EPYC 7763 處理器,DDR4-3200 MHz 的 RDIMM 內存槽插滿,共 64GB

        3 AMD DDR5 系統(tǒng)為一臺 96 核 AMD EPYC 9654 處理器,DDR5-4800 MHz 的 RDIMM 內存槽插滿,共 64GB

        4  橫向分辨率為 12.5 公里 CONUS 的 WRF 在 DDR4 系統(tǒng)上的運行時間為 929 秒,在 DDR5 系統(tǒng)上的運行時間為 287 秒(均包括存儲器的輸入 / 輸出時間)。該測試中 WRF 配置為 2.5 公里 CONUS,測試結果為 1.3567 時間步/ 秒,相比之下 DDR4 的運行時間為 2.8533 時間步 / 秒。

        5 針對 OpenFOAM,運行了三種變體:

        5a:1004040 runtimes,DDR4 系統(tǒng)運行時間為 1,144 秒,DDR5 系統(tǒng)運行時間為 478 秒

        5b:1084646 runtimes,DDR4 系統(tǒng)運行時間為 1,633 秒,DDR5 系統(tǒng)運行時間為 698 秒

        5c:1305252 runtimes,DDR4 系統(tǒng)運行時間為 2,522 秒,DDR5 系統(tǒng)運行時間為 1,091 秒

        6 分子動力學工作負載在 DDR4 系統(tǒng)上的運行時間為 2,519 秒,在 DDR5 系統(tǒng)上的運行時間為 1,242 秒



        關鍵詞: 美光 AMD DDR5

        評論


        相關推薦

        技術專區(qū)

        關閉
        主站蜘蛛池模板: 南丰县| 马边| 介休市| 湖南省| 浪卡子县| 临海市| 静乐县| 从化市| 科技| 阳新县| 江川县| 芮城县| 克什克腾旗| 沐川县| 建始县| 林州市| 厦门市| 丹阳市| 张北县| 马边| 商洛市| 潢川县| 灌南县| 教育| 甘孜县| 仪征市| 华池县| 登封市| 克拉玛依市| 云龙县| 宁化县| 岑巩县| 新绛县| 汨罗市| 塘沽区| 扎兰屯市| 平度市| 盐亭县| 华蓥市| 宜川县| 巴楚县|