新聞中心

EEPW首頁 > 嵌入式系統 > 新品快遞 > 英特爾推出oneAPI 2023工具包，大幅提升即將推出的英特爾硬件的價值

英特爾推出oneAPI 2023工具包，大幅提升即將推出的英特爾硬件的價值

—— 英特爾工具的新功能提升了跨平臺生產力

作者：時間：2022-12-20 來源：電子產品世界

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

近日，英特爾宣布英特爾^? oneAPI工具包的2023年版本已在英特爾?開發者云平臺（Intel^? Developer Cloud）上線，并正在通過現有的渠道推送。新的oneAPI 2023工具包支持即將推出的第四代英特爾?至強?可擴展處理器、英特爾^?至強^? CPU Max 系列和英特爾^?數據中心GPU，包括Flex系列和新的Max系列。這些工具可提升性能和生產力，并增加了對新的Codeplay1插件的支持，使開發者能更容易地為那些非英特爾的GPU架構編寫SYCL代碼。這些基于標準的工具提供了硬件方面的選擇，也讓在跨架構系統上運行的高性能應用的開發變得更加輕松。

本文引用地址：http://www.104case.com/article/202212/441806.htm

英特爾oneAPI 2023工具包包括一套完整的最新編譯器、庫、分析和移植工具，以及優化后的AI和機器學習框架，讓開發者能為oneAPI支持的CPU、GPU和FPGA構建高性能、跨架構的應用。開發者可使用這些工具快速實現性能目標，并通過單個代碼庫節省時間，從而將更多時間用于創新。

新版本的oneAPI工具包可幫助開發者利用英特爾硬件的先進功能：

● 第4代英特爾至強可擴展處理器和至強CPU Max系列，內置英特爾?高級矩陣擴展（英特爾? AMX）、Quick Assist 技術（QAT）、英特爾?AVX-512、bfloat16 及更多。

● 英特爾?數據中心GPU，包括內置基于硬件的AV1編碼器的Flex系列，以及Max系列。Max系列提供靈活數據類型的支持，內置英特爾? X^e矩陣擴展（英特爾?XMX）、矢量化引擎（vector engine）、英特爾?X^e-Link互聯擴展和其它功能。

oneAPI 2023工具包具有先進的軟件性能：

● 英特爾? Fortran編譯器（Intel? Fortran Compiler）提供了完整的 Fortran 語言直至 Fortran 2018標準的支持，并擴展了對 OpenMP GPU 分流的支持，加快了符合標準的應用程序的開發。

● 英特爾? oneAPI數學內核庫（oneMKL）包含OpenMP 分流能力的擴展，提高了可移植性。

● 英特爾? oneAPI 深度神經網絡庫（oneDNN）支持第四代英特爾至強處理器和Max系列CPU處理器的高級深度學習功能，包括英特爾?AMX、英特爾?AVX-512、VNNI 和 bfloat16。

通過豐富的SYCL支持，以及代碼遷移和分析工具的強化，讓面向多架構系統的代碼開發變得更輕松，進而提高開發者的生產力。

● 英特爾?oneAPI DPC++/C++編譯器增加了Codeplay為英偉達和AMD GPU開發的新插件的支持，以簡化SYCL代碼的編寫，并提高代碼面向這些處理器架構的可移植性。這提供了一個統一的構建環境，并整合了工具，以提高跨平臺生產力。作為該解決方案的一部分，英特爾和Codeplay將為英偉達GPU的oneAPI插件開始提供商業化的優先支持（priority support）。

● 基于開源 SYCLomatic的英特爾? DPC++ 兼容性工具增加了100多個新的CUDA APIs支持，讓從CUDA到SYCL的代碼遷移變得更容易。

● 用戶可以使用英特爾?VTune? Profiler識別大規模MPI應用中的不均衡問題。

● 英特爾? Advisor為英特爾數據中心GPU Max系列添加了自動化roofline分析，以識別內存、緩存或計算瓶頸，確認其原因并進行優先處理，同時提供可操作的建議，以優化從CPU到GPU 的工作負載分流中的重復數據傳輸成本。

48%⁴的開發者面向使用多種處理器的異構系統進行開發，因此需要更高效的跨架構編程來應對現實工作負載日益擴大的范圍和規模。結合使用oneAPI 的開放、統一的編程模型與英特爾基于標準的多架構工具，開發者能夠在CPU和加速器的硬件、性能、生產力和代碼可移植性方面自由地進行選擇。相反，為專有編程模型（如 CUDA）編寫的代碼，缺乏面向其它硬件的可移植性，讓開發實踐變得孤立，將企業困于一個封閉的生態系統中。

此外，開放生態系統也在繼續擴大對oneAPI的使用，新的oneAPI卓越中心正在陸續成立。劍橋大學Open Zettascale 實驗室正致力于將重要的百萬兆級的備選代碼（candidate codes）移植到oneAPI上，包括CASTEP、FEniCS和AREPO。該中心還提供課程和研討會，由專家講授oneAPI使用方法和工具，用于編譯和移植代碼以及優化性能。目前，在全球總共已經建立了30個oneAPI卓越中心。

備注：

¹ Codeplay是一家英特爾旗下的公司。

²MLPerf? DeepCAM:

§ 使用優化后的Pytorch 1.11在MLPerf? HPC-AI v 0.7 DeepCAM訓練基準上獲得未經認證的性能提升。結果沒有經過MLCommons協會的認證。未經認證的結果沒有經過MLPerf?審查，可能使用與經MLPerf?規范認證的結果不一致的測量方法和/或工作負載實現方式。MLPerf?名稱和標識是MLCommons協會在美國和其他國家的商標。保留所有權利。嚴禁未經授權的使用。

§ AMD EPYC 7763 ：英特爾截至2022年4月7日的測試。1-節點，2x?AMD EPYC 7763，啟用超線程，禁用 Turbo，總內存 512 GB（16 個插槽/32 GB/3200 MHz, DDR4），BIOS版本AMI 1.1b，ucode版本0xa001144，操作系統Red Hat Enterprise Linux 8.5 (Ootpa)，內核4.18.0-348.7.1.el8_5.x86_64，編譯器gcc（GCC）8.5.0 20210514 (Red Hat 8.5.0-4)，https://github.com/mlcommons/hpc/tree/main/deepcam, torch1.11.0a0+git13cdb98, torch-1.11.0a0+git13cdb98-cp38-cp38-linux_x86_64.whl, torch_ccl-1.2.0+44e473a-cp38-cp38-linux_x86_64.whl, intel_extension_for_pytorch-1.10.0+cpu-cp38-cp38-linux_x86_64.whl，Intel MPI 2021.5，Python3.8

§ 英特爾? 至強? 8380可擴展處理器：英特爾截至2022年4月7日的測試。1-節點，2x 英特爾? 至強? 8380處理器，啟用超線程，禁用 Turbo，總內存 512 GB（16個插槽/32 GB/3200 MHz, DDR4），BIOS版本 SE5C6200.86B.0022.D64.2105220049，ucode版本0xd0002b1，操作系統Red Hat Enterprise Linux 8.5 (Ootpa)，內核4.18.0-348.7.1.el8_5.x86_64，編譯器gcc (GCC) 8.5.0 20210514 (Red Hat 8.5.0-4)，https://github.com/mlcommons/hpc/tree/main/deepcam, torch1.11.0a0+git13cdb98, torch-1.11.0a0+git13cdb98-cp38-cp38-linux_x86_64.whl, torch_ccl-1.2.0+44e473a-cp38-cp38-linux_x86_64.whl, intel_extension_for_pytorch-1.10.0+cpu-cp38-cp38-linux_x86_64.whl (AVX-512), Intel MPI 2021.5，Python3.8

§ 英特爾? 至強? CPU Max 系列（緩存模式）AVX-512：英特爾截至2022年5月25日的測試。1-節點，2x英特爾? 至強? CPU Max 系列，啟用超線程，禁用 Turbo，總內存 128GB 高帶寬內存（HBM）和1TB（16個插槽/ 64 GB/ 4800 MHz, DDR5），集群模式：SNC4，BIOS版本EGSDCRB1.86B.0080.D05.2205081330，ucode版本0x8f000320，操作系統CentOS Stream 8，內核5.18.0-0523.intel_next.1.x86_64+server，編譯器gcc (GCC) 8.5.0 20210514 (Red Hat 8.5.0-10), https://github.com/mlcommons/hpc/tree/main/deepcam, torch1.11.0a0+git13cdb98, AVX-512, FP32, torch-1.11.0a0+git13cdb98-cp38-cp38-linux_x86_64.whl, torch_ccl-1.2.0+44e473a-cp38-cp38-linux_x86_64.whl, intel_extension_for_pytorch-1.10.0+cpu-cp38-cp38-linux_x86_64.whl (AVX-512)，Intel MPI 2021.5，Python3.8

§ NVIDIA A100 80GB：英特爾截至2022年4月13日的測試。1-節點，2x英特爾? 至強? 8360Y可擴展處理器，啟用超線程，啟用Turbo，總內存 256 GB（16個插槽/16 GB/3200 MHz），PCIe 版 NVIDIA A100，BIOS版本AMI 1.1b，ucode版本0xd000311，操作系統Red Hat Enterprise Linux 8.4 (Ootpa)，內核4.18.0-305.el8.x86_64，編譯器gcc (GCC) 8.4.1 20200928 (Red Hat 8.4.1-1)，https://github.com/mlcommons/hpc/tree/main/deepcam, pytorch1.11.0 py3.7_cuda11.3_cudnn8.2.0_0, cudnn 8.2.1, cuda11.3_0, intel-openmp 2022.0.1 h06a4308_3633，python3.7

§ 英特爾? 至強? CPU Max 系列（緩存模式）BF16/AMX：英特爾截至2022年5月25日的測試。 1-節點，2x英特爾? 至強? CPU Max 系列，啟用超線程，禁用 Turbo，總內存128GB高帶寬內存（HBM）和1TB（16個插槽/64 GB/4800 MHz，DDR5），集群模式：SNC4，BIOS版本EGSDCRB1.86B.0080.D05.2205081330，ucode版本0x8f000320，操作系統CentOS Stream 8，內核5.18.0-0523.intel_next.1.x86_64+server，編譯器gcc (GCC) 8.5.0 20210514 (Red Hat 8.5.0-10)，https://github.com/mlcommons/hpc/tree/main/deepcam, torch1.11.0a0+git13cdb98, AVX-512 FP32, torch-1.11.0a0+git13cdb98-cp38-cp38-linux_x86_64.whl, torch_ccl-1.2.0+44e473a-cp38-cp38-linux_x86_64.whl, intel_extension_for_pytorch-1.10.0+cpu-cp38-cp38-linux_x86_64.whl (AVX-512，AMX，啟用BFloat16)，Intel MPI 2021.5，Python3.8

§ 第四代英特爾? 至強? 可擴展處理器多節點集群：英特爾截至2022年4月9日的測試。16-節點集群，1-節點，2x第四代英特爾? 至強? 可擴展處理器，啟用超線程，啟用Turbo，總內存 256 GB（16個插槽/16 GB/4800 MHz，DDR5），BIOS版本Intel SE5C6301.86B.6712.D23.2111241351，ucode版本0x8d000360，操作系統Red Hat Enterprise Linux 8.4 (Ootpa)，內核4.18.0-305.el8.x86_64，編譯器gcc (GCC) 8.4.1 20200928 (Red Hat 8.4.1-1)，https://github.com/mlcommons/hpc/tree/main/deepcam, torch1.11.0a0+git13cdb98 AVX-512, FP32, torch-1.11.0a0+git13cdb98-cp38-cp38-linux_x86_64.whl, torch_ccl-1.2.0+44e473a-cp38-cp38-linux_x86_64.whl, intel_extension_for_pytorch-1.10.0+cpu-cp38-cp38-linux_x86_64.whl (AVX-512)，Intel MPI 2021.5，Python3.8

³LAMMPS

§ 與AMD EPYC 7773X相比，英特爾? 至強? CPU Max系列運行LAMMPS工作負載（原子流體的Geomean、銅、DPD、液晶、聚乙烯、蛋白質、Stillinger-Weber勢、Tersoff勢、水）的性能要高1.9倍。

§ 與英特爾? 至強? 8380處理器相比，英特爾? 至強? CPU Max系列處理器運行LAMMPS工作負載（原子流體的Geomean、銅、DPD、液晶、聚乙烯、蛋白質、Stillinger-Weber勢、Tersoff勢、水）的性能要高1.6倍。Intel? Xeon? 8380：基于英特爾截至2022年10月28日的測試。1-節點，2x英特爾? 至強? 8380處理器，啟用超線程，啟用Turbo，NUMA配置的SNC2，總內存256GB（16x16GB 3200MT/s, Dual-Rank），BIOS版本SE5C620.86B.01.01.0006.2207150335，ucode版本0xd000375，操作系統Rocky Linux 8.6，Linux版本4.18.0-372.26.1.el8_6.crt1.x86_64，LAMMPS v2021-09-29 cmkl:2022.1.0, icc:2021.6.0, impi:2021.6.0, tbb:2021.6.0; 線程/核:; 啟用Turbo; BuildKnobs:-O3 -ip -xCORE-AVX512 -g -debug inline-debug-info -qopt-zmm-usage=high

§ AMD EPYC 7773X: 基于英特爾截至2022年10月6日的測試。1-節點，2x AMD EPYC, 啟用超線程，啟用Turbo，NUMA配置的NPS數：4，總內存256GB（16x16GB 3200MT/s, Dual-Rank），BIOS版本M10, ucode版本0xa001224，操作系統Rocky Linux 8.6 (Green Obsidian)，Linux版本4.18.0-372.26.1.el8_6.crt1.x86_64, LAMMPS v2021-09-29 cmkl:2022.1.0, icc:2021.6.0, impi:2021.6.0, tbb:2021.6.0; 線程/核:; 啟用Turbo; BuildKnobs:-O3 -ip -g -debug inline-debug-info -axCORE-AVX2 -march=core-avx2;

§ 英特爾? 至強? CPU Max系列：英特爾截至2022年8月31日的測試。1-節點，2x英特爾? 至強? CPU Max 系列，啟用超線程，啟用Turbo，NUMA配置的SNC4，總內存128 GB（3200MHz的HBM2e高帶寬內存），BIOS版本SE5C7411.86B.8424.D03.2208100444，ucode版本0x2c000020，操作系統CentOS Stream 8，Linux版本5.19.0-rc6.0712.intel_next.1.x86_64+server, LAMMPS v2021-09-29 cmkl:2022.1.0, icc:2021.6.0, impi:2021.6.0, tbb:2021.6.0; 線程/核:; 禁用Turbo; BuildKnobs:-O3 -ip -xCORE-AVX512 -g -debug inline-debug-info -qopt-zmm-usage=high

⁴Evans Data Global Development Survey Report 22.1, 2022年6月

性能因用途、配置和其他因素而異。結果可能會有所不同。

性能結果基于截至配置中所示日期的測試，并且可能無法反映所有公開可用的更新。

英特爾不負責控制或審計第三方數據。在評估數據準確性時，請參考其他信息源。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>