英特爾宣布實現 MLPerf Client 0.6 基準測試首個全 NPU 支持
5 月 7 日消息,當地時間 5 月 5 日,英特爾宣布成為唯一在 MLPerf Client v0.6 基準測試中實現全 NPU 支持的企業。
本文引用地址:http://www.104case.com/article/202505/470141.htm英特爾表示,該結果標志著行業首個針對客戶端 NPU 的大語言模型(LLM)性能標準化評估。測試數據顯示,英特爾酷睿 Ultra 200 處理器在 GPU 和 NPU 上的輸出速度遠超人類平均閱讀速度。
英特爾客戶端 PC 產品營銷副總裁兼總經理丹尼爾?羅杰斯(Daniel Rogers)表示,“我們很榮幸能夠引領行業,實現客戶端 PC 平臺的全 NPU 加速和領先 GPU 性能?!?/p>
測試配置
AMD英特爾平臺華碩 Zenbook S 16華碩 Zenbook S 14型號UM5606WAUX5406SACPUAMD 銳龍 AI HX 370酷睿 Ultra 9 288VBIOS 日期2025 年 3 月 21 日2025 年 2 月 26 日BIOS 版本UM5606WA.317UX5406SA.306內存32GB LPDDR5,7500MHz32GB LPDDR5,8533 MHz顯卡AMD Radeon 890M英特爾 Arc 140V存儲1TB1TB操作系統Windows 11 專業版 x64
英特爾表示,在基于 Llama 2 7B 模型的四項內容生成與摘要測試中,英特爾在 NPU 和內置 Arc GPU 上均展現領先性能:
· 創 NPU 最快響應速度,首個詞元生成僅需 1.09 秒(首 token 延遲)
· 實現 NPU 最高吞吐量 18.55 tokens / 秒
· GPU 首 token 生成速度超越競品
MLPerf Client 由 MLCommons 聯盟成員(含英特爾、AMD、微軟、英偉達、高通)聯合開發,首次突破以 GPU 為核心的測試模式,新增專用 NPU 基準評估。
評論