博客專欄

        EEPW首頁 > 博客 > 性能暴降92%?英特爾中國“特供版”AI芯片曝光

        性能暴降92%?英特爾中國“特供版”AI芯片曝光

        發(fā)布人:芯智訊 時間:2024-05-03 來源:工程師 發(fā)布文章

        image.png

        據(jù)外媒The register報道,繼不久前英特爾正式發(fā)布了新一代AI加速芯片Gaudi 3 之后,正準備面向中國市場推出“特供版”Gaudi 3,包括名為HL-328的OAM兼容夾層卡(Mezzanine Card)和名為HL-388的PCle加速卡兩種硬件形態(tài)。

        英特爾在其Gaudi 3 白皮書中披露了上述信息,其中HL-328將于6月24日推出,HL-388將于9月24日推出。

        image.png

        具體硬件規(guī)格方面,中國特供版的Gaudi 3 與原版相比,具有相同的96MB SRAM片上內(nèi)存, 128GB HBM2e高帶寬內(nèi)存,帶寬為 3.7TB/s,擁有PCIe 5.0 x16 接口和解碼標準。但是,由于美國對于AI芯片的出口管制規(guī)則限制,使得這類高性能AI的綜合運算性能(TPP)需要低于4800才能出口到中國, 這意味中國特供版的Gaudi 3 的16bit性能不能超過150 TFLOPS。

        根據(jù)英特爾公布的數(shù)據(jù)顯示,Gaudi 3 在 FP16/BF16 上可以達到 1835 TFLOPS,相比英偉達H100在大模型訓練方面快40%、推理能效高50%。

        image.png

        顯然,中國特供版的Gaudi 3 需要大幅降低AI性能,才能合規(guī)出口到中國。因此,中國特供版Gaudi 3 需要大幅削減內(nèi)核數(shù)量(原版擁有 8 個矩陣數(shù)學引擎和64 個張量內(nèi)核)和工作頻率,最終可能需要其AI性能降低約92%才能符合美國的出口管制要求。

        由于中國特供版Gaudi 3 AI性能的降低,這也將使得其TDP(熱設計功耗)大幅降低。根據(jù)曝光的資料顯示,中國特供版Gaudi 3的OAM卡和PCIe卡的TDP均為450瓦,而原版PCIe卡(HL-338)的TDP高達600瓦,原版OAM卡(HL-325L、HL-335)的TDP更是高達900瓦。

        可以預見的是,英特爾專為中國市場推出的“特供版”Gaudi 3的OAM兼容夾層卡(HL-328)和PCle加速卡(HL-388)的AI性能將會與英偉達針對中國市場推出的AI加速卡H20相當,它具有 148 TFLOPS 的 FP16/ BF16 性能,略低于 150 TFLOPS 的限制。但是,在HBM容量及帶寬上,英特爾中國特供版Gaudi 3將低于英偉達H20,這也使得其在與英偉達H20的競爭當中可能將處于劣勢,當然具體也要看定價是否有優(yōu)勢。

        相關文章《超越英偉達H100!英特爾Gaudi3發(fā)布:訓練快40%,推理快50%!》

        編輯:芯智訊-浪客劍


        *博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。



        關鍵詞: 芯片

        相關推薦

        技術專區(qū)

        關閉
        主站蜘蛛池模板: 盐山县| 吉木萨尔县| 铜山县| 重庆市| 区。| 信丰县| 青铜峡市| 孝昌县| 绿春县| 邵阳县| 易门县| 文水县| 芜湖县| 宜都市| 南雄市| 裕民县| 临泽县| 堆龙德庆县| 宽甸| 紫云| 资源县| 延吉市| 屏东市| 勐海县| 横峰县| 尚义县| 乐山市| 贵阳市| 徐汇区| 陇西县| 阿拉尔市| 石渠县| 桐乡市| 永德县| 庄河市| 万年县| 怀集县| 兰坪| 江华| 望都县| 安徽省|