博客專欄

        EEPW首頁(yè) > 博客 > 英特爾中國(guó)“特供版”AI芯片Gaudi 2 供不應(yīng)求

        英特爾中國(guó)“特供版”AI芯片Gaudi 2 供不應(yīng)求

        發(fā)布人:芯智訊 時(shí)間:2023-09-22 來(lái)源:工程師 發(fā)布文章

        image.png

        9月19日消息,據(jù)Digitimes 援引供應(yīng)鏈人士的話報(bào)道稱,英特爾面向中國(guó)市場(chǎng)推出的“特供版”AI 處理器Gaudi 2 訂單快速增長(zhǎng),使得英特爾向臺(tái)積電大舉追加訂單。

        自今年以來(lái),隨著以ChatGPT為代表的生成式AI的持續(xù)火爆,帶動(dòng)了對(duì)于AI加速芯片的需求的暴漲,其中英偉達(dá)(NVIDIA)A100及H100系列更是成為了搶手貨,特別是在臺(tái)積電 CoWos 先進(jìn)封裝產(chǎn)能不足的情況下,英偉達(dá)的A100及H100持續(xù)短缺,即便是面向中國(guó)市場(chǎng)特供的A800 與 H800也是供不應(yīng)求。

        同樣,目前AMD MI300 系列暫未大規(guī)模上市,主要也是受制于臺(tái)積電的產(chǎn)能。供應(yīng)鏈人士還透露,Meta、微軟、谷歌、AWS 北美四大云服務(wù)商(CSP)相當(dāng)期待的 AMD MI300 系列也因?yàn)榕_(tái)積電產(chǎn)能問(wèn)題大受影響。

        在此背景之下,能夠在一定程度上替代英偉達(dá)AI加速卡的英特爾Gaudi 2自然也受到了市場(chǎng)的追捧。

        供應(yīng)鏈人士稱,Gaudi 2 訂單能見(jiàn)度已經(jīng)到了 2024 年年中,而下一代采用臺(tái)積電 5/4 nm制程的 Gaudi 3 也正在加速上市進(jìn)程,預(yù)計(jì) 2024 年面世。

        資料顯示,Gaudi 2是英特爾在2022年5月發(fā)布的新一代的高性能深度學(xué)習(xí)AI訓(xùn)練處理器,采用7nm制程工藝制造,擁有24個(gè)可編程Tensor處理器核心(TPCs),96GB HBM2e 內(nèi)存和 24 個(gè) 100GbE 端口。根據(jù)英特爾展示的性能對(duì)比數(shù)據(jù)來(lái)看,Habana Gaudi2在RestNet50 Training Throughput和BERT Tralning Throughput等視頻及自然語(yǔ)言處理的模型測(cè)試中,性能都達(dá)到了NVIDIA A100的2倍左右。

        image.png

        根據(jù)第三方機(jī)構(gòu)MLPerf于今年6月發(fā)布的MLCommons MLPerf 基準(zhǔn)測(cè)試數(shù)據(jù)顯示,Gaudi 2在GPT-3模型、計(jì)算機(jī)視覺(jué)模型ResNet-50(使用8個(gè)加速器)、Unet3D(使用8個(gè)加速器),以及自然語(yǔ)言處理模型BERT(使用8個(gè)和64個(gè)加速器)上均取得了優(yōu)異的訓(xùn)練結(jié)果。與市場(chǎng)上其他面向大規(guī)模生成式AI和大語(yǔ)言模型的產(chǎn)品相比,Gaudi2擁有卓越的性能與領(lǐng)先的性價(jià)比優(yōu)勢(shì)。比如,在計(jì)算機(jī)視覺(jué)(ResNet-50)和自然語(yǔ)言處理(BERT微調(diào))方面的表現(xiàn)優(yōu)于英偉達(dá)A100,在計(jì)算機(jī)視覺(jué)方面幾乎與H100不分伯仲。

        此外,Gaudi2可為大規(guī)模的多模態(tài)和語(yǔ)言模型提供出色的推理性能。在最近的Hugging Face評(píng)估中,其在大規(guī)模推理方面的表現(xiàn),包括在運(yùn)行Stable Diffusion2(另一個(gè)用于從文本生成圖像的最先進(jìn)生成式AI模型之一)、70億以及1760億參數(shù)BLOOMz3模型時(shí),在行業(yè)內(nèi)保持領(lǐng)先。

        2023年7月11日,英特爾在北京召開(kāi)發(fā)布會(huì),正式面向中國(guó)市場(chǎng)推出“定制版”的Gaudi 2芯片,可不受美國(guó)出口管制限制(應(yīng)該是將I/O速度限制到了600GB/s以下)。目前,這款芯片已獲得浪潮、新華三、超聚變等服務(wù)器巨頭采用。

        編輯:芯智訊-浪客劍


        *博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



        關(guān)鍵詞: 芯片

        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 南京市| 重庆市| 东兴市| 米泉市| 阳朔县| 五常市| 高密市| 洛浦县| 丰镇市| 巴塘县| 木里| 苗栗县| 岢岚县| 平遥县| 梅河口市| 都江堰市| 昭通市| 双峰县| 谷城县| 太湖县| 肇源县| 湘西| 苍梧县| 建始县| 河津市| 湟源县| 衡阳县| 南宫市| 佛山市| 海淀区| 贵港市| 太保市| 监利县| 望谟县| 鄂托克旗| 寿宁县| 仁寿县| 静宁县| 温泉县| 宜兰市| 遵化市|