新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 英偉達(dá)推出開(kāi)源推理軟件Dynamo 為AI工廠(chǎng)降本增效

英偉達(dá)推出開(kāi)源推理軟件Dynamo 為AI工廠(chǎng)降本增效

作者：時(shí)間：2025-03-19 來(lái)源：網(wǎng)易科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

3月19日消息，英偉達(dá)在2025GTC大會(huì)上推出了開(kāi)源推理軟件 NVIDIA Dynamo，旨在以高效率、低成本加速并擴(kuò)展 AI 工廠(chǎng)中的 AI 推理模型。

本文引用地址：http://www.104case.com/article/202503/468317.htm

據(jù)介紹，NVIDIA Dynamo 是一款全新的 AI 推理服務(wù)軟件，旨在為部署推理 AI 模型的 AI 工廠(chǎng)最大化其 token 收益。它協(xié)調(diào)并加速數(shù)千個(gè) GPU 之間的推理通信，并使用分離服務(wù)將大語(yǔ)言模型 (LLM) 的處理階段和生成階段在不同 GPU 上分離開(kāi)來(lái)。這使得每個(gè)階段的特定需求可以進(jìn)行單獨(dú)優(yōu)化，并確保更大程度地利用 GPU 資源。

“全世界各行業(yè)都在訓(xùn)練 AI 模型以不同的方式進(jìn)行思考和學(xué)習(xí)，從而使模型復(fù)雜度持續(xù)升級(jí)。”NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示，“為了實(shí)現(xiàn)自定義推理 AI 的未來(lái)，NVIDIA Dynamo 可以在這些模型上進(jìn)行規(guī)模化部署，從而為 AI 工廠(chǎng)實(shí)現(xiàn)降本增效”。

在 GPU 數(shù)量相同的情況下，Dynamo 可將 NVIDIA Hopper? 平臺(tái)上運(yùn)行 Llama 模型的 AI 工廠(chǎng)性能和收益翻倍。在由 GB200 NVL72機(jī)架組成的大型集群上運(yùn)行 DeepSeek-R1模型時(shí)，NVIDIA Dynamo 的智能推理優(yōu)化也可將每個(gè) GPU 生成的 token 數(shù)量提高30倍以上。

NVIDIA Dynamo 完全開(kāi)源并支持 PyTorch、SGLang、NVIDIA TensorRT?-LLM 和 vLLM，使企業(yè)、初創(chuàng)公司和研究人員能夠開(kāi)發(fā)和優(yōu)化在分離推理時(shí)部署 AI 模型的方法。

這將使用戶(hù)加速采用 AI 推理，包括亞馬遜云科技、Cohere、CoreWeave、戴爾科技、Fireworks、谷歌云、Lambda、Meta、微軟 Azure、Nebius、NetApp、OCI、Perplexity、Together AI 和 VAST。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 英偉達(dá) 開(kāi)源 推理軟件 Dynamo AI工廠(chǎng) NVIDIA Dynamo GTC

新聞中心

英偉達(dá)推出開(kāi)源推理軟件Dynamo 為AI工廠(chǎng)降本增效

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)