新聞中心

        EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 英偉達推出 Tensor RT-LLM,使大語言模型在搭載 RTX 的 PC 平臺上運行速度提高 4 倍

        英偉達推出 Tensor RT-LLM,使大語言模型在搭載 RTX 的 PC 平臺上運行速度提高 4 倍

        作者: 時間:2023-10-18 來源:IT之家 收藏

        IT之家 10 月 18 日消息,是硬件領域的生成型之王,該公司的 為微軟、OpenAI 等公司的數(shù)據(jù)中心提供動力,運行著 Bing Chat、ChatGPT 等服務。今天,宣布了一款新的軟件工具,旨在提升大型語言模型(LLM)在本地 Windows PC 上的性能。

        本文引用地址:http://www.104case.com/article/202310/451713.htm

        在一篇博客文章中,宣布了其 TensorRT-LLM 開源庫,這個庫之前是為數(shù)據(jù)中心發(fā)布的,現(xiàn)在也可以用于 Windows PC。最大的特點是,如果 Windows PC 配備英偉達 GeForce RTX ,TensorRT-LLM 可以讓 LLM 在 Windows PC 上的運行速度提高四倍。

        英偉達在文章中介紹了 TensorRT-LLM 對開發(fā)者和終端用戶的好處:

        在更大的批量大小下,這種加速可顯著改善更復雜的 LLM 使用體驗,如寫作和編碼助手,可同時輸出多個唯一的自動完成結(jié)果,從而加速性能并改進質(zhì)量,讓用戶可以有最好的選擇。

        IT之家注意到,博客文章展示了一個 TensorRT-LLM 的例子。當向 LLaMa 2 基礎模型提出“《心靈殺手 2》集成了 NVIDIA 的哪些技術?”這一問題時,它給出“游戲尚未公布”這一毫無幫助的回答。相反,使用 RAG 將 GeForce 新聞添加到向量庫中,并連接到相同的 Llama2 模型,不僅得到正確答案 ——NVIDIA DLSS 3.5、NVIDIA Reflex 和全景光線追蹤,而且在 TensorRT-LLM 加速的助力下響應速度更快。這種速度與能力的結(jié)合為用戶提供更智能的解決方案。

        TensorRT-LLM 很快就會在英偉達的開發(fā)者網(wǎng)站上提供。

        英偉達今天還在新的 GeForce 驅(qū)動更新中增加了一些基于的功能。其中包括新的 1.5 版本的 RTX Video Super Resolution 功能,可以在觀看在線視頻時提供更好的分辨率提升效果和更少的壓縮效果。英偉達還為 Stable Diffusion Web UI 增加了 TensorRT 人工智能加速功能,讓擁有 GeForce RTX 的用戶可以比正常情況下更快地從人工智能圖片生成器那里獲得圖像。




        關鍵詞: 英偉達 GPU 人工智能

        評論


        相關推薦

        技術專區(qū)

        關閉
        主站蜘蛛池模板: 昭通市| 新平| 新宁县| 井陉县| 嘉义市| 内黄县| 专栏| 舞阳县| 双桥区| 苏尼特右旗| 逊克县| 玛沁县| 密云县| 莒南县| 鱼台县| 宜良县| 黎平县| 正阳县| 南通市| 阜宁县| 永年县| 垣曲县| 通化县| 深泽县| 新化县| 滦平县| 阿坝县| 繁昌县| 新疆| 常山县| 桃园市| 巢湖市| 千阳县| 上高县| 萨迦县| 大厂| 包头市| 铁力市| 道孚县| 那坡县| 环江|