博客專欄

        EEPW首頁 > 博客 > 從軟硬件到生態加速AI PC革命,英偉達憑實力證明RTX就是AI

        從軟硬件到生態加速AI PC革命,英偉達憑實力證明RTX就是AI

        發布人:芯東西 時間:2023-12-17 來源:工程師 發布文章


        一個插件讓顯卡速度翻3倍?解密英偉達AIGC時代的最新王牌。作者 |  云鵬
        編輯 |  漠影
        最近的AIGC圈著實迎來了一波新品發布小高潮!先是谷歌Gemini突然深夜炸場,硬剛OpenAI的GPT-4,然后是斯坦福科學家李飛飛團隊亮出AI視頻生成模型W.A.L.T,拳打Pika腳踢Gen-2,最近微軟又發布了手機端側都能跑的小語言模型Phi-2,平均性能甚至超過Llama 2。

        ▲W.A.L.T文生視頻案例片段

        AI大模型火爆之下,各路科技巨頭幾乎都在“All in AI”,而AI軍備競賽已經很快從云端卷到了端側,從智能手機到PC,我們身邊各類熟悉的智能硬件都已被卷入這場大模型浪潮。各類智能助手、各類AIGC相關應用如雨后春筍般涌現,各類“GPTs”已經逐漸進入大眾視野。熱況之下,AI大模型在端側的落地離不開底層硬件的支持,英偉達、英特爾、AMD等大廠也不斷亮出各種應對AI新時代的軟硬件新品,加速著AI PC時代的到來。PC作為算力最強的消費級產品,成為AI大模型在端側應用的最理想平臺之一。毫無疑問,AI將成為PC產業發展的一個關鍵拐點,AI也會徹底改變玩家、創作者、上班族、學生乃至每一個普通PC用戶的體驗。

        ▲圖片由Bing創作,來源:PCWorld

        目前全球搭載英偉達RTX GPU的Windows PC和工作站已經超過了1億臺,英偉達作為AI大模型時代最核心的全棧玩家,正通過全棧生態的賦能讓這些“RTX PC”的AI性能有翻倍式暴漲。在我們熟悉的文生圖應用Stable Diffusion中,基于英偉達的RTX專用加速插件,一張RTX 4090僅用49秒就可以生成100張高質量圖像,速度翻了3倍,而這樣的升級甚至不需要改變其他硬件配置。英偉達RTX相關技術在AI領域的應用,讓全球無數開發者可以更輕松、高效地創建AI應用,人們使用PC的方式,也在潛移默化中改變著。英偉達如何為AI PC時代的底層筑基?英偉達在AIGC時代藏得最深的王牌又是什么?今天,從硬件、軟件到生態,英偉達似乎已經和AI畫上了等號。
        01.從通用計算到加速計算,從數據中心到PC,英偉達CUDA生態占C位


        今天的計算產業究竟醞釀著哪些關鍵變量,英偉達又在其中扮演著怎樣的角色?正如英偉達CEO黃仁勛在財報電話會中提到的,放眼如今的全球計算產業,有兩個重要的轉變值得注意:第一,用一種通用處理器處理一切工作的傳統通用計算已經不再具有成本和效率的優勢,與之相對的“加速計算”將成為主流。顧名思義,數據中心需要盡可能地去“加速”所有工作負載,這樣才能有更高的性能、能源效率和成本效益。第二,在加速計算的大趨勢下,新的軟件開發方式成為了可能,這也推動了軟件平臺的轉變,讓以前無法實現的應用程序成為可能。或許正如黃仁勛所說,AI并不是一種奢侈品,AI是必需品,AI的投資是一種戰略性的迫切需求,可以幫企業提高未來的競爭力。在這場“不能輸”的AI之戰中,英偉達的GPU儼然已經走到了舞臺中央,已經走到了全球“AI新工業”的中央。在黃仁勛看來,如今的數據中心就像一座“AI工廠”,數據是原材料,被生產、開發、精煉,轉化為世界上最有價值的東西——智能。顯然,這對于所有科技巨頭來說,都是一場技術乃至商業范式的革新。

        在這樣的大背景下,各行各業都在經歷從通用計算到加速計算和生成式AI的平臺化轉型,而英偉達最新一季財報中數據中心業務接近280%的強勁同比增長也恰恰證明了這一點。AI大模型的初創公司、消費互聯網公司和全球云巨頭們都在積極“備戰”,各大云服務商不斷加大對AI云的投入,企業級軟件公司也陸續為自己的平臺增加AI相關應用和功能,不少廠商都推出了定制化AI產品,推動著各大行業的智能化、自動化發展。熱潮之下,英偉達的GPU、CPU、網絡、AI foundry、AI企業軟件解決方案等產品和服務都成為加速這一轉型的核心“引擎”。

        上述各行各業的智能化、自動化與計算產業密不可分,在計算產業中,除了數據中心在經歷“加速計算”的轉型,PC產業作為計算的關鍵一環,也同樣經歷著類似的轉變。當下,各類生成式AI產品正迅速成為高性能PC的支柱型應用,在各行各業從業者的日常工作中發揮著重要作用。而英偉達的RTX GPU,無疑已成為AI PC時代最核心的底層技術支撐。為什么英偉達的GPU能夠在AI時代走到如此關鍵的位置,并且幾乎是“不可替代”的?實際上,提到英偉達的GPU,就不得不提到CUDA。在黃仁勛看來,英偉達是通過發明CUDA這種新編程工具,以及GPU這種處理器來推動加速計算的。CPU無法高效執行的工作,GPU可以進行有效的加速,并且在性能、能源成本上有著顯著優勢。基于CUDA的GPU經歷近25年的發展,如今已經與開發者、系統制造商、云服務提供商、技術制造商和用戶深度綁定,CUDA生態系統已經為各行各業所信任,這也是英偉達有著不可替代性的根本性因素之一。

        在深度學習、AI大模型的發展中,英偉達所提出的加速計算發揮著關鍵作用,生成式AI的崛起與其密不可分,這也被很多人稱之為“第四次工業革命”。在黃仁勛看來,智能是最有價值的,倘若智能可以批量化、自動化的生產,其帶來的價值是不可估量的。如今英偉達所做的,正是推動這一未來走入現實。
        02.兼容性架構鋪路,TensorRT-LLM讓推理性能翻倍,AI繪圖進入“秒速時代”


        正如前文所說,英偉達在技術生態方面的布局,尤其是25年來在CUDA領域的深耕,是其能夠在AI時代占據C位的關鍵。而這樣的生態布局如今在PC產業中釋放的能量開始愈發凸顯。今年四季度,英偉達發布了一個名為TensorRT-LLM的引擎優化編譯器,其目的就是進一步提升大語言模型的AI推理性能。

        AI大模型在云端的訓練需要消耗大量算力,而AI大模型真正走入每個人的生活,更需要解決推理這“最后一公里”的難題,因為實際場景中的推理任務往往是極為復雜的。根據官方數據,在TensorRT-LLM的加持下,對于Lambda2這樣的大語言模型,H200的推理能力可以提高到H100的2倍,成本也有著稱成倍降低,與H100相比,H200在GPT-3模型上的推理性能有著18倍的提升,得益于此,英偉達的客戶可以使用更大的模型,但延遲卻不會增加。

        ▲TensorRT-LLM v0.6.0可以帶來最高5倍推理性能提升

        實際上,TensorRT-LLM有著這樣的表現,與CUDA的特性是密不可分的。英偉達CFO在財報電話會中特別提到,他們之所以能夠創建TensorRT-LLM,正是因為CUDA是可編程的,如果CUDA和其對應的GPU不是可編程的,以如今這樣快的速度迭代改進軟件棧是很難實現的。經過20多年的深耕,每一個英偉達GPU的背后,都是不斷迭代更新的軟件棧在做堅實支撐,而CUDA的靈活性和兼容性無一不是這一生態的突出優勢。英偉達有著規模龐大的生態系統軟件開發人員、系統制造商生態系統和分銷合作網絡,而將這些真正連結在一起形成一個高效生態系統的,正是英偉達CUDA軟件生態和架構層面的兼容性。

        英偉達CFO稱,一切基于兼容性構筑是他們幾十年前就做出的一個偉大決定,保證架構的兼容性也一直是他們的首要任務。每當英偉達引入一個新的特性、新功能、新技術時,生態中的開發者們會立即從各個方面獲益,享受到這些紅利。目前英偉達在全球有28000名員工,他們服務于全球各地、各個行業、不同的市場和公司,但依然可以保持高效協作,這與良好的兼容性密不可分。這樣的兼容性進一步帶來的就是英偉達平臺的穩定性,這也是全球各類新應用幾乎都選擇率先在英偉達平臺上進行開發并進行優化的關鍵原因之一。云計算領域的數據中心中有著數百萬英偉達GPU,而全球PC和工作站用戶手中又有著1億多塊英偉達GPU,他們在架構上都是兼容的,因此所有基于英偉達平臺實現的技術創新,都可以快速應用到這些數以百萬計、數以億計的產品中。這也可以說是英偉達人無我有的核心優勢之一。最后,在加速計算方面,英偉達GPU可以為Spark、Python甚至是目前最成功的數據科學框架Pandas進行加速,據了解,Pandas現在由英偉達的CUDA加速,并且無需代碼行就能用起來。在企業和專業領域之外,對于普通用戶來說,英偉達GPU帶來的加速能力也是感知極強的。就在今年四季度,英偉達在發布TensorRT-LLM的同時也帶來了TensorRT-LLM for Windows,與此同時,微軟也在Ignite大會上發布了OpenAI Chat API的 TensorRT-LLM封裝接口、RTX驅動的性能改進DirectML for Llama 2等新工具和資源。

        可以說,Windows PC的終端用戶們也可以享受到TensorRT-LLM帶來的加速紅利了。根據官方數據,TensorRT-LLM?for Windows可以將終端設備上的大語言模型推理性能最高提升4倍左右,而目前英偉達RTX GPU的裝機量已經超過了1億臺,這一新特性也已經快速全面普及開來,這對于應用程序開發者們來說無疑是一大喜訊。TensorRT-LLM for Windows的推出無疑意味著AI大模型可以更好的應用于端側RTX PC中,滿足用戶各類AIGC需求,提升用戶的AI PC體驗。數以百計的AI相關開發者項目和應用都可以直接在搭載RTX GPU的PC上本地運行,同時,用戶的私人和專有數據也可以在PC本地進行保存。值得一提的時,TensorRT-LLM也在持續更新,支持更多新的熱門大模型,比如Mistral 7B 和 Nemotron-3 8B,這些版本的TensorRT-LLM可以直接運行在8GB 及以上顯存的GeForce RTX 30系列和40系列GPU上。

        ▲TensorRT擴展的配置需求,由Bilibili UP主Nenly同學制作

        根據Bilibili平臺上一位專業設計師UP主Nenly同學的測試,在Tensor RT的加持下,Stable Diffusion這一熱門文生圖應用基于RTX GPU生成的模型推理速度直接提升了2倍甚至3倍以上,AI繪畫進入了“秒速時代”。

        ▲標準StableDiffusion與TensorRT引擎優化后相比,每分鐘繪制圖片數的差異,由Bilibili UP主Nenly同學制作

        根據Nenly同學發布視頻,在GeForce RTX 4090上,Stable Diffusion的運行速度是使用蘋果M2 Ultra的Mac頂配版的7倍。甚至4060Ti在TensorRT擴展的支持下,生成圖片的速度已經超過了加速前的4090。對于一些需要大量出具草圖的創意工作者們來說,這樣的加速能力所帶來的收益是極為明顯的。面對數千張圖片吞吐量的工作,節省下來的時間可能是以天計算的。比如被譽為“插畫領域的劉慈欣”、“國內科幻繪畫第一人”,也是首位獲得全球雨果獎的華人藝術家趙恩哲,在工作中就使用了全流程經GeForce RTX GPU加速的Stable Diffusion進行創作,AI輔助創作工具可以省掉細化時間,同時給他很多意向不到的創作設計可能。

        ▲《虛空之舟》——使用SD創作,全流程經GeForce RTX GPU加速

        趙恩哲特別說道,其實每位創作者都渴望將腦海中的世界完美呈現,但由于技術門檻和工業化流程等方面的限制,他們過去只能在概念設計與最終呈現之間做出妥協。但如今,借助英偉達GeForce RTX顯卡的強大算力以及SD、RUNWAY等AI創意工具,概念設計師可以突破限制,在短短幾秒內嘗試所有想法,相信今后有了更強大的算力加持,每位藝術家都可以實現無限創造!

        ▲趙恩哲

        當然,基于RTX GPU這些能力,相關公司也可以基于自己的模型構建具有最有效果的加速引擎,讓算力的效益最大化,從而實現顯著的降本增效。可以說,從企業到個人,從數據中心到PC,基于數十年建立的堅實生態,英偉達正通過技術創新拉近每一個人與AI大模型的距離。
        03.DLSS用AI改寫游戲產業,英偉達為開發者武裝到牙齒,RTX就是AI


        今天,我們看到了Tensor RT對于PC端側運行AI大模型能力帶來的顛覆式升級,而在此之外,英偉達RTX GPU已經深耕AI領域多年,如今提到AI,幾乎就等于提到英偉達。用英偉達CFO的話來說,“RTX就是AI”。在游戲領域,這一特點體現的尤為明顯。這其中最具代表性的就是DLSS技術,這也是英偉達最早推出的AI模型之一,從五年前的首次亮相至今,DLSS技術經歷了多個大版本迭代,AI技術的融入也愈發深入,目前已經包含超分辨率、幀生成和光線重建三個不同的模型。據了解,從發布之初,DLSS技術就一直離不開背后AI模型的持續學習,AI模型學習的結果不斷反饋迭代,推動DLSS技術完善,進而提高DLSS技術在游戲中帶來的性能和畫質提升。今年英偉達推出了DLSS 3.5,其對于游戲圖形渲染技術發展的推動是極為明顯的,基于新的AI模型光線重建,DLSS 3.5可以創建出更高質量的光線追蹤畫面,同時還能進一步提升游戲的幀率表現,可以說是一舉兩得。

        這一技術也在游戲玩家中收到了廣泛好評。根據官方數據,目前支持RTX特性的游戲和應用已經超過了500個,這一生態系統的發展壯大,可以說為玩家們帶來了真正體驗上的直觀提升。

        除了游戲,在生產力創作領域,根據官方數據,目前英偉達的RTX GPU加速了110多個創作類應用,尤其在生成式AI相關應用領域,RTX GPU的應用更為廣泛。如今,AI PC時代的大門已經被推開了,各路廠商都在積極找準自己的定位,進行產品和技術的布局,而在這場時代大潮中,開發者們的作用至關重要,在RTX加持下,開發者現在可以直接利用前沿AI大模型,通過跨供應商API來部署自己的應用。英偉達一直在做的,其實就是增強開發者的能力,在AI新時代為開發者們武裝到牙齒。英偉達提供的新優化、新模型和資源無疑會加速AI功能和應用在全球 1億多臺RTX PC上的開發和部署,AI與PC的融合,會變得越來越簡單。
        04.結語:AIGC時代要想玩轉AI,英偉達是徹底繞不開了


        在AIGC風起云涌的當下,無數創企涌入賽道,消費者們也爭相接觸新的技術、感受生成式AI帶來的體驗革新,而英偉達無疑成為了風口浪尖上的一顆明星企業,從硬件、軟件到生態,英偉達的王牌一張接著一張。AI技術的發展,引起了整個計算產業范式的革新,加速計算概念的落地普及,牽動著全球各行各業的企業。從數據中心到我們每個人家中的PC,英偉達的技術正深入每一處,在AI技術落地的過程中,發揮著關鍵作用。如今回顧科技產業發展的歷史,我們能清楚地看到,那些最成功的公司,無一不是憑借生態取勝,從自身的產品技術生態到與產業鏈各領域玩家聯合形成的牢固生態,生態必然會成為當今科技巨頭們比拼的核心焦點。不論如何,在當下的AIGC時代,想要乘風而行,走在浪尖,英偉達這艘大船,是必須要上了。

        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: 生態加速AI

        技術專區

        關閉
        主站蜘蛛池模板: 曲麻莱县| 安国市| 玉屏| 新宁县| 闵行区| 正宁县| 如皋市| 永登县| 徐州市| 梅河口市| 南充市| 瑞丽市| 尚义县| 嵊州市| 上虞市| 宿州市| 远安县| 闽侯县| 珲春市| 曲沃县| 台东市| 垫江县| 新蔡县| 汾阳市| 禄丰县| 恩施市| 红桥区| 邵阳县| 兴隆县| 湘潭县| 临夏县| 高青县| 托里县| 获嘉县| 安塞县| 大宁县| 泰和县| 延津县| 榕江县| 和硕县| 鄂尔多斯市|