英偉達:要取代我?其實CUDA也支持RISC-V
第五屆RISC-V中國峰會于2025年7月16至19日在上海張江科學會堂隆重舉辦,在峰會的圓桌討論中,主持人曾經提出這樣一個問題:你認為RISC-V未來會取代GPU嗎?在現場觀眾投票中,支持會取代的現場觀眾占據將近半數。不過在隨后的主題演講中,英偉達副總裁 Frans Sijstermanns特別提到了英偉達在自家的計算平臺實現了RISC-V應用處理器部署。
在做這次演講準備的時候,Frans Sijstermanns會議自己參加過的由上海交通大學和英偉達聯合舉辦的“2017年RISC-V工作坊”,當時是北美地區以外第一個RISC-V的工作間。英偉達作為目前高性能計算架構的領導者,CUDA是英偉達成功的關鍵之一, CUDA是C語言和C++語言的拓展,現在CUDA只在x86和Arm上得以部署,還沒有在RISC-V上面部署,但是Frans Sijstermanns表示,英偉達也正在向外界傳達一個信息——我們要將CUDA也移植到RISC-V的架構上。
CUDA包含兩個組成部分:一是Toolkit(工具箱),二是驅動器。CUDA的Toolkit像是一個編譯器一樣,它有非常好的編譯功能。將CUDA移植到RISC-V,這個部分我們現在是正在做這樣的一個移植工作。比如一個完整的應用運行,有應用軟件、還有第三方的軟件、還有OS系統。OS系統就是一個很好的例子,在這個圖表當中就是用的PyTorch作為例子,還有CUDA KMD、還有CUDA UMD。英偉達現在正在做綠色部分的移植,此外還有第三方的軟件或者是應用軟件,當然也是需要進行移植到RISC-V。
CUDA庫也是非常重要的,在所有的行業中可能都需要有自己的一個庫。比如說英偉達有一個FT的庫能夠加速推理,與此同時我們還有相關的數據分析庫等等。還有加速芯片制造的庫,甚至還有相關的一些不同行業和垂類的這些庫。英偉達在這一行業已經深耕了20年之久,建立了900多個不同的庫。通過加速不同的行業技術發展日新月異這就是我們的目標,有了RISC-V之后我們就能落地所有的這些庫,與此同時能夠讓大家更快的創新方式進行相關的設計及技術迭代。
我們現在面臨的各種各樣的挑戰有哪些?RISC-V在過去幾年中實際上是實現了非常長足的進展,比如說2022年大家已經用了非常多的RISC-V,在2025年至少有10個新的規格已經自2022年開始得到了獲批,很重要的一點無疑就是RVA23,同時服務器SoC也獲批了,這就是英偉達的進展過程。在軟件層其實英偉達也取得了非常多的進展,如果看一看RISC-V國際基金會官網會看到其中有75個不同的軟件包,其實它們都已經在RISC-V上面進行“運行”了。像Linux這樣的一些操作程序這是非常重要的,甚至于一些工具鏈其實都已經推出。所有的這些還包括數據庫網絡虛擬機等等,他們所有的這些其實都完成了,但是無論怎么樣我們在這方面可能還需要進一步的改善和微調,只有這樣英偉達才能夠更好的把所有的這樣一些軟件包給推出來,甚至有必要會進行相關的補丁。的確英偉達在這方面取得了長足的進展,為此Frans Sijstermanns也想感謝整個RISC-V組織及生態合作伙伴,其實他們真的是做了一些非常重要的基礎性工作。比如說像一些編譯器的工作、模擬的工作、工具鏈的工作,只有他們的工作做到位了我們才能夠進一步的發展。
現在英偉達遇到的問題是什么呢?就是它的可用性,或者說整個CPU的板卡使用,對于CUDA版可能要進行相關的開發,不僅要有CPU、還要有相關的GPU。比如用到阿里巴巴C920,其實對于英偉達而言在開發層面已經很好了,現在還沒有對標RVA23或者是剛剛獲批的SoC,在這一方面英偉達可能會需要統一的虛擬內存,這是非常重要的。只有這樣才能夠進一步的去分享CPU和GPU內存之間的這樣一些數據,甚至在這兩者之間進行數據的復制和粘貼,并且保證一致性,英偉達需要保證通過所有的抓手整體的用戶體驗是非常好的。還有我們這樣的一個虛擬監管器同樣也會需要我們進一步去進行改善,無論怎么樣通過不斷的改善我們的板卡、我們能夠最終去落地這樣一些RVA23相關的一些技術的細節和規格。
現在英偉達要做的是什么呢?就是現在和整個生態系統中的合作伙伴精誠合作,希望能夠把CUDA進行進一步的改善。當然了,與此同時我們也會希望把這樣一個標準文本的CUDA版本推出來同樣兼容RISC-V,只有這樣才能夠更好的符合服務器的平臺規范及Linux操作系統的RISC-V標準。英偉達會希望整個CPU去進行相關的開發,把所有的這些問題在整個系統中移除解決之后再進行發布。當然了,我也會希望和大家共同合作,也倡導大家去傾力協作。
還有一點就是NVLink Fusion。這是完全基于英偉達組件的,并且有CPU、還有相關的GPU,因此CPU、GPU都提在這里了。與此同時,英偉達還有非常多的組件及網絡,以及轉接的開關處理器,甚至還有相關的軟件集成在其中,因此是一個非常完整的設計了。英偉達正在做一種整合即希望能夠用加速器去取代GPU或者是用相關的RISC-V去替代CPU。比如大家看一看如果有一個好的CPU的話,英偉達會需要有一個比較整合式的架構能夠讓整個數據中心能夠更好的去工作、更加快速的工作。
Frans Sijstermanns總結英偉達對RISC-V的兼容進程:整個英偉達業務聚焦于加速計算,其實不在乎CPU具體是什么,無論是x86、Arm或者是RISC-V,英偉達都能夠兼容這些。但是英偉達理解的一點,就是要讓人們和用戶開發者有自己的選擇。CUDA能夠很好的幫助英偉達去跟RISC-V服務器借助英偉達通信處理器實現加速,并且更好的提出相關的全套硬件解決方案,當然在這方面有非常多的工作要做。
評論