無問芯穹打通七家國產芯片DeepSeek-R1適配優化,助力全國產化AI產業閉環構建
近日,無問芯穹宣布獲七家國產芯片鼎力支持,正打通DeepSeek-R1、V3在壁仞、海光、摩爾線程、沐曦、昇騰、燧原、天數智芯等七個硬件平臺的多芯片適配優化,現開發者已可以通過Infini-AI異構云平臺一鍵獲取DeepSeek系列模型與多元異構國產算力服務。
本文引用地址:http://www.104case.com/article/202502/466862.htm自春節前夕爆火,DeepSeek已牽動了國內超30家云服務商與近20家芯片企業宣布接入,到目前為止,這場熱鬧還只是一場由DeepSeek引發的流量蛋糕切分大戰。而隨著無問芯穹宣布獲7家國產芯片鼎力支持,并帶著多芯片適配的DeepSeek-R1入場,DeepSeek為可控國產算力撬動的歷史機遇,正在變得更加清晰。
加速助建“國產模型-國產系統-國產芯片”全國產AI產業閉環
國產的大部分模型是通過國際主流芯片(如英偉達)訓練得到,尚未與國內的AI系統、芯片形成閉環生態。無問芯穹聯合創始人、CEO夏立雪表示, DeepSeek的突破激發了越來越多的下游應用創造力,未來行業日均tokens消耗量將達到百萬億級別,不僅將激發國產芯片的市場需求,也為打造全國產AI產業閉環,實現更可控的自主算力發展創造了有力條件。
在美國,模型、系統、芯片已經形成閉環生態。以英偉達為例,其GPU的主流地位與CUDA生態有直接關系,CUDA的護城河是軟件堆棧,可以讓研究人員和軟件開發者更好地在GPU上編程和構建各種各樣的應用,牽引下一代芯片的迭代方向。但是隨著Transformer統一模型結構,大模型應用落地場景所需的算子數量大幅度收縮,CUDA護城河正在變薄。
“DeepSeek作為開源模型,其之于AI 2.0時代,正如Android之于移動互聯網革命,將重構整個產業生態,引發鏈式反應,加快上層應用發展和下層系統‘統一’增速,由此廣泛調動起跨越軟硬件和上下游的生態,一起加大投入‘模型-芯片-系統’協同優化和垂直打通,從而繼續‘打薄CUDA生態’。某種程度上來說,CUDA已經是歷史了”。夏立雪舉例,這類協同優化工作包括根據新一代模型架構來定義未來芯片的底層電路實現,以及根據國產AI系統的互聯通信方式來設計高效的混合專家模型結構等。
對此,無問芯穹提出了“三步走”模式來促進全國產AI產業閉環的打通——基于主流芯片開展極致軟硬件協同優化,以有限算力實現國產模型能力追趕;推動國產芯片開放底層生態,搭建“異構”AI系統解決算力缺口,實現模型能力趕超;構建國產“同構”系統,支持Scaling Law持續發展,打造“國產模型-國產芯片-國產系統”的全國產AI產業閉環,實現更可控的自主算力發展。
與此同時,針對國內 源分布不均衡,技術和應用場景不匹配,導致的大量異構算力未能全量利用問題,無問芯穹也將通過整合異構、異地、異屬算力資源,轉化為標準算力服務并規模化復制,并緊密跟蹤下游應用需求,提升算力配置效率。這不僅能解決部分地區存在的算力閑置問題,滿足日益增長的應用需求,還能在使用閉環中,促成硬件與算法正向循環。
夏立雪表示,通過打通DeepSeek-R1、V3在國產硬件平臺的多芯片適配優化,無問芯穹希望進一步團結從模型到芯片的上下游產業伙伴,在打造“國產模型+國產算力+國產系統+國產應用”全國產化AI產業鏈的進程中起到牽引帶動作用,集中優勢資源,支持模型性能長足進步,推動中國AI自主可控長遠發展,為人工智能行業發展筑牢算力基礎。
有力驗證軟硬協同優化是實現模型能力突破的必然路徑
在DeepSeek模型迄今發布的3個大版本中,盡管參數規模實現十倍增長,但所使用的訓練服務算力卻并沒有和模型尺寸等比例的成倍增加,其核心是利用軟硬件協同設計的思想,不斷提升系統開銷(即模型的訓練成本)到模型尺寸、能力的轉化率。DeepSeek有力驗證了在算力受限的條件下,軟硬協同優化路線的有效性,特別在國內算力受限場景下實現模型能力的突破,具有重要意義。
無問芯穹是軟硬協同的堅定踐行者,其核心技術團隊源自清華大學納米集成電路與系統實驗室能效計算組(NICS-EFC),該組最早在 2018 年總結出“深度學習算法-編譯-芯片聯合設計”路線,致力于人工智能場景下能效電路和系統設計方法的研究,是軟硬協同路線上的最早開拓者之一。
自成立以來,無問芯穹依托“多元異構、軟硬協同”的核心技術優勢,打造了連接“M種模型”和“N種芯片”的“M×N”AI基礎設施新范式,致力于在國內算力生態的市場格局相對分散,高端算力受限的情況下,實現不同模型和不同硬件之間的統一部署和聯合優化,像“淘寶”一樣把各種不同的模型和算力資源統一起來,變成一套標準化服務,提供給最終客戶,被譽為中國的“CoreWeave”。
就在近日,國際最權威的科技商業媒體之一《麻省理工科技評論》刊發了一篇題為《關注DeepSeek之外的四家中國人工智能初創公司》的報道,指出階躍星辰、面壁智能、智譜AI、無問芯穹四家企業同樣展現出不遜于DeepSeek的技術實力與全球競爭力。
有業內人士指出,結合這四家被點名企業的特征分析來看,DeepSeek可能正在讓國際意識到,除了DeepSeek之外,中國還存在若干路徑獨特的團隊,在用“力大磚飛”堆疊GPU算力儲備、比拼模型精度的巨頭競賽之外,找到未被五角大樓戰略家們關注到的“blind spot( 盲點) ”,跨越軟硬件,攢動上下游,走出可能出奇制勝的技術路徑。
評論