國產CPU里程碑!龍芯最強處理器、自研GPGPU來了,披露Tock“三劍客”
編輯 | Panken芯東西11月28日報道,今日,國產CPU企業龍芯中科自主研發的新一代CPU 3A6000發布,這也是我國國產CPU領域的最新里程碑成果。龍芯3A6000采用龍芯自主指令系統龍架構(LoongArch),是龍芯第四代64位高性能微架構LA664的首款產品,且主要IP核均自主研發,采用成熟工藝生產,主頻達到2.5GHz,支持多線程技術,全芯片共8個邏輯內核。
在第三季度業績說明會上,胡偉武還提到:“我們正在努力提高每GHz性能接近或達到蘋果CPU的水平。”他還透露,“3B6000將爭取每GHz的性能再提高20%-30%,在此基礎上用先進工藝提高主頻。”
▲龍芯中科技術股份有限公司董事長胡偉武
同時,龍芯中科推出了打印機主控芯片龍芯2P0500,這是國內首款基于自主指令系統的打印機主控芯片。
01.將自主化優勢轉化成技術優勢性能追上十代酷睿四核處理器
當下全球的信息產業構建在西方主導的x86體系之上。胡偉武談道,2021年我國硅上工業企業利潤率為6.8%,其中電子工業利潤率為5.9%。2021年我國電子工業的利潤總額為8283億元,蘋果一個公司就達到946億美元。
胡偉武談道,CPU和操作系統是信息產業的底座,但還有更底層的根技術被卡脖子,比如指令系統、芯片生產工藝和設備材料等。因此,龍芯中科要構建獨立于x86和Arm的第三套新型信息技術體系和產業生態,其自研的指令集架構龍架構就是第三套體系的基礎。
龍芯中科有三大系列CPU產品,龍芯3號CPU系列是面向桌面、服務器應用,龍芯2號SOC系列,面向工控和終端應用,龍芯1號面向的是嵌入式專門應用。
胡偉武稱,龍芯的主要IP核均自主研發,目前龍芯的軟硬IP核數量已經有上百種。下圖中,龍芯3A6000結構圖中4個方塊就是4個核,標紅的就是3A6000用到的IP。其中,PCIe的IP為自主研發,可以做得很小并且成本更低,這也是自己做IP的好處。
3A6000有4個物理核和8個邏輯核,主頻2.0GHz到2.5GHz,還有片內集成安全可信模塊,支持安全啟動和國密算法。
首先,3A6000采用龍芯第四代64位高性能微架構LA664,這一架構有兩個特點,首先是大幅提升性能,其次是實現了同時多線程技術。胡偉武透露,龍芯的芯片是一個套殼加Tock+Tick,基于第二代GS464E,3A3000性能提升1.6倍。
龍芯3號系列芯片按照Tick-Tock路線發展,Tick指的是工藝節點的增強,Tock指的是微體系結構的增強。
第三代架構是GS464V、LA464,與3A3000相比,3A4000工藝沒變,通過結構優化性能提高了兩倍,3A5000采用更先進工藝性能提升了1.5倍。
3A6000采用的是第四代架構,使得CPU在相同工藝下性能比上一代產品大幅提高。根據電子四院的報告,3A6000單線程通用處理性能提升60%,多進程通用處理性能提升100%。
定點單線程的性能分數是43分,CPU 2017的單線程性能是5分。
3A6000的性能達到十代酷睿四核處理器水平,2.5GHz的龍芯3A6000和3.6GHz的酷睿i3比較數據如下:
胡偉武稱,龍芯中科走出了一條基于成熟工藝,通過設計優化提高性能的道路,標志著在弱一點的工藝條件下,與英特爾、AMD等的產品性能可比。下一步龍芯中科將繼續基于成熟制程研發,達到英特爾先進工藝的性能。
2013年,胡偉武就在反思,中國CPU和國外先進水平的主要性能差距在什么地方?是通用處理能力不行、還是專業處理能力不行?是單核性能不足還是核數不夠?是設計能力不行還是工藝不行?
他認為,剛剛提到的43分,就相當于3A6000“研究生畢業”。并且當時龍芯3A1000主頻差距在2-3倍,每GHz性能差距為4-6倍。
目前,龍芯中科已經完成了通用處理性能技術補課,十代酷睿是2020年的產品,胡偉武稱,現在很多人電腦上還用的是八代、九代酷睿,今年龍芯中科推出的3A6000已經達到市場主流水準。
龍芯中科已經完成龍芯3C6000設計,龍芯3C6000采用單硅片16核32線程,通用處理性能成倍提升,內存采用DDR4-3200x4,訪存帶寬比上一代3C5000成倍提高。
胡偉武認為,龍架構指令系統是龍芯的一個貢獻,片間互聯就是龍芯的第二個貢獻,未來,龍芯中科都會開放。
龍芯中科突破片間高速互聯技術,對標的是nVLink、CXL,這也是破解Chiplet技術的關鍵。片間互聯可以大幅降低延遲提高帶寬效率。
在GPGPU方面,龍芯第二代自研圖形處理器LG200有圖形加速、科學計算加速、AI加速三個功能,右邊是GPGPU的結構圖。
02.自主化優勢轉化為軟件生態優勢三大階段完成生態建設
指令系統是軟件生態的基礎,2020年,龍芯中科推出龍芯指令系統結構LoongArch,簡稱龍架構或LA架構,完成了自主知識產權評估。
胡偉武透露,構建龍架構軟件生態分三個階段。
首先是夯實基礎,龍芯中科的架構已經得到國際開源軟件認可,開發者可以完全基于龍架構的國際開源軟件直接構建出完整的操作系統。其次,該框架得到了國內操作系統和基礎應用的認可和支持,目前支持統信、麒麟、歐拉、龍蜥、開源鴻蒙等操作系統,支持WPS、微信、QQ、釘釘、騰訊會議、美團等應用。
第二要克服Linux生態碎片化的特點,實現不同分支及版本的應用兼容。龍芯平臺支持不同版本不同分支,如麒麟的應用在統信上可以跑,統信的應用在麒麟生態上也可以跑。
龍芯中科已經升級完成,目前正在做廣泛兼容,在龍架構上運行x86、Windows應用,但不能運行Windows,還有運行安卓應用。
第三是自主應用。胡偉武稱,龍芯中科要推出自主編程框架,就像安卓、iOS等一樣有自己的應用平臺。
在廣泛兼容方面,通過二進制方案運行x86應用,龍芯中科要架起兩座橋,一個是把x86的指令翻譯成龍架構指令,一個是把Windows接口翻譯成Linux接口。
龍架構的一大優勢就是可以自由加指令,將不侵權的功能類似的指令加進去,翻譯時就相當于英文翻中文。
打印機驅動是Linux的一大難題,多數打印機只有Windows驅動,沒有Linux驅動。現在龍芯架構可以支持95%以上的打印機。
通過二進制翻譯運行x86應用,龍芯生態可以運行絕大多數x86和Linux應用,用戶體驗流暢,對于x86/Windows應用可以大量運行。龍芯下一代處理器將完善對二進制翻譯的支持,如x87的80位浮點指令。
03.構建獨立于x86和Arm之外的生態體系
3A6000性能達到市場主流產品水平,龍芯架構的基礎軟件生態基本建成,龍芯中科要構建獨立于x86和Arm體系的自主信息技術體系。
為了加強生態體系建設,龍芯中科要與合作伙伴共建。首先解決做龍架構芯片企業少的問題,龍芯中科將CPU IP核開放授權,且不收版稅。未來,龍架構指令系統也會開放授權。
04.結語:自研CPU任重道遠
以通用CPU、GPU為代表的計算芯片是算力的基石,是計算系統和信息基礎設施的核心,當下核心技術受制于人是我國產業發展最大的隱患。近年來,以龍芯中科為代表的企業推動核心技術突破,使得國產芯片性能持續提升,供應鏈的可持續性、生態完備性上也取得進步。
此次,龍芯中科正式發布龍架構,并開放了IP授權,同時,國產操作系統、應用軟件的協同發展,將加速國產CPU生態建設。面對新一輪科技革命和產業革命加速演進,以龍芯中心為代表的國產玩家正在通過自主研發、創新突破一步步探索芯片研發的天花板,推動國產CPU性能和成熟度不斷提升。 科普視頻
未來,AI將惠及每一個人,這一切如何實現?聯想集團發布的系列主題視頻,將從AI終端到行業專屬定制AI,乃至更智能的社會,展開一副人工智能全圖景。
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。