博客專欄

        EEPW首頁 > 博客 > 合體」20個月,卷出安卓最強野獸X90!這顆國產「V2」,又把發哥帶飛了

        合體」20個月,卷出安卓最強野獸X90!這顆國產「V2」,又把發哥帶飛了

        發布人:傳感器技術 時間:2022-11-14 來源:工程師 發布文章
        【導讀】藍廠發布新旗艦X90,最支棱的就是發哥!懂不懂什么叫「合體」啊?


        等下,蘋果芯片的性能竟然被「秒」了?而且這次出手的還是「發哥」?看起來,這次聯發科與vivo深度合作開發的新旗艦,不僅要顛覆安卓老格局,這是想連蘋果都要一起拉下馬了。圖片

        真·地表最強:藍廠帶著發哥,支棱起來了


        這次發哥新推出的天璣9200配備了1+3+4八核CPU架構,是首款臺積電第二代4nm制程工藝平臺,也是首款第二代Armv9架構。CPU:1個最高主頻達到3.05GHz的X3超大核,3個2.85GHz的A715,4個1.8GHz的A510,外加8MB三級緩存和6MB系統緩存,功耗比天璣9000降低25%。GPU:11核G715 ,支持硬件光追,GPU性能提升32%,功耗降低41% 。圖片從極客灣放出的Geekbench 5 CPU跑分顯示,天璣9200多核跑分為4459分,比天璣9000有一定提升,不過,極客灣測試使用的是工程機,分數僅供參考。從CPU多核性能看,整體略強于蘋果A14水平,距離A15和A16還有一定距離。

        圖片

        來源:極客灣而在GPU上,天璣9200表現驚艷。在極客灣給出的GFX Bench 5.0測試結果中,天璣9200一枝獨秀,不僅將安卓一眾對手甩在身后,甚至超過了蘋果A16的GPU表現,而且優勢明顯。雖然這與蘋果這一代連牙膏都懶得擠有很大關系,但不管怎么說,發哥這回支棱得確實是有點生猛。

        圖片

        來源:極客灣對于一般手機用戶而言,說到跑分排行榜,說一千道一萬,沒有「那個軟件」的排行榜,都是野榜。據聯發科方面自己公布的9200平臺跑分圖,這個分數為126萬+,比天璣9000提高了25%以上。相比之下,高通驍龍的8+Gen只有111萬。這還不算什么,藍廠和聯發科聯合深度調校的vivo史上最強旗艦X90系列,更是在安兔兔v9上跑出了突破128萬分的成績。圖片而且,無論是哪個,都擊敗了內置蘋果M1芯片(跑分為125萬)的蘋果iPad Pro。真就是,發哥戰未來?

        連架構都改?自研芯片叒升級


        更「可怕」的是,這幫人除了調校出了地表最強的天璣9200,竟然還帶來了全新的自研芯片V2。而這距離上一代V1+的推出,才剛剛過了7個月……簡單來說,V2是一顆從場景事件出發,針對AI大密度算法算力需求,量身定制的「低功耗AI加速芯片」。圖片要實現這一點,就需要深入底層技術,甚至對芯片的架構「動刀」。對于手機AI計算而言,大致可分為平臺和外掛兩種解決方案:

        • 外掛芯片可減少軟件調度,高效專注于大密度AI運算,但在特定場景下的運算缺乏靈活性;
        • 平臺SoC軟件部署靈活,NPU峰值算力上限高,但難以滿足大密度運算的算力需求。

        但是問題來了,這兩種芯片不僅架構不同,而且指令集也完全不同。于是,在嘗試了若干種芯片間高速通信的方案之后,vivo的系統架構師和工程師終于設計出FIT(Frame Info Tunneling)雙芯互聯技術。圖片FIT的原理其實很簡單,首先需要把大型復雜算法模塊進行拆分。然后,把算力密度小、網絡結構復雜的小模型部分,通過軟件部署在平臺NPU上。同時,把算力密度大、數據吞吐密集的大模型部分,部署在自研芯片V2硬件上,讓其中的三個單元處理各自擅長的運算內容。最終,實現了在1/100秒內完成雙芯互聯同步的高速協同計算。圖片而FIT雙芯互聯的最直接應用,就是vivo最擅長的計算攝影了。由于傳統ISP的濾波器普遍是手工設計的,雖然能以極低延時處理大量的數據流水,但是只能解決已知的、特定的問題。那么對于那些復雜、未知的問題來說,最好的解決方案就是救助于人工智能。但是,當你把AI軟件算法部署到NPU上時,就需要以幀或塊為單位進行處理信號。相比之下,傳統的ISP卻是以行為單位。與此同時,由于絕大部分平臺SoC片上SRAM容量有限,大量AI算法在接入ISP 管道后,要通過外部DDR來完成數據暫存和交互。這就會造成運算與數據分離,犧牲了高性能AI運算至關重要的Data-Locality要求,進一步降低了性能。為了解決這一問題,vivo在自研芯片V2上,把傳統的ISP架構升級為AI-ISP架構。進而通過FIT雙芯互聯,第一次將平臺ISP-NPU與自研芯片V2的ISP-DLA作為一個整體,設計出了目前來說最合理的AI算法處理架構。而這,也是在異構多芯片計算方向上,邁出的至關重要的第一步。圖片從結構上來看,V2的可以分為三個部分:

        1. 圖像處理單元
        2. AI計算單元
        3. 片上內存單元

        圖片具體來說,對于移動端的AI處理,有三個相互關聯且共同決定能力上限的要素——算力容量,算力密度和數據密度。平臺SoC算力容量大,適合部署網絡結構復雜的模型,但能效比不高,無法滿足對大密度AI運算的需求。于是,vivo在自研芯片V2的設計中,加入了近存深度學習加速器(DLA)。其中,近存DLA通過全硬化MAC設計和大容量專用片上SRAM,強化算力密度和數據密度,從而釋放算力容量的潛力。圖片在算力密度上,得益于全硬化MAC設計,V2的近存DLA在實際AI運算中,能夠達到100% MAC利用率。相比在平臺SoC軟件部署AI運算,8bit算力密度提升了2-3倍。此外,vivo還針對專業視頻的10bit處理需求,在自研芯片V2中專門硬化了10bit的MAC單元——相比平臺SoC軟件部署所采用的合并運算方式,10bit算力密度提升了4-6倍。圖片另一方面,數據密度受到傳統架構von Neumann內存墻的制約,大密度運算會遇到數據填喂不足、運算等待數據的問題,極大限制了計算性能。為保證數據密度與算力密度的完美匹配,自研芯片V2在近存DLA內配套設計了速度高達1.3萬億bit/s的專用片上SRAM,并把容量提升到了效45MB,比前一代的V1大了40%。這種近存DLA的設計,大幅減少了數據尋址和搬運的功耗,與通常NPU采用的DDR外存設計相比,SRAM數據吞吐功耗理論最大可減少99.2%。圖片算力密度和數據密度的雙重提升,以及多項低功耗電路設計方法的加持,讓自研芯片V2的近存DLA在同等芯片制程條件下的表現遠超同行競品。也就是說,內核每瓦算力在運行8bit MAC和10bit MAC時,分別達到了16.3TOPS/W和10.4TOPS/W。
        圖片如此一來,在部署相同算法時,自研芯片V2相比傳統NPU,能效比提升了200%。不出意外的話,在全新的AI-ISP架構下,配合FIT雙芯互聯、近存DLA、專用片上SRAM等多項突破性設計,全新的V2又會讓手機計算攝影再次「起飛」。

        給我翻譯翻譯什么叫「專業攝影」

        說到效果,也是顯而易見:長焦不抖了,暗光不糊了,就連按快門也沒延遲了。要知道,專業相機的快門延遲在30ms左右,而手機的快門延遲一般在170-300ms。結果就是,同時按下的快門,相機都出完片了,手機這邊可能還沒開始曝光。于是,vivo全面優化了圖像處理管線,通過提升Sensor啟動速度,將快門延遲低到了專業相機的30ms。圖片手機長焦拍攝通常存在兩個問題:拍攝倍率過大時畫面會模糊(拍不清)、手持運鏡導致畫面劇烈抖動(拍不穩)。為此,vivo借鑒科研領域天文望遠鏡和高端顯微鏡的圖像處理流程,帶來全新的超清畫質引擎。超清畫質引擎從底層改寫了ISP圖像處理鏈路,將圖像處理AI化,包含了Denoise降噪、Demosaic細節恢復、Deblur去模糊三大重要模塊,以及蔡司光學超分算法。圖片其中,核心便是vivo和蔡司聯合研發的蔡司光學超分算法。這套算法,能根據每個手機的模組特性做建模分析,通過逆運算動態調整,補償光學信息,突破鏡頭工藝的上限。在蔡司光學超分算法的加持下,5倍以上的焦段,拍攝解析力最高提升35%。圖片在應對「手抖」方面,就到了Ultra Zoom EIS出場的時候了。這項技術包含了IMU(慣性測量單元)、OIS光學防抖與EIS電子防抖三大模塊。其中,IMU負責檢測抖動,OIS/EIS負責抵消抖動,軟硬協同防抖。如此一來,手機就能在20X以上倍率實現抖動抵消,讓被攝主體在畫面中趨于平穩不會晃動。圖片為了確保在暗光場景下也能實現這樣的能力,vivo做了多個算法的疊加,在手機攝影的全鏈路上都進行了大幅優化。首先,vivo和Sensor廠商深度合作,將Sensor ISO高感從上一代的16000提升到102400,暗光場景下的感光能力大幅提升。圖片其次,在運動抓拍時采用運動自適應多幀融合技術,一次快門生成多幀運動畫面,疊加vivo自研的RawEnhance2.0算法,可以把每一幀有用信息疊加在一起,讓暗光運動也無拖影。結果就是,在5lux的暗光環境下,畫面的細節表現提升17.3%的同時,噪聲降低了46%。圖片此外,vivo這類拍攝上還采用了新一代運動測量與跳躍檢測算法,運動畫面定格能力相較于上一代提升58%。圖片

        什么是產品力?我可以不用,你不能沒有

        「發哥」的芯片再厲害,最終的載體還是手機。而一部好用的手機,往往是芯片廠商和手機廠商精誠合作的結晶。作為一個主打年輕用戶的手機廠商,這些年vivo一直在探索一個問題:年輕人用手機,最看重什么?流暢游戲、動畫絲滑、光速加載、屏幕不傷眼、多任務切換不卡、拒絕「殺后臺」、續航不拉胯......即使有些佛系用戶的要求要低得多,但手機行業卷了這么多年,「我可以不用,你不能沒有」早已成為衡量旗艦安卓機的產品力的一個基準。作為國內手機大廠之一,早在20個月之前,vivo與聯發科就已經展開密切合作。雙方在影像、游戲、AI、顯示、通信、功耗、UX性能等多領域展開深度聯合研發。圖片此次,雙方加深合作深度,帶來了5個聯合研發的重磅功能:MCQ多循環隊列、王者榮耀自適應畫質模式、芯片護眼、APU框架融合、AI機場模式。MCQ多循環隊列:多核場景,高速傳輸MCQ多循環隊列,是業內針對未來多核場景考量,為發揮CPU極致性能,重新定義的一款全新處理引擎。MCQ最多可為CPU和UFS之間的數據交換提供8條通道傳輸,有效提升CPU的數據并發處理能力,讓應用軟件切換和后臺下載喚醒更快、更流暢。圖片經測試,搭載MCQ技術后,隨機寫入速度增加了16.7%以上,安兔兔跑分近5000分,而在更多更實用的場景的體驗也有明顯提升——比如大型APP的安裝速度。在vivo和聯發科的聯合開發下,天璣9200旗艦平臺成為行業首個支持MCQ的平臺,相信越來越多的平臺會頻繁使用到這一功能。圖片王者榮耀自適應畫質模式:提升續航,控制溫度該模式由vivo攜手聯發科、王者榮耀三方聯合研發,是基于MAGT游戲自適應循環開發的一項黑科技。vivo透過平臺服務,與游戲應用間的即時信息交換,游戲應用可針對信息即時逐幀調控,達到一個「自適應閉循環」。圖片經實測,開啟自適應模式后,在26℃環境下,在王者榮耀120+極致配置下運行1小時,游戲幀率接近滿幀(119.9),均方差僅有0.92,達到了業界頂級水平。這個成績,有點頂了。圖片芯片護眼:實時偵測,實時降藍光視力健康現在越來越被大家重視,護眼也成為年輕人選購手機時的重要考量因素。最傷眼的「藍光」,自然成為了vivo想方設法要對抗的天敵。芯片在「降藍光」上的角色至關重要。圖片vivo和聯發科共同在天璣 9200旗艦平臺上開發的智能降藍光技術,能夠實時偵測畫面的藍光占比,通過創新性的算法并硬化成IP的方式,實時降低藍光。讓高能可見藍光占比小于5%,色偏程度降低12%。同時,能夠根據檢測結果動態調整畫面色彩效果,在降低藍光的同時保證屏幕不偏色,實現了行業性突破。APU聯合調優:能效驟增,優化協同天璣9200旗艦平臺的第六代APU690算力高達30TOPS,能效比相較上代提升了45%。基于APU硬件特性,聯發科提供了NeuronRuntime軟件加速框架,vivo將NeuronRuntime底層通用能力封裝到自研的VCAP異構計算加速平臺中。從芯片底層到框架層,VCAP在訪存處理、動態量化、指令流水線等維度實現深度優化,讓算法在多個處理器之間協同調度,帶來顯著的能效提升。圖片基于這套方案,vivo在APU上實現了相機超清文檔、實況文本、離線語音輸入法等多項應用上的性能優化。以離線語音輸入法為例,vivo支持全離線語音輸入,確保數據不出端,用戶隱私安全不外泄。這是行業首次實現語音轉換算法NPU優化落地。對比行業通用的CPU方案,功耗優化30%,性能提升50%。圖片AI機場模式:飛行節能,落地速連AI機場模式包含兩大AI引擎:感知AI引擎、搜網AI引擎。在這一模式下,手機通過感知AI引擎準確感知用戶進入機場與飛機的起飛降落,再通過搜網AI引擎來準確識別目的地,并智能調控搜網策略。圖片開啟這個模式,若手機開啟飛行模式,起飛后至降落前平均可以節能 30%。圖片關閉飛行模式后,捕獲網絡的速度也大幅優化。由7.41秒縮短至1.52秒,提速79%。

        用了30多年的底層算法,改了!

        天璣9200旗艦平臺的驚艷表現離不開底層的優化,vivo與聯發科一道,對計算、存儲等底層能力進行了內核級創新。完美適應多極限場景,4K60幀視頻錄制功耗大降此次,vivo與MediaTek「雙芯聯調」的效果首先體現在影像功能的表現上。經過雙方共同優化,新平臺多種拍攝場景下的表現大幅提升,并首次以極低的功耗實現了先進的循環視差網絡,大幅優化能效表現,能耗降低了15%。尤其是在4K 60幀極限錄像場景中,天璣9200的功耗相比天璣9000,足足降低了25%。圖片游戲:全流程提速,幀數穩定溫度低在游戲場景下,新發布的Origin OS3不僅帶來了游戲超分等「黑科技」,還通過疾速啟動引擎和網絡加速引擎增強游戲表現,對游戲的下載、啟動、加載、運行等多個環節進行全方位優化。圖片而王者榮耀在120幀+極致畫質下,能接近滿幀地運行1小時,就是對冷勁、全速最好的解釋。

        研發竟要腳踏「兩條船」

        那么,自研芯片的效果到底如何呢?拋開更長遠的戰略不談,就單從銷量上來看,完全稱得上是「效果拔群」。

        報告顯示,2022年第二季度在X80的推動下,vivo在600美元到799美元(約合人民幣4100元到5470元)區間段銷量同比增長504%,vivo的整體銷量同比增長91%,取代華為排到了第二位。

        圖片不論是影像技術迭代,還是芯片架構升級,亦或是屏幕顯示優化,單純的硬件堆疊和算法配置都無法真正讓人滿意。實際上在去年,在vivo首顆自研影像芯片V1推出時,vivo的手機影像正式邁入了硬件級算法時代。硬件調校自然是硬件廠商的拿手絕活,為了發揮出硬件的極致潛力,vivo叫上了聯發科——把自己的算法、架構固化到芯片層面,與聯發科開展深度聯調。vivo與聯發科雙方的合作,從一開始就確立了一個目標,軟硬協同,實現平臺性能全方面的突破。一年后,當性能和功耗同時具備驚人表現的天璣9200,遇上vivo的自研芯片,結果就是,「煥然一新」的天璣9200不僅有了更高的能效比、更快的響應速度,而且還擁有更強的游戲體驗。圖片圍繞這一目標,雙方都投入了精英開發團隊,經過超過20個月的開發周期,大幅革新了軟件通路架構,實現了1+1>2的效果。如果說,自主研發是vivo有別于他人的賽道選擇,聯合研發則是vivo突破技術邊界的堅定嘗試。與硬件廠商深度合作,走軟硬件聯合開發,雙管齊下之路,對于構建可持續的健康生態圈、培養用戶使用習慣,乃至擴展合作和產業鏈渠道而言,都是一種追求長遠的戰略布局。圖片在這方面,軟硬件高度一體化的蘋果,早已經走到了行業的最前頭。而現在,在這條已經被無數成功驗證過的道路上,出現了越來越多的前行者。vivo和聯發科都知道,合作越深,步子越大,未來才有前途。正是一直以來的堅持,讓vivo努力做得比別人更好,在這條路上,vivo走得比別人更踏實、更長遠。  

        來源:新智元


        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。

        pid控制相關文章:pid控制原理


        pid控制器相關文章:pid控制器原理


        電子負載相關文章:電子負載原理


        關鍵詞: 安卓

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 隆化县| 高平市| 鹰潭市| 民丰县| 海南省| 溧阳市| 桐庐县| 洪泽县| 孟连| 德阳市| 区。| 突泉县| 青田县| 靖江市| 涟水县| 五河县| 浦江县| 津南区| 靖州| 比如县| 凭祥市| 寻乌县| 黑龙江省| 格尔木市| 乐至县| 缙云县| 博湖县| 昆明市| 盘山县| 宜兰县| 都江堰市| 新乐市| 荣昌县| 股票| 宁都县| 金乡县| 伊吾县| 桓仁| 正蓝旗| 定南县| 江西省|