官宣進軍機器人行業,vivo開啟百萬年薪搶人大戰
機器人賽道闖入一枚重磅玩家。
3月25日,在博鰲亞洲論壇2025年年會現場,vivo宣布成立「vivo機器人實驗室」,正式進軍機器人行業。
vivo執行副總裁、首席運營官胡柏山表示,vivo將聚焦消費級市場,推出個人和家庭場景的機器人產品。具體路徑,則是依托“藍科技”在AI大模型與影像領域的積淀,疊加自研MR(混合現實)頭顯積累的實時空間計算能力,重點孵化機器人的“大腦”和“眼睛”,讓機器人“看得懂場景,聽得懂需求,給得了回應”。
手機廠商時下最流行的跨界可能是造車,但vivo卻做出了完全不同的選擇。相比起已足夠成熟的汽車行業,機器人的技術挑戰性顯然更大,但拉長時間來看,也無疑更具有想象空間。
此前胡柏山在接受媒體采訪時就明確表示過,vivo選擇一個新賽道,“不會看是不是風口,也不會單純的看市場規模,而是去看與我們的核心能力是否匹配,以及我們能不能進去給用戶創造價值。對于vivo的基因而言,相比于汽車行業,機器人是更好的選擇。”
在第三方招聘網站上,vivo已經掛出多個機器人相關崗位,年薪高達百萬以上。在公司成立的第三十個年頭,vivo再次集聚頂尖研發資源,押注科技行業的變革時刻。
手機廠商,突破機器人技術卡點?
得益于資本和政策的大力加持,具身智能無疑已是當下最火的賽道之一,而機器人則是具身智能最重要的載體。火爆的市場需求之下,機器人已經被視為繼智能手機、電動汽車后的下一代超級終端,有望成為千行百業乃至每一個家庭的標配。
如今的機器人的確展示出了十足的“賽博感”。尤其是在運動能力上,機器人已經學會了像人一樣自如地行走、奔跑、攀爬、側空翻,甚至“鯉魚打挺”。這是因為,由于直接關聯產品穩定性,多數初創公司都將研發資源聚焦在機器人的四肢上,也是初期商業化落地的關鍵。
盡管如此,機器人的商業化落地仍處于十分早期的階段,人形機器人目前最主要的落地場景仍是科研。一些汽車廠商開始引入人形機器人進行實訓,但距離真正在產線上發揮作用還有很長時間。由于靈活程度受限,更難以在家庭等To C場景實現大規模普及。
解決這一切的前提,要克服當下機器人最大的技術卡點:大腦。
具身智能的未來“在腦不在形”。許多從業者的共識是,要做出具有泛化能力的通用機器人,最重要的并非物理形態,而是能夠適應各種形態的、相對通用的智能。
這與vivo的想法不謀而合。
vivo機器人實驗室的研發重點在于機器人的“大腦”和“眼睛”。胡柏山在接受采訪時表示,現階段的機器人更多服務于物理世界或某個封閉場景,但沒有辦法真正為人所用,原因就在于它沒有把物理世界和數字世界能夠真正交流在一起。
要讓機器人充分地理解物理世界,再通過數字世界的能力來處理物理世界的問題,需要大量的數據進行訓練。以家庭場景為例,由于機器人從來沒有真正走進過家庭場景,多數機器人廠商都通過復刻家居、廚房等場景采集來采集多模態數據。但真實家庭環境的復雜性和多樣性仍遠超于實驗室仿真環境,這也成為機器人始終無法突破的桎梏。
手機廠商進入機器人行業的合理之處也在于此。作為人體最重要的設備延伸,智能手機掌握大量用戶物理行為數據(如運動軌跡、家居使用習慣、影像偏好等)。通過手機生態積累的規模化數據與應用場景經驗,可快速適配機器人需求,而vivo覆蓋的全球5億智能設備用戶,也能夠為機器人場景落地提供試驗場。
手機廠商一直在致力于實現的事情,就是聯接物理世界與數字世界。
大腦+眼睛,vivo的機器人宣言
那么問題來了,vivo要做怎樣的機器人?
vivo機器人實驗室想做的第一件事,就是讓機器人有更精準的眼睛。
這也是機器人處理所有任務的起點:理解環境。如果拆分成一個個小任務的話,它需要識別面前的每一個物體,并了解它們之間的關系。例如,不僅理解當前環境下有水、桌子、凳子,還要理解它們各自的特質、物體之間的距離,以及它們有可能會產生的互動。
理解環境首先要求機器人有強大的影像能力和AI能力,盡可能清晰、真實地還原畫面,并讀懂照片中物理世界所蘊含的信息。而在智能手機時代,vivo就已經將影像作為持續投入的四大長賽道之一,無論是自研影像芯片的硬件突破,還是藍圖影像算法等軟件層面的優化,都為這雙“眼睛”提供了良好的技術基礎。
其次是空間感知能力。硬件廠商的一個切入口是混合現實設備,例如蘋果此前發布的Vision Pro。它能夠清楚地判斷出當前所處環境的基本信息,例如空間構造、尺寸等,并通過簡單的手指操作來與環境進行互動。短期內,MR的需求主要在游戲、觀影場景,但長期來看,它也將是機器人還原物理世界的重要輸入設備。
在MR領域,vivo同樣有儲備。在此次論壇上,vivo展示了名為vivo Vision的首款MR混合現實頭顯,這也是vivo在混合現實領域的一個重要里程碑。這款MR的前面板集成了大量的攝像頭,采用外接電池設計。胡柏山去年透露過,vivo MR相關人員編制已經達到500人,目標是在今年秋季推出高保真的MR原型機。
vivo想做的第二件事是“大腦”。胡柏山表示,vivo機器人實驗室的重要子任務之一,就是AI領域對AI Agent (人工智能代理)能力的訓練,要求機器人能夠在特定環境中自主感知、決策并執行行動以實現目標。
為此vivo已經做好充分的技術儲備。早在2018年,vivo就成立了AI全球研究院,覆蓋知識圖譜、自然語言處理、機器視覺等前沿方向,相關人才儲備超過1000人。vivo還發布了自研AI大模型矩陣藍心大模型,其云端千億級模型在C-Eval、CMMLU等中文榜單中均穩居第一梯隊。
基于此,vivo已經在智能手機快速中實現了類似能力,例如PhoneGPT智能體。它能夠基于藍心大模型矩陣來實現全自動任務執行,具備屏幕識別與操作能力,如通過語音指令完成從餐廳訂位、跨App操作等。
由于芯片能力限制,現階段手機端還難以承載太多復雜任務。相比之下,機器人并沒有這種煩惱,可以用算力更強的硬件來跑更大的模型。如果把手機比作二維,那么機器人就是將手機升到了三維甚至四維,也能夠將手機廠商的優勢進一步放大。如果未來機器人在AI Agent上跑出了好的體驗,也可以考慮針對手機平臺做裁切,形成“機器人-手機-MR”的體驗反哺與技術閉環。
當一個硬件載體擁有了能夠識別信息的雙眼、會感知和處理信息的大腦,再配上“身體”,交由大腦控制,就形成了一個機器人的雛形。至于它的下肢是雙足、四足還是輪足履帶,則交給由用戶場景和需求來決定,也是產業伙伴們大顯身手的時刻。
不強調競爭,更期待產業合作
具身智能火熱的幾年間,活躍的機器人玩家大多數都是初創公司。產業界最好奇的是,作為國內首家官宣入局的科技巨頭,vivo能夠帶來怎樣的影響。
vivo給出了明確的答案:設立清晰的業務邊界,只做自身能力擅長的事情,聚焦于更貼近普通用戶的消費級市場,不做工業機器人;聚焦于“大腦”和“眼睛”,不做初創公司都在“卷”的機械臂、靈巧手,以及機器人的雙腿和身體。
換言之,vivo并不打算以競爭的姿態進入機器人行業,反而更強調產業合作共贏。這與vivo做手機的路徑相似:只做核心智能終端,不做SoC、屏幕等零部件,“因為這個產業鏈里面有人比我們更擅長做這些。”
更有趣的是,巨頭的入局反而有望帶動行業的降本和規范。
人形機器人難以量產的一大瓶頸,就是是缺乏成熟的供應鏈。由于硬件成本占比過高,行業規模化降本路徑尚未打通。并且,機器人用到的諧波減速器、行星滾柱絲杠等關鍵部件國產化率不足四成,高端零部件仍依賴日本哈默納科、THK等廠商。
相比之下,智能手機已經形成了相當成熟的專業化分工體系。國泰君安研報指出,智能手機與機器人供應鏈重疊度超60%,機器人規模化量產后可完全復用3C產業的快速迭代和大批量生產模式,從而快速實現成本優化。同時,巨頭有望通過技術標準來反向規范供應鏈。例如vivo影像調校標準就已被供應鏈廠商直接納入生產線檢測流程。
必須要明確的事實是,任何行業都有其自身發展的邏輯與節奏。巨頭能夠給行業帶來新風,但也無法以一己之力快速扭轉行業的進程。vivo方面也表示,能夠實現體驗閉環的機器人原型機,大概需要三到五年的時間,2C商用則要拉到更長。
但在此過程中,vivo可以通過“漸進突圍、沿途下蛋”的路徑,與產業伙伴合作共研,在特定場景推出具有針對性功能的產品,回歸場景,解決痛點,并不斷迭代,讓技術走出實驗室,走進用戶的真實生活。
目前正在博鰲論壇現場展示的vivo混合現實頭顯探索版,就是一個階段性成果。而在下個月即將發布的vivo X200 Ultra上,也將集成vivo在影像領域最新的技術突破,這些嘗試都將成為vivo 進軍機器人行業并逐步實現商業化落地的鋪路石。
無論如何,vivo的入局對產業界來說都是一個好消息。手機行業有著最大基數的消費人群,最前瞻的技術生態,和最多元的應用場景,這或許就是機器人行業的下一個拐點,讓機器人實現從實驗室到場景落地的轉折,真正成為聯接物理世界和數字世界的橋梁。
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。