新聞中心

        EEPW首頁 > 設計應用 > 樂聚對“人形機器人“的研發與商業探索

        樂聚對“人形機器人“的研發與商業探索

        —— 樂聚創始人冷曉琨談9年從業經驗,以及對行業的觀察建議
        作者:迎九(EEPW) 時間:2025-07-17 來源:EEPW 收藏

        “人形機器人”的技術路線如何?產業發展如何避坑?今年4 月,在上海“2025 中國人形機器人生態大會”上,人形機器人的新勢力—— 樂聚(深圳)機器人公司的創始人 冷曉琨介紹了其探索與發展建議。包括六部分:①機器人成本已大幅下降,②關注產業化,先讓機器人能用起來,③要像博士一樣聰明,家電一樣便宜,?小腦運動控制路線:model-based+RL(強化學習),?產業化的三步走,?對產業發展的建議。

        1752726689803087.png

        樂聚創始人 冷曉琨

        1   前人開路,使機器人成本已大幅下降

        這兩年人形機器人出現了井噴,因此有種觀點是否定過去一二十年人形機器人開拓者所做的工作,認為那時效率低下。樂聚對此有不同意見,并以親身經歷來說明。實際上,樂聚2016 年就成立了,由10 位哈工大的師兄弟組成,定位于人形機器人,在2018 年時做了第一臺人形機器人,那時所有的核心零部件是進口的,一臺人形機器人的BOM(物料清單)成本接近300 萬元,但是現在這款機器人的成本只有幾十萬元—— 這個變化不是樂聚或某一家公司可以實現的,而是過去十年甚至幾十年,前輩從國家層面把整個機器人的產業生態鏈布局好了,后人才能踩在巨人的肩膀上做成一些事。

        2   聚焦產業化,先讓機器人能用起來

        從2016 年樂聚做人形機器人開始,一直聚焦在人形機器人產業化上,即無論技術成熟到哪一步,至少先讓機器人用起來,而不只是做一個能跑、能跳、能讓人看的。

        樂聚去年把人形機器人作為主營業務,希望在產業化、商業化上實現閉環。例如2024 年完成了100 臺全尺寸(1.7 米)以上的人形機的產業化交付,今年一季度完成了300 臺的交付。可見,現在是一個指數性上升的狀態。

        3   博士一樣聰明,家電一樣便宜

        從時間迭代看,2016年成立公司,2018年做出第一臺人形機。2022年迎來人形機器人市場爆發。在此期間,樂聚經歷了6次大的迭代。

        2019年業界就在探討人形機器人什么時候爆發?當時孫立寧教授(注:俄羅斯工程院外籍院士,蘇州大學特聘教授,哈工大博士畢業)給出了一句話:像博士一樣聰明,像家電一樣便宜。對核心任務的定位是:技能遷移。即如何把人做任務的數據提取出來,經過黑盒子把技能給到人形機器人。

        4   小腦運動控制路線:model-based+RL(強化學習)

        所以那時人們就在探討黑盒子應該怎么構建?但是沒有找到答案?,F在隨著大模型/ 具身智能的成熟,人們發現黑盒子是具身智能。所以整個的技術邏輯/ 工程邏輯就成熟起來了。

        盡管工程/ 技術路線在變化,但是多年來也有沒變的、樂聚一直在堅持的技術。例如盡管有VLA(視覺語言動作)大模型、端到端模型等,但產業化還需要時間。如果先做成原子級的小數據、小技能,再通過調度系統來完成,至少可以保證當前讓機器人能夠快速進入產業化,迭代使用起來。所以樂聚現在做的整體架構里,依然要培養一些原子級技能,上面隨著智能調度系統逐漸成熟,再落地到不同的場景里。

        這涉及運動技術路線,樂聚的觀點和趙杰教授(注:哈工大機器人所所長)一致,認為未來小腦的一個核心發展趨勢是model-based + RL(強化學習)的耦合。這也是去年爭議很大的一件事。樂聚之前一直在堅持model-based路線,好處是場景應用時每個行為是可控的,每個規則是預定好的,可以精確執行某個任務,并且每臺機器人調試好之后、批量化生產時,每臺機器人都可以完成這個任務。但是缺點也很明顯:不能像RL一樣泛化,所以沒法像去年很火的爬山視頻一樣,做不了翻山越嶺等任務。

        但是純RL(強化學習)路線也存在一個問題:這個機器人調試完之后,無法保證剩下生產的所有機器人都能夠完成這個工作。因為要對這一臺機器人做精細建模。這就是為什么很多用戶在網上發出質疑:我看到的視頻和拿到的機器人會有一些差距。因為每一臺機器人都需要做一個很精密的建模控制。

        因此,我們既要有model-based這種精準的控制方式,又希望有RL 這種泛化性,二者結合起來較為理想。

        所以可以看到包括波士頓動力等國際頭部公司及樂聚等國內公司在往這條路線去做。

        所以關于小腦的運動控制路線,在去年業界還在爭議:到底model-based 這種落后路線對,還是RL(強化學習)這種新型的路線對?但是今年可能各家的觀點比較一致了:一定是往model-based+RL 這種融合路線上去做。

        實際上,model-based早期一直是業界堅持的,與RL的分水嶺是在2020年,即MIT開源了RL(強化學習)之后,人們發現model-based有很大的問題——它的天花板是很低的,例如本田的阿西莫(ASIMO)公認是人形機器人中做得很好的,但是不夠靈活,很難進入到產業中。

        隨著MIT于2020年左右開源RL(強化學習)之后,因為它是一個非結構化網絡,大量的數據是訓練出來的,所以大部分的產業和學術界往RL(強化學習)上去轉了。

        但是那時樂聚仍堅持認為,如果想讓人形機器人在產業里用起來,model-based這條路不會被放棄,過去50年的控制理論建設不可能隨著一個RL的出現而被全盤否定。所以樂聚在2022年之前一直還是在堅持model-based這條路線,后來發現特斯拉、Figure AI、波士頓動力等公司也是類似的做法。

        樂聚去年已到了第三代model-based,核心是解決了傳統model-based 的幾個問題:求解精度問題,并把算法、實時性這兩個最核心的問題解決了,所以才使model-based 這條路線能夠用起來了。接下來會用到工廠等一些真正的場景中。

        對于強化學習,樂聚在去年年底也做了純強化學習方案,當時訓練了2個月,可以保證機器人有45分鐘的連續奔跑,并發布了一個視頻。

        到樂聚的第四代產品,把model-based 與RL 開始融合。成功的案例是在今年3月的北京中關村論壇上,樂聚只用了20天時間,實現了20臺機器人在現場進行太極拳的表演。

        國內同行也采用了model-based 和RL 融合的技術路線。例如在今年4 月的北京亦莊人形機器人半程馬拉松上,哈工大和清華的本科生、研究生組成了一支聯合隊,就采用了此路線,使機器人的成功率及擬人化程度都有了大幅度提升。

        1752726996484288.png

        圖1 “夸父”在一汽紅旗工廠搬箱子

        5   產業化三步走

        產業化分三個階段,正如趙杰教授(哈工大機器人研究所所長)等專家提出的,第一階段,是現在仍在探索的科研,以及商業/ 展廳服務;第二個階段是在工廠,這是今年及未來幾年的核心場景;第三是未來的家庭。

        image.png

        5.1 第一階段:科研和商服

        需要做的是把足夠的接口開放出來,方便作為科研平臺來使用;或者搭載了大模型的機器人,例如像講解員一樣做展廳的引導服務,特點是較少地介入物理世界,就可以使用起來。

        從樂聚角度看,展廳今年接受度較高,在樂聚的出貨中比重較大,主要是“夸父”(KUAVO)系列。關于樂聚的做法,由于人形機器人由大腦、小腦和本體組成,樂聚的核心技術是在小腦和本體上,因此在大腦方面,樂聚這幾年和盤古大模型綁得較緊,并與豆包大模型、阿里云通義大模型在做深度綁定。在產業鏈方面,與科研院所和企業在做具身智能產業生態的布局。

        5.2 第二階段:工業場景

        工業場景是否需要人形機器人?這個爭議較大,因為大部分場景已被自動化設備取代了。但是如果真正進到車廠里轉一圈,依然存在一些場景需要人形機器人來做。

        樂聚今年4 月初發布了“夸父”在一汽紅旗車廠里搬箱子的視頻(圖1)。但是效率現在只有人的百分之六七十。好在搬空箱這個場景不考驗節拍,達到70%左右就可以了。它一天可以完成1000 多個箱子的搬運。對箱子的泛化性是一大技術挑戰,因為實際搬運時,大小、顏色、重量等都不同,非??简灧夯裕约八目臻g很狹窄。它所有的運動控制都是用model-based 做的,但是樂聚今年下半年開始逐漸交付的就是modelbased+RL,再加上大腦的技能。

        關于工業人形機器人,3 年內將是人形機器人的一個重要場景,但不是人形機器人的最終場景,工業只是一個過渡階段,是從過去固定的場景到未來家庭服務/ 超泛化場景之間的階段,一般用在最后一條產線上輕微泛化的場景,因此工業應用的天花板不會太高,例如做搬運、SPS分揀等工作,這些市場的體量不會很大。

        但是從戰略上來看,它是大腦、小腦在輕泛化場景下的磨合使用。所以這第二類應用雖然場景不大,但對于當前國內的幾家人形機器人企業的產業化是足夠的。未來一兩年內還需要深度打磨。

        除了SPS 分揀、搬箱子之外,接下來,如果人形機器人在工廠里再要做其他的工作,一個核心是要建訓練場。實際上,今年全國各地都在建訓練場,本質上,訓練場是人形機器人的職業技能培訓院校—— 把工廠里需要的場景抽象出來,然后采集人和遙控機器人的數據,形成技能模型,這種技能一旦形成、效率達到之后,它就可以直接在工廠里應用。

        可能今年的核心是建訓練場,估計明年上半年逐漸形成,下半年會在工業場景有一次應用的爆發。

        5.3 第三個場景:家庭,還要三五年或十年

        當前不需要過多去講家庭場景。因為業界能夠如此深地去布局人形機器人的未來產業,都盯的是希望它能夠像新能源汽車和智能手機一樣,每個家庭甚至每個人身邊都有一臺。但這個時間可能需要很長。很多領導來考察時,都愛問“人形機器人什么時候能進入家庭?”冷曉琨的答案是三五年。

        實際上,從技術和工程方面的挑戰并不太大,即真的在家庭里完成這些任務是可以的。但是真正作為一個產品銷售的時候,涉及安全問題、倫理問題、準入問題、交互體驗問題等,這些問題需要更久來解決,可能還要抱著一個10 年的周期來做。

        6   對產業的建議

        6.1 當前要考慮行業泡沫了

        一切要以商業化閉環為本質。這也是為什么最近的輿論有一些反過來,質疑它的發展。其實這個階段在2016 年也出現過一次,因為那時也是優必選上完春晚之后,國內出現了10 多家做小人型機器人的公司,例如樂聚、優必選等都是在2016 年出來的。那時在深圳就有七八家是做小人形機器人的,目標是讓機器人跳舞—— 但當這形不成贏利的時候,半年之后就會出現一批企業倒閉。

        所以今年又出現類似情況:會涌現一批公司,可能只是做出了一臺機器人,甚至出現了硬件解決方案公司—— 可把方案調試出來,讓機器人能走,然后以此來做商業化,其實并沒有形成商業化閉環。閉環必須要考慮人形機器人能用在哪里,怎么能為用戶產生價值。如果沒有商業閉環,可能到今年年底,人形機器人或具身智能行業還會進入一個冷靜期。為什么是這半年?因為無論是具身智能火爆還是被批評,都是被媒體流量帶著走的,這對于行業是沒有任何引導能力的,核心原因就是企業沒有把商業化閉環講清楚。你產生不了產業化價值,所以所有的流量主導權都在自媒體或者外部手里。這是一個很大的問題。所以當前階段,從業者需要冷靜下來,來解決商業化落地的問題。

        6.2 大腦和小腦融合,誰來主導?

        哈工大機器人研究所的趙杰所長曾指出,人形機器人不只是機器人制造業的問題,它是強人工智能,是“大腦+ 機器人制造業”的一次深度耦合催生出來的一個新的產業業態和生態。過去,計算機、AI 搞自己的一套,機器人制造業搞自己的一套,是兩個完全獨立的體系。但是人形機器人、具身智能體需要大腦和小腦的深度融合。

        融合的難點是什么?不是大腦,也不是小腦,而是在于家長上—— 到底誰來主導?誰能夠把二者融合在一起?這不僅是技術問題,還是行業的問題。

        為什么我們今年一直在做訓練場?在訓練場里以場景為牽引,讓大腦和小腦的不同團隊在這里有一個主導方進行融合。所以這個問題接下來會是一個挑戰,甚至誰能夠把這個問題解決好,可能就會贏得具身智能行業的下一個先機。

        6.3 需要全社會的信心與包容

        人形機器人的爆發時間需要5 年甚至10 年,這需要整個社會對這個行業有信心,以及有包容心,例如如何看待馬拉松等人形機器人比賽。實際上,只要能有很多單位的人形機器人出來參與,已經很不容易了,因為人形機器人還處于早期。

        6.4 新技術催生新企業,新企業要有謹慎態度

        只有技術出現重大變革時,例如這次大模型的出現,這次人形機器人本體的工程能力出現提升的時候,才有新興企業的機會。因為企業發展到一定程度時,就會形成寡頭壟斷。只有新技術出現的時候,才有新企業的機會。但是新企業依然還是要抱有一個謹慎的態度,一步一步地來做這個市場。

        (本文來源于《EEPW》


        關鍵詞: 202507

        評論


        技術專區

        關閉
        主站蜘蛛池模板: 静海县| 赤峰市| 阜新市| 囊谦县| 隆回县| 宜兴市| 阳西县| 富宁县| 舒兰市| 瓮安县| 灵璧县| 若尔盖县| 家居| 调兵山市| 治县。| 内乡县| 灵璧县| 金山区| 宁城县| 石林| 简阳市| 临湘市| 衢州市| 北京市| 曲靖市| 徐闻县| 读书| 岗巴县| 射阳县| 会理县| 石城县| 阿图什市| 永嘉县| 双牌县| 塘沽区| 西乌珠穆沁旗| 会宁县| 德清县| 颍上县| 建始县| 遂平县|