新聞中心

        EEPW首頁 > 機(jī)器人 > 設(shè)計(jì)應(yīng)用 > 人形機(jī)器人技術(shù)的進(jìn)展、實(shí)踐與挑戰(zhàn)

        人形機(jī)器人技術(shù)的進(jìn)展、實(shí)踐與挑戰(zhàn)

        —— 根據(jù)浙大教授熊蓉的報(bào)告整理
        作者:迎九 時(shí)間:2025-04-07 來源:EEPW 收藏

        2024 年4 月,由中國機(jī)器人網(wǎng)、智能谷產(chǎn)業(yè)園主辦的“2024 中國生態(tài)大會(huì)”在上海舉行。會(huì)上,褚君浩院士[1]和孫立寧院士[2]對(duì)的傳感和控制技術(shù)做了介紹,隨后,浙江大學(xué)的熊蓉教授分享了其觀察和實(shí)踐。

        本文引用地址:http://www.104case.com/article/202504/469078.htm

        本文主要介紹了熊蓉教授多年來的科研成果,包括三部分:①的發(fā)展背景與意義,②核心關(guān)鍵技術(shù)研究進(jìn)展,③發(fā)展趨勢(shì)與挑戰(zhàn)。

        熊蓉教授是浙江大學(xué)控制科學(xué)與工程學(xué)院教授、博士生導(dǎo)師,浙江大學(xué)智能系統(tǒng)與控制研究所機(jī)器人實(shí)驗(yàn)室主任。

        1   人形機(jī)器人的發(fā)展背景與意義

        人形機(jī)器人原來有很多的稱呼,過去習(xí)慣于稱為“仿人機(jī)器人”,但是這兩年明確定義為是“人形機(jī)器人”。

        1.1 人形機(jī)器人的特點(diǎn)

        常規(guī)的機(jī)器人是模仿人的部分或全部功能和智能;但是人形機(jī)器人更強(qiáng)調(diào)類人的形態(tài),這種類人的形態(tài)使它能夠適應(yīng)人類為自己建造的環(huán)境,使用人類為自己設(shè)計(jì)制作的工具,并且能夠有更好的人機(jī)交互。所以它具有更強(qiáng)的通用性。這種通用性使它能夠無縫地轉(zhuǎn)換人類現(xiàn)在所從事的一些工作,所以它是一個(gè)未來的重大的產(chǎn)業(yè)。

        人形機(jī)器人屬于專用型的機(jī)器人,能力是超越人類的:會(huì)有更強(qiáng)的負(fù)載,更快的工作的節(jié)拍,更高的精度,更強(qiáng)的一致性。

        但是現(xiàn)在這種專用的人形機(jī)器人還是無法實(shí)現(xiàn)的——還需要給它們布置專屬的環(huán)境,但是未來有望融入到人類生活的方方面面。這種類人的形態(tài)可以直接實(shí)現(xiàn)與人的無縫替換,所以具有更加廣闊的市場(chǎng)。

        1.2 市場(chǎng)預(yù)測(cè)與布局

        國內(nèi)外做了非常樂觀的市場(chǎng)預(yù)測(cè),例如高盛近期的市場(chǎng)預(yù)測(cè)樂觀度進(jìn)一步提高了,認(rèn)為如果能夠克服產(chǎn)品設(shè)計(jì)、用例、技術(shù)、成本及廣泛公眾接受度等障礙,到2035年人形機(jī)器人市場(chǎng)規(guī)模將達(dá)1,520億美元,與電動(dòng)汽車市場(chǎng)旗鼓相當(dāng)。馬斯克預(yù)測(cè)智能人形機(jī)器人將超越人類數(shù)量,市場(chǎng)規(guī)模將達(dá)萬億級(jí)。

        這兩年一些國內(nèi)外的產(chǎn)業(yè)界巨頭開始布局人形機(jī)器人的賽道,從整機(jī)到核心零部件,從里面的智能控制器到智能計(jì)算等。

        總體來看,人形機(jī)器人已進(jìn)入了一個(gè)新的突破窗口期:從實(shí)驗(yàn)室的樣機(jī)研發(fā),進(jìn)入到了產(chǎn)品的樣機(jī)以及未來產(chǎn)業(yè)化發(fā)展的早期階段。

        我國也非常重視人形機(jī)器人的發(fā)展,已經(jīng)上升為國家戰(zhàn)略性新興技術(shù)和產(chǎn)業(yè)方向。我國從2022 年就開始了相關(guān)的發(fā)展論證,2023 年工信部先后出臺(tái)了揭榜掛帥的項(xiàng)目[3],以及《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見》。在今年1 月,工信部等7 部門發(fā)布了《關(guān)于推動(dòng)未來產(chǎn)業(yè)創(chuàng)新發(fā)展的實(shí)施意見》里,“創(chuàng)新標(biāo)志性產(chǎn)品”的第一個(gè)就是人形機(jī)器人。

        2   浙大的研發(fā)實(shí)踐

        2.1   人形機(jī)器人的關(guān)鍵技術(shù)

        人形機(jī)器人并不是今天才有的系統(tǒng),早在上個(gè)世紀(jì)六十年代就推出了第一臺(tái)雙足行走機(jī)器人。

        人形機(jī)器人一直以來都被認(rèn)為是機(jī)器人領(lǐng)域中的一個(gè)技術(shù)競(jìng)爭(zhēng)制高點(diǎn),是國與國之間競(jìng)爭(zhēng)的科技的顯示點(diǎn)。其主要難點(diǎn)在于三方面(如表1)。

        1743995161865666.png

        表1 人形機(jī)器人的主要挑戰(zhàn)

        首先,它幾乎是機(jī)器人和人工智能(AI)技術(shù)的集大成者,涉及了機(jī)器人技術(shù)的方方面面,并且整個(gè)系統(tǒng)的復(fù)雜性也導(dǎo)致了整機(jī)系統(tǒng)的研制是一個(gè)具有很高挑戰(zhàn)性的問題。

        除了整機(jī),還需要融合各個(gè)部件的功能、性能、材料等,同時(shí)也對(duì)這些部件提出了高要求,例如關(guān)節(jié)要求力矩大、速度快、體積小、重量輕、高功率密度等。

        第二,這個(gè)系統(tǒng)是本質(zhì)不穩(wěn)定的系統(tǒng)。例如人有時(shí)單腳支撐,如果跑步可能雙腳騰空,可見人的足和地面接觸的空間和時(shí)間有時(shí)候非常少,人的穩(wěn)定控制會(huì)發(fā)生在這樣的一個(gè)小空間和時(shí)間段里,但對(duì)于人形機(jī)器人來說,這種穩(wěn)定控制很難。因此,盡管現(xiàn)在很多機(jī)器人實(shí)現(xiàn)了穩(wěn)定的行走,但是不能到一個(gè)真實(shí)的環(huán)境里去適應(yīng)各種環(huán)境的擾動(dòng),例如去適應(yīng)在作業(yè)過程中,由于手臂的用力而帶來的擾動(dòng),同時(shí)能夠去保證它的穩(wěn)定性以及作業(yè)的準(zhǔn)確性。

        第三,作為一種通用的形態(tài),它必須能在各種環(huán)境里去執(zhí)行各種任務(wù),這就對(duì)它的智能性提出了高要求,這也是AI 領(lǐng)域中的一個(gè)重要的發(fā)展目標(biāo)——能夠向通用AI 發(fā)展。

        在工信部的《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見》里明確的一個(gè)思想是以應(yīng)用來牽引,然后通過整機(jī)來帶動(dòng)整個(gè)生態(tài)的發(fā)展。其中有幾個(gè)核心,一是包括整機(jī)和部件,還有小腦、大腦,以及要去支持其開發(fā)的供應(yīng)鏈和工具鏈,由此來形成整個(gè)的行業(yè)應(yīng)用和生態(tài)建設(shè)(如圖1)。

        1743995774668053.png

        圖1 對(duì)《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見》的部分解讀圖

        2.2 研發(fā)歷程

        熊蓉教授團(tuán)隊(duì)是從2000年開始進(jìn)行機(jī)器人研究的,關(guān)注的是機(jī)器人的智能性,包括智能移動(dòng)和操作。2006年時(shí)看到了人形機(jī)器人是技術(shù)的集大成者和其挑戰(zhàn)性,開始了對(duì)人形機(jī)器人的研發(fā)。

        2006 年后主要以參加RoboCup 比賽的機(jī)器人為平臺(tái)進(jìn)行技術(shù)積累,包括了機(jī)器人的設(shè)計(jì)制作,涵蓋運(yùn)動(dòng)控制、平衡控制以及集成了單目視覺來進(jìn)行實(shí)時(shí)的定位、規(guī)劃、各種運(yùn)動(dòng)的實(shí)時(shí)生成。該平臺(tái)在國際比賽上獲得了4 次亞軍,在國內(nèi)獲得了多次冠軍。

        1)打兵乓球機(jī)器人

        2008—2011 年,熊蓉教授團(tuán)隊(duì)在國家863 項(xiàng)目的支持下,研制了兩個(gè)能夠跟人或者是雙機(jī)器人進(jìn)行乒乓球?qū)Υ虻娜诵螜C(jī)器人(圖2)。這里除了選擇合適的形態(tài)及部件集成,更主要的還解決了智能的視圖控制。這堪稱國際上第一個(gè)能夠在線動(dòng)態(tài)視圖控制快速飛行的球并擊打的人形機(jī)器人,包括能夠基于視覺對(duì)球進(jìn)行準(zhǔn)確的檢測(cè)、定位以及對(duì)整條軌跡的預(yù)測(cè)。其用5 幀的數(shù)據(jù)來實(shí)現(xiàn)小于4 ms 的時(shí)間誤差和小于1 cm 位置誤差的整條軌跡的預(yù)測(cè),然后在線做全身的運(yùn)動(dòng)規(guī)劃——這是一個(gè)冗余自由度的在線規(guī)劃,并且去解決在手臂擊球的加速度下會(huì)造成身體的不穩(wěn)定,如何進(jìn)行平衡控制來保持穩(wěn)定,以及它的準(zhǔn)確擊球。

        image.png

        圖2 打乒乓球的人形機(jī)器人

        2011 年10 月成果發(fā)布后,它得到了國內(nèi)外的廣泛關(guān)注。但是該系統(tǒng)還有一些問題尚待解決,例如行走速度和穩(wěn)定性還有問題——它只能實(shí)現(xiàn)1.2 km/h 的行走,并且只能在平整地面上行走;在打球時(shí),因?yàn)樾凶叩乃俣雀簧?,主要是站立打球,用下肢來做平衡控制?/p>

        2)快速穩(wěn)定行走的人形機(jī)器人

        所以從2012 年起,熊蓉教授團(tuán)隊(duì)主要研究在室內(nèi)外能夠快速穩(wěn)定行走的人形機(jī)器人,包括能夠立位混合控制的關(guān)節(jié)、腿,以及全身協(xié)調(diào)的立位混合控制。2022年時(shí),新的人形機(jī)器人能夠?qū)崿F(xiàn)在室內(nèi)外快速穩(wěn)定地行走,包括適應(yīng)各種地形。

        ●   部件/ 關(guān)節(jié)的研制。涵蓋高功率密度的電機(jī),更大減速比的行星減速器,以及做成高集成性的一體化關(guān)節(jié)。

        ●   運(yùn)動(dòng)建模和控制。目前國際上對(duì)人形機(jī)器人行走的運(yùn)動(dòng)控制有三條技術(shù)路線(圖3)。一種是從機(jī)理出發(fā)的,對(duì)整機(jī)進(jìn)行運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)的建模,然后設(shè)計(jì)其穩(wěn)定規(guī)則,來進(jìn)行它的規(guī)劃控制。第二種是像特斯拉所展示的,把人的運(yùn)動(dòng)如何直接映射到機(jī)器人上面,使它能夠產(chǎn)生更加擬人化的動(dòng)作。第三種是針對(duì)機(jī)理模型控制,這需要大量的挑戰(zhàn),非常依賴于模型的準(zhǔn)確性,對(duì)于復(fù)雜環(huán)境的適應(yīng)性需要人工的介入——如何去提高它的魯棒性,而研究強(qiáng)化學(xué)習(xí)的方法。

        熊蓉教授團(tuán)隊(duì)在這三個(gè)方面都開展了一些工作。

        例如,在“強(qiáng)化學(xué)習(xí)”方面,2020 年時(shí),他們?cè)谒淖銠C(jī)器人上首先做了一項(xiàng)工作,通過強(qiáng)化學(xué)習(xí)去生成各種動(dòng)作,例如生成各種基本步態(tài),然后再把基本步態(tài)融合,形成對(duì)于陌生環(huán)境的適應(yīng)性,能夠自動(dòng)選擇步態(tài)的組合。今年年初,他們又把這種方法延伸到了人形機(jī)器人上,以實(shí)現(xiàn)對(duì)不同地面的適應(yīng)。

        1743995912192849.png

        圖3 行走運(yùn)動(dòng)控制的技術(shù)路線

        在模型學(xué)習(xí)“人機(jī)映射”學(xué)習(xí)方面,如何把人的復(fù)雜動(dòng)作快速映射到機(jī)器人上?最初是把人的手與上肢的動(dòng)作映射到一臺(tái)機(jī)器人上。

        這里主要解決了兩點(diǎn)。傳統(tǒng)的最優(yōu)化的映射比較依賴初值(需要人工給較好的初值),而且只能實(shí)現(xiàn)一些簡(jiǎn)單的動(dòng)作,需要的優(yōu)化時(shí)間較長。他們把最優(yōu)化和目前火熱的深度學(xué)習(xí)結(jié)合后,提出了圖形神經(jīng)網(wǎng)絡(luò)下的最優(yōu)化的學(xué)習(xí)方法,其優(yōu)勢(shì)是:①大幅提升了動(dòng)作的相似性,而且可以保證可執(zhí)行性和安全性;②最主要的是實(shí)現(xiàn)了時(shí)間上的大幅提升,能夠快速地把人的各種運(yùn)動(dòng)映射到機(jī)器人上。

        3)語義保持

        在利用最新AI技術(shù)方面,他們利用語言和視覺大模型去進(jìn)一步提升動(dòng)作的語義保持。例如讓它指胸口,不能映射以后指到脖子或腹部;讓它指鼻尖,就必須是鼻尖。所以通過這種跟新的AI 技術(shù)的結(jié)合,可以實(shí)現(xiàn)語義保持,并且能夠快速遷移到新的架構(gòu)上。

        4)關(guān)節(jié)壞了仍能行走

        另外,足式機(jī)器人不可避免地會(huì)有一些關(guān)節(jié)出現(xiàn)故障。能否讓它有一定的自適應(yīng)性,依然保持一定的作業(yè)能力?熊蓉教授團(tuán)隊(duì)的成果是:假定在四足機(jī)器人上面任意一個(gè)關(guān)節(jié)壞了,給它一個(gè)鎖定,四足機(jī)器人依然能保持直線行走。

        5)機(jī)器人智能

        熊蓉教授團(tuán)隊(duì)的工作更多地還是放在了機(jī)器人智能上,從2000年開始在這方面去做了大量的工作。

        6)總體設(shè)計(jì)思想

        總體思想是:如何從傳統(tǒng)的封閉、靜態(tài)的環(huán)境里,走向具有一定未知性和動(dòng)態(tài)開放的環(huán)境里,讓它能夠長期自主魯棒地工作;以及從依賴人工離線編寫的程序,到具有自適應(yīng)、自學(xué)習(xí)、自進(jìn)化、自發(fā)育的能力,以逐步適應(yīng)更加豐富的環(huán)境和更加多樣化的作業(yè)(圖4)。

        1743996047178909.png

        圖4 機(jī)器人的技術(shù)發(fā)展目標(biāo)

        在這些方面,熊蓉教授團(tuán)隊(duì)也發(fā)表了一系列的論文。

        7)智能移動(dòng)技術(shù)。

        對(duì)機(jī)器人的長期準(zhǔn)確的定位和導(dǎo)航方面做了一些工作,也得到了專家院士的認(rèn)可,現(xiàn)在一些技術(shù)已經(jīng)在多個(gè)領(lǐng)域里有應(yīng)用驗(yàn)證,例如變電站的巡檢機(jī)器人,制造業(yè)里的新型AMR(自主移動(dòng)機(jī)器人),四足機(jī)器人在復(fù)雜地形下對(duì)人的跟隨等。熊蓉教授團(tuán)隊(duì)的成果也實(shí)現(xiàn)了產(chǎn)業(yè)的轉(zhuǎn)化落地,孵化了“迦智科技”去做新型的物流機(jī)器人,目前已經(jīng)在制造業(yè)里大規(guī)模應(yīng)用。

        8)智能操作技術(shù)

        開放場(chǎng)景高效行為的決策

        * 有參照人的裝配工作

        自從2012 年完成了打乒乓球的機(jī)器人之后,熊蓉教授團(tuán)隊(duì)又面向如何能夠去操作更多的對(duì)象研究。其中一項(xiàng)工作是對(duì)于序列性的作業(yè),能否讓人能夠去展示,然后直接來生成機(jī)器人的程序。

        即機(jī)器人首先對(duì)人的動(dòng)作進(jìn)行理解,解析出用什么樣的動(dòng)作,操作了什么樣的物體,達(dá)到了什么樣的效果,并且要去解決從感知誤差到執(zhí)行精度要求之間的差距。人類的感知誤差往往是毫米級(jí)的;而熊蓉教授團(tuán)隊(duì)的機(jī)器人的執(zhí)行精度在0.1 毫米級(jí)量級(jí)。這需要能夠?qū)崿F(xiàn)準(zhǔn)確的對(duì)未知的推理,然后實(shí)現(xiàn)程序的自動(dòng)生成。熊蓉教授團(tuán)隊(duì)實(shí)現(xiàn)了不同的動(dòng)作,例如手電筒的開關(guān),包括機(jī)器人關(guān)節(jié)對(duì)人的行為學(xué)習(xí)以后,用幾分鐘的時(shí)間來生成動(dòng)作。

        * 在開放性的環(huán)境里

        實(shí)際上很難有人的這種參照,需要機(jī)器人能夠去自主決策。

        在這里,當(dāng)有一個(gè)長序列的行為,例如要抓藍(lán)色的木塊,但是它有堆疊時(shí)抓不到,需要通過推、挪等動(dòng)作快速地抓到。

        再例如很多時(shí)候?qū)δ繕?biāo)位置是有放置要求的,但是來料往往是隨機(jī)的,怎樣去調(diào)整它的中間狀態(tài)?原來我們都是要依靠人來編程序,把它做一個(gè)指定的位置調(diào)整,來保證它最后的實(shí)現(xiàn)。但在開放場(chǎng)景里,如何讓機(jī)器人能夠自動(dòng)地生成中間的行為和中間的狀態(tài)?

        從學(xué)習(xí)的角度來看,最終目標(biāo)是明確的,但是中間的目標(biāo)不明確,因此它也很難來得到數(shù)據(jù)的正確反饋,即正確的數(shù)據(jù)是稀疏的。熊蓉教授團(tuán)隊(duì)在這方面解決了中間的評(píng)價(jià)器,以及能夠去快速學(xué)習(xí)的問題。進(jìn)一步地,對(duì)于一些開放混雜的場(chǎng)景,需要更多地去適應(yīng)各種各樣的物體,為此,熊蓉教授團(tuán)隊(duì)也引入了語言大模型和視覺大模型。

        但是大模型是通過大量數(shù)據(jù)訓(xùn)練形成的,雖然包含了各種各樣的物體,但是還有可能檢測(cè)不了一些物體,也會(huì)存在當(dāng)物體堆疊在一起的時(shí)候,檢測(cè)和定位的準(zhǔn)確性可能較低,導(dǎo)致機(jī)器人執(zhí)行的失敗。

        在此情況下,怎樣讓機(jī)器人通過它的行為逐步收斂到一個(gè)正確的結(jié)果里?熊蓉教授團(tuán)隊(duì)就提出了把語言大模型、視覺大模型和機(jī)器人操作的模型去融合學(xué)習(xí),實(shí)現(xiàn)了在這種混合場(chǎng)景下的操作,最后來完成工作。

        通過這樣一系列的從強(qiáng)化學(xué)習(xí),從語言視覺大模型以及與模仿學(xué)習(xí)的結(jié)合,可以讓機(jī)器人來完成桌面的整理。初始它可能是非?;祀s的,告訴機(jī)器人目標(biāo)要求后,機(jī)器人會(huì)進(jìn)行長序列的規(guī)劃生成,最后來達(dá)到指定的要求。

        9)伺服控制

        與此同時(shí),熊蓉教授團(tuán)隊(duì)在機(jī)器人的伺服控制里也做了一系列工作。因?yàn)閭鹘y(tǒng)的方式是先人為編好一個(gè)最優(yōu)化的目標(biāo)約束,然后去進(jìn)行伺服的求解控制。但是這種傳統(tǒng)方法對(duì)于場(chǎng)景變化還是有一定的局限性。而熊蓉教授團(tuán)隊(duì)采用學(xué)習(xí)的方法會(huì)發(fā)現(xiàn),它其實(shí)也是非常依賴于數(shù)據(jù)的,如何去讓它真正地具有泛化性?為此,熊蓉教授團(tuán)隊(duì)提出了一種無模型的方法,能夠?qū)崿F(xiàn)它的端到端的伺服控制,包括能夠去適應(yīng)姿態(tài)的變化、背景的變化,以及能夠去適應(yīng)這種場(chǎng)景的傳感器(例如在應(yīng)用的過程中不小心把傳感器碰動(dòng)了——它的外參變化了,在這樣的擾動(dòng)下,它是不是依然能夠去適應(yīng)?),以及如何去讓它適應(yīng)各種場(chǎng)景里的紋理。

        ●   力控插拔

        熊蓉教授團(tuán)隊(duì)也做了力控方面的工作,目前實(shí)現(xiàn)了一個(gè)軸孔配合容差小于0.1 mm 的高精度的插拔,用1 h的訓(xùn)練、通過2 萬次測(cè)試后達(dá)到了99.99% 的成功率。相比之下,DeepMind 用8 h,成功率99.98%。而且它具有泛化性,能夠去適應(yīng)不同的接口,包括光模塊、新能源車的充電口以及IT 設(shè)備的USB 口等。對(duì)于這些復(fù)雜的形狀,人的操作也要花很多時(shí)間,而這種機(jī)器人的執(zhí)行速度能夠高于人的速度。

        另外,熊蓉教授團(tuán)隊(duì)對(duì)人形機(jī)器人的移動(dòng)和操作的協(xié)作,以及人- 機(jī)的協(xié)作開展了一系列的研究。

        ●   手腿協(xié)調(diào)

        今年3 月,在浙江省寧波市政府的支持下,“浙江人形機(jī)器人創(chuàng)新中心”正式啟動(dòng)了,也推出了首代產(chǎn)品——領(lǐng)航者1 號(hào),這是在他們前面的基礎(chǔ)上進(jìn)一步做了一些優(yōu)化改進(jìn)。同時(shí)也更強(qiáng)調(diào)賦予它“類人學(xué)習(xí)”和“操作”能力。

        目前行走已完成了在室內(nèi)平整地面的測(cè)試,也會(huì)進(jìn)一步去驗(yàn)證之前在“悟空4”上面所實(shí)現(xiàn)的對(duì)各種地形的適應(yīng)。但是這一代會(huì)更去強(qiáng)調(diào)動(dòng)作的擬人性,例如能否讓它站起來一點(diǎn)兒,不要老是彎著腿。另外,因?yàn)樵O(shè)計(jì)時(shí)沒有考慮手會(huì)和腿碰觸,所以在走路的時(shí)候還是把兩個(gè)手舉在那里,來保證它不會(huì)產(chǎn)生干擾。所以這些都是下一代產(chǎn)品需要去進(jìn)一步優(yōu)化改進(jìn)的地方。

        在前面的基礎(chǔ)上,正在思考把熊蓉教授團(tuán)隊(duì)的這種機(jī)理模型和模仿學(xué)習(xí)怎么去結(jié)合起來,能夠快速地實(shí)現(xiàn)。他們過去還是做的仿真,現(xiàn)在打通了仿真到實(shí)物的這條通路,實(shí)現(xiàn)了從人到仿真到實(shí)物的回路,以期實(shí)現(xiàn)把人的動(dòng)作快速映射到機(jī)器人上面。

        另外,現(xiàn)在也正在結(jié)合強(qiáng)化學(xué)習(xí),讓它適應(yīng)各種場(chǎng)景——在執(zhí)行各種動(dòng)作的過程中,依然能夠保持平衡控制——這還是屬于概念性的,是正在做的研發(fā)。

        10)倒水添茶和插插頭

        熊蓉教授團(tuán)隊(duì)在前面對(duì)于環(huán)境物體的檢測(cè)識(shí)別以及行為決策規(guī)劃基礎(chǔ)上,做了一個(gè)集成的demo(圖5),它能夠去倒水添茶,包括人喝完以后它能夠自動(dòng)地檢測(cè)到,然后完成添茶的工作。人放回去的茶杯也是可以任意放置的,機(jī)器人會(huì)有算法對(duì)物體進(jìn)行檢測(cè)以后進(jìn)行一個(gè)精確的定位,然后來進(jìn)行它的行為的決策和規(guī)劃控制。

        1743997446416528.png

        圖5 端到端的自動(dòng)加水

        熊蓉教授團(tuán)隊(duì)也把前述的對(duì)各種動(dòng)態(tài)的適應(yīng)性做了一個(gè)演示,例如機(jī)器人可以去抓插頭,并插到插座上。

        插座可以任意地放置,機(jī)器人會(huì)實(shí)現(xiàn)動(dòng)態(tài)的跟蹤。

        關(guān)于速度,考慮到定位的精確性,整個(gè)速度還是比較慢的。下一步將會(huì)提高它的節(jié)拍,以滿足生產(chǎn)上的高節(jié)拍要求。

        同時(shí),也把作業(yè)的能力通過跟持續(xù)進(jìn)化結(jié)合起來,從原來的0.1 mm 的精準(zhǔn)對(duì)接,現(xiàn)在能夠?qū)崿F(xiàn)0.03 mm的對(duì)接(USB 的定位精度在0.1 mm 左右)。這也是通過自主學(xué)習(xí)的方式來實(shí)現(xiàn)的。

        熊蓉教授團(tuán)隊(duì)也研發(fā)了一個(gè)“靈巧手”,能夠?qū)崿F(xiàn)更快速度的操作,下一步希望能夠去提升其魯棒性。

        3   發(fā)展趨勢(shì)與挑戰(zhàn)

        真正的人形機(jī)器人要用到實(shí)際的場(chǎng)景里,形成一個(gè)產(chǎn)品,還有很多挑戰(zhàn)。

        作為一個(gè)產(chǎn)品,要實(shí)現(xiàn)高可靠、高性能、低成本。

        1)亟需高性能、高可靠、低成本的核心零部件

        整機(jī)的可靠性需要進(jìn)一步提升,成本要降低,這依賴于核心零部件。核心零部件雖然現(xiàn)在很多,但是還有發(fā)展空間。例如動(dòng)力部件的功率密度與人形機(jī)器人真正實(shí)現(xiàn)靈巧運(yùn)動(dòng)還有一定差距。也許力矩、速度足夠了,但是體積、重量太大,使人形機(jī)器人比較笨重、有一定的威脅感。傳感器也一樣,如何在小體積下做到高精度和高動(dòng)態(tài)響應(yīng),也是面臨的問題。

        除了產(chǎn)業(yè)界在做,學(xué)術(shù)界也在探索一些新的驅(qū)動(dòng)機(jī)理方法,有可能會(huì)形成下一代變革性的方法。

        2)運(yùn)動(dòng)控制

        人形機(jī)器人要實(shí)現(xiàn)各種靈巧的運(yùn)動(dòng)作業(yè),運(yùn)動(dòng)控制是一個(gè)非常重要的基礎(chǔ)。

        現(xiàn)在已經(jīng)有了很好的基礎(chǔ),各種技術(shù)路線也有突破,能夠去展示一定的能力。但是它對(duì)作業(yè)對(duì)象的適應(yīng)性、環(huán)境的適應(yīng)性還是非常有限的。如何去把機(jī)器人、環(huán)境、任務(wù)融合起來,如何把現(xiàn)在的三條技術(shù)路線真正地去打通和推動(dòng),也依然是需要探索的。

        3)人工智能

        目前大模型非常熱,但是如果真正把大模型部署到機(jī)器人/ 某一環(huán)境里,會(huì)發(fā)現(xiàn)還有很多局限性。例如端茶倒水的,熊蓉教授團(tuán)隊(duì)也想到用大模型去做,結(jié)果發(fā)現(xiàn)放一套茶具上去,有可能檢測(cè)不出來,哪怕把茶具分開了,也檢測(cè)不出來。

        可見,現(xiàn)在的大模型依然依靠“見過”的數(shù)據(jù),有一定的泛化能力,但是距離真正的泛化能力還是有一定的距離。

        大模型是人的多元智能里的“基礎(chǔ)知識(shí)”的一部分,它賦予了語言智能、空間智能、邏輯推理的智能。但是機(jī)器人是在一定環(huán)境里去工作的,也是現(xiàn)在AI 提的具身智能(圖6)。

        1743997527550876.png

        圖6 人的多元智能

        實(shí)際上,機(jī)器人專家一直在做具身智能的研究,讓機(jī)器人能夠去適應(yīng)各種環(huán)境條件,自我監(jiān)測(cè),人- 機(jī)自然友好地交互協(xié)作。

        之前沒有大模型時(shí),機(jī)器人專家往往也在把一些AI技術(shù)結(jié)合進(jìn)來,人為定義一些知識(shí)庫、規(guī)則等?,F(xiàn)在有了大模型,相當(dāng)于給機(jī)器人的專家提供了一個(gè)更好的基礎(chǔ)模型支持。但是這個(gè)模型里還有很多不足,甚至有錯(cuò)誤,如何融合到機(jī)器人里,實(shí)現(xiàn)它真正能夠作業(yè)的具身智能,也是現(xiàn)在要去研究探索的。

        同時(shí),相信具身智能的研究也會(huì)反過來去推動(dòng)大模型,使其更加準(zhǔn)確。

        參考文獻(xiàn):

        [1] 迎九.褚君浩院士:人形機(jī)器人的感知發(fā)展與探索.EEPW,2024(6):1-5.

        [2] “人形機(jī)器人”的智能感知與控制技術(shù).EEPW,2024(7):22-25.

        [3] 工信部.關(guān)于組織開展2023年未來產(chǎn)業(yè)創(chuàng)新任務(wù)揭榜掛帥申報(bào)工作的通知.(2023-9-13).

        (本文來源于《EEPW》



        關(guān)鍵詞: 202408 人形機(jī)器人

        評(píng)論


        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 深泽县| 寿光市| 合山市| 中西区| 定边县| 日照市| 宣汉县| 建湖县| 绥宁县| 沐川县| 晋江市| 嘉荫县| 厦门市| 新乡县| 安福县| 潮州市| 临朐县| 晋中市| 灵台县| 新龙县| 胶州市| 淳安县| 临夏县| 大埔县| 兴国县| 馆陶县| 新宁县| 安庆市| 英吉沙县| 吴川市| 辛集市| 花垣县| 南皮县| 宁阳县| 铜梁县| 民勤县| 崇信县| 枣强县| 牙克石市| 襄城县| 北流市|