“多模態觸覺感知”為何能讓機器人精巧操作
在“2025第三屆具身智能機器人產業發展論壇”上,千覺機器人創始人兼首席科學家馬道林先生稱,觸覺不僅是機器人感知的一種延伸,也是智能體和環境交互的一種語言。相信未來隨著技術的發展,觸覺給具身智能帶來接近或像人類一樣的觸感。
過去兩年,越來越多的人關注具身賽道。而之前,人們會關注機器人的行為能力,不管是跑酷還是翻跟頭,但是這兩年人們已經越來越關注到機器人產業未來要真正落地,核心的能力應該是什么?
首先,移動很重要,是基礎。
其次是雙手,讓機器人能夠像人一樣具有靈巧、精細的操作能力。
1 與自動駕駛相比
人們會用自動駕駛行業的一些經驗來類比具身接下來的發展。做自動駕駛與現在做具身的不同之處在于:開汽車的時候主要是規避障礙,其感知系統(激光雷達、攝像頭等)都是在觀察周圍的物理世界,去識別其中的障礙,從而避免接觸或碰撞障礙。
但是造機器人的目的是為了在生產和生活中為我們服務,所以必須要跟我們的周圍世界去發生接觸。所以手部精細操作能力的構建,本質上在于讓機器人如何去思考、規劃和控制自己去控制和接觸的能力。
2 人是怎么具有精細操作能力的?
人控制自己肢體的精度是較低的,不像工業機器人有時是零點零幾毫米的重復定位精度,人控制肢體的時候往往是厘米級的誤差,但是有些“大國工匠”可以達到微米級的加工精度,這個精度是怎么做到的?一定來自于一個閉環的控制系統,而閉環的控制很大程度上來源于觸覺。
在工業中經常有視覺定位系統,精度通常在毫米量級,很難達到微米級的精度;但是有了觸覺的閉環,就能夠完成微米級的動作。因此人們也希望機器人能夠在觸覺賦能之下達到這種控制精度。
人手的指尖具有最高精度的觸覺感受器,因此人手包括皮膚能夠感受到多種模態的觸覺信息,包括運動、滑動、力、溫度等,這些多模態的觸覺信息給到我們的大腦和小腦之后,大腦和小腦協同起來去控制,控制我們的手臂、手腕、手指的各個肌肉,從而去形成這些部位的協同。這種控制的閉環是我們人去完成精細操作的關鍵。
機器人也需要具有構建這幾個模塊的能力。即在硬件上,具有觸覺感知的硬件基礎,即高分辨率、高集成度的觸覺傳感器。基于這些觸覺傳感器去實現多維度、多模態的觸覺感知能力,像人一樣去感受到真實的物理接觸,包括法向力、切向力、滑動、溫度、運動等。
這些多模態的信息收集到之后,機器人公司去訓練機器人的模型,使機器人通過大量多模態的信息和強大的神經網絡系統,去控制其動作,來完成控制閉環。
3 千覺機器人的觸覺感知軟硬件系統
千覺機器人就從事這樣的業務,提供具有強大的觸覺感知能力的硬件和軟件系統。
●?首先具有硬件的設計能力,并且實現了小型化,只有像人的手指大小的觸覺傳感器。
例如對運動的感知。過去通常人們提到觸覺都會想到是測力的感知,但是人手還能感知到運動的信息,例如一個工人去做裝配的時候,零部件的微小擾動都在人的感知體系之內。
對力的感知,不僅要知道法向的接觸力,還要知道切向的接觸力,也就是要知道摩擦力是什么狀態,從而在三維的空間里完整感受到三維的相互作用 / 滑動的狀態、溫度等。
當給機器人充分的多模態信息之后,機器人基于觸覺就可以做一些以往自動化控制所做不了的事,例如人去使用螺絲刀等工具時,人在控制的接觸行為不只是手和工具之間的接觸狀態,還在控制手里工具的周圍目標環境。例如,人拿著螺絲刀希望擰動一個螺絲的時候,實際上還在去控制的是螺絲刀與螺絲之間的接觸行為。
但是螺絲刀和螺絲之間并沒有傳感器,那么人的這種感知是間接的,依賴于手指和螺絲刀之間的觸覺感知信號的復雜處理。
機器人如何去處理這么復雜的信息?
當人能夠給到機器人這些豐富的信息之后,機器人如何去處理如此復雜的信息?它的觸覺感知信息的維度很多,分辨率也很高,如此復雜的信息已經不是傳統的力控所涵蓋的范圍了(注:通常比較傳統的力控要有一個模型,最好還是一個低維的系統模型)。現在在AI工具之下,可以把更豐富的信息給到機器人,例如把多模態的觸覺信息給到機器人之后,讓機器人去做諸如裝配誤差的校正。這時視覺系統告訴你,從A點拿一個零件到B點去進行裝配,那么視覺的定位誤差或者你去抓取目標的時候就已經有零點幾毫米的誤差,如果沒有裝進去,最后1毫米之內的誤差校正是要依靠觸覺的,而不是依靠高清/ 離得很近的攝像頭。這就像工人閉著眼睛就可以完成工作一樣,是觸覺可以讓機器人做這種微小的誤差校正。
● 觸覺仿真器
千覺也提供觸覺仿真器。因為數據對具身智能是至關重要的。
在數據獲取層面,具身機器人和自動駕駛行業不太一樣的點是:沒有自動駕駛能力的汽車也能賣出去,通過這些沒有自動駕駛能力的汽車或者只有初步自動駕駛能力的汽車賣出去之后,客戶是可以給車企反饋數據的。
但是機器人行業并非如此——一個笨拙的機器人是不會被人買回家的;另一方面,如果讓每家廠家去實采大體量的真實數據,代價很高昂。因此可以在仿真里去獲得數據。但是目前比較通用的機器人仿真器里沒有觸覺的模態(注:視覺的仿真、渲染已有很長時間)。觸覺是一個嶄新的信息模態。因此千覺開發了相應的觸覺仿真器,讓它能夠真實反映機器人的接觸狀態,并且集成到了現在人們用得比較多的Xense_Sim里,讓機器人能夠獲得非常高逼真度的觸覺數據。
(本文來源于《EEPW》202505)
評論