博客專欄

        EEPW首頁 > 博客 > 哥倫比亞大學(xué)「機(jī)械手」無需提前了解抓握物體,也能靈活適應(yīng)形狀!

        哥倫比亞大學(xué)「機(jī)械手」無需提前了解抓握物體,也能靈活適應(yīng)形狀!

        發(fā)布人:大數(shù)據(jù)文摘 時間:2021-11-11 來源:工程師 發(fā)布文章

        以下文章來源于機(jī)器人大講堂 ,作者Robospeak

        人類天生擁有先進(jìn)而靈活的手部操縱能力,能夠輕松完成日常很多動作,例如移動物體、開門、打字、繪畫等。

        但對機(jī)器人來說,要實現(xiàn)多任務(wù)操控,并根據(jù)不同物體適應(yīng)最合適的抓握手勢,這可是件難事。

        那該如何控制機(jī)械手實現(xiàn)日常操作呢?

        很多靈活強(qiáng)大的機(jī)械手使用了無模型強(qiáng)化學(xué)習(xí)技術(shù)(RL)來進(jìn)行精確抓握,這種方法通用性很強(qiáng),它無需過多假設(shè),而且能自動掌握很多技能。由于這種方法除了建立函數(shù)無需其他信息,所以很容易在改進(jìn)后的環(huán)境中重新學(xué)習(xí)技能,例如更換了目標(biāo)物體或機(jī)械手。

        1.jpg

        但大部分情況下,這種策略需要外部傳感信息,例如,用多攝像頭系統(tǒng)來跟蹤手指或物體,然而這種系統(tǒng)很難部署在實驗室以外的環(huán)境。

        為了解決該問題,哥倫比亞大學(xué)機(jī)器人操作和移動實驗室的研究人員首次將無模型強(qiáng)化學(xué)習(xí)技術(shù)(RL)與本體觸覺反饋相結(jié)合,在沒有任何外部信息、機(jī)械手也不知道物體形狀的情況下,僅利用“觸覺感知”就能靈活操縱物體。

        2.gif

        無需提前了解抓握物體,也能靈活適應(yīng)形狀

        將觸覺反饋與強(qiáng)化學(xué)習(xí)集成在一起,本身就是一個挑戰(zhàn)。

        觸覺反饋通常是高維的,這會極大地增加強(qiáng)化學(xué)習(xí)所需的訓(xùn)練樣本數(shù)量。因此,大多數(shù)使用強(qiáng)化算法控制機(jī)械手的工作要么完全避免使用觸覺反饋,要么考慮需要較少訓(xùn)練樣本的任務(wù)。

        3.gif

        為了避免大量的訓(xùn)練樣本,研究人員考慮僅使用內(nèi)部感知,不關(guān)注被抓物體的形狀,而是專注于讓機(jī)械手學(xué)習(xí)手指手勢(包括手指替換和重新抓握的操作)和手指旋轉(zhuǎn)(涉及手指抓握中的物體的操作)技能,這些不受手的運(yùn)動學(xué)約束的限制,可以實現(xiàn)潛在的物體形狀重新定向。

        4.gif

        這個機(jī)械手并不包含手掌,所以可將手指的手勢學(xué)習(xí)主要集中在主軸旋轉(zhuǎn),然后為每個軸獲得的手指采集策略以適當(dāng)?shù)捻樞蚪M合,以實現(xiàn)目標(biāo)方向的期望變化。

        5.jpg6.jpg

        穩(wěn)定抓取采樣,減少隨機(jī)性

        僅用內(nèi)部感知學(xué)習(xí)手勢的方法有一定的缺點(diǎn):行動隨機(jī)化。

        隨機(jī)的探索動作容易擾亂精確抓握的物體的穩(wěn)定性,導(dǎo)致其掉落,因此需要對手指位置穩(wěn)定抓取采樣(SGS),以訓(xùn)練穩(wěn)定的抓握軌跡。

        7.gif

        為了對手部姿勢進(jìn)行采樣,研究人員首先對物體周圍的環(huán)內(nèi)指尖位置進(jìn)行采樣,該環(huán)以物體為中心并與其部分重疊,因此指尖接觸物體和保持自由的概率大致相同。通過這個過程,不僅可以找到與手指步態(tài)和手指旋轉(zhuǎn)相關(guān)的穩(wěn)定抓握,還可以提高發(fā)現(xiàn)它們的可能性,從而最大限度地減少訓(xùn)練時間。

        8.gif

        第一個將內(nèi)在觸感與強(qiáng)化學(xué)習(xí)結(jié)合的實例

        這項研究的預(yù)印本發(fā)表在arXiv上,論文標(biāo)題為《On the Feasibility of Learning Finger-gaiting In-hand Manipulation withIntrinsic Sensing》。

        9.jpg

        為了促進(jìn)未來在真實場景中的部署,限制外部視覺或跟蹤傳感器等信息是很有必要的。這項研究是第一個成功地使用僅內(nèi)在傳感信息進(jìn)行訓(xùn)練的機(jī)械手實例,論文的第一作者,Gagan Khandate認(rèn)為:“這項工作是邁向未來機(jī)械手操縱方向的非常有用的一步,不僅如此,我們在不使用手掌或其他表面進(jìn)行被動支持的情況下,也能實現(xiàn)機(jī)械手的穩(wěn)定操作技能。”

        論文鏈接:

        https://arxiv.org/abs/2109.12720

        *博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。



        關(guān)鍵詞: AI

        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 深水埗区| 民和| 聂拉木县| 诸暨市| 永年县| 察隅县| 湄潭县| 博湖县| 广丰县| 平邑县| 山丹县| 康保县| 兴化市| 瓦房店市| 高雄市| 新津县| 城口县| 铜梁县| 南阳市| 阜阳市| 临沭县| 老河口市| 安化县| 大安市| 稻城县| 荔波县| 信阳市| 裕民县| 溆浦县| 苏尼特右旗| 准格尔旗| 手游| 松潘县| 永定县| 泾源县| 寿阳县| 祁门县| 工布江达县| 丽水市| 嵊州市| 博兴县|