[發明專利]用于機器人抓取的深度機器學習方法和裝置有效
| 申請號: | 201780018883.0 | 申請日: | 2017-03-02 |
| 公開(公告)號: | CN108885715B | 公開(公告)日: | 2020-06-26 |
| 發明(設計)人: | 蘇達赫恩德拉·維婭亞納拉辛漢;章繼鴻;彼得·帕斯特桑佩德羅;謝爾蓋·萊文 | 申請(專利權)人: | 谷歌有限責任公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G05B13/00;G05B13/02;G06N3/08 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 李寶泉;周亞榮 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 機器人 抓取 深度 機器 學習方法 裝置 | ||
與由機器人的末端執行器對物體的操縱有關的深度機器學習方法和裝置。一些實施方式涉及訓練語義抓取模型以預測指示機器人的末端執行器的運動數據是否將導致對物體的成功抓取的量度;并且預測指示所述物體是否具有期望的語義特征的附加量度。一些實施方式涉及利用經訓練的語義抓取模型來伺服機器人的抓取末端執行器以實現對具有期望的語義特征的物體的成功抓取。
背景技術
許多機器人被編程為利用一個或多個末端執行器來抓取一個或多個物體。例如,機器人可以利用諸如“沖擊式(impactive)”抓爪或“侵入式(ingressive)”抓爪的抓取末端執行器(例如,使用銷、針等在物理上穿透物體)來從第一定位拾取物體,將該物體移動到第二定位,并且在第二定位處放下該物體。可以抓取物體的機器人末端執行器的一些附加示例包括“收縮式(astrictive)”末端執行器(例如,使用抽吸或真空來拾取物體)和一個或多個“接觸式(contigutive)”末端執行器(例如,使用表面張力、冷凍或粘合劑來拾取物體),僅舉幾例。
發明內容
本說明書大體涉及與通過機器人的末端執行器對物體的操縱有關的深度機器學習方法和裝置。一些實施方式涉及訓練抓取深度神經網絡,諸如卷積神經網絡(在本文中也稱為“CNN”),以預測用于機器人的末端執行器的候選運動數據將導致通過末端執行器對一個或多個物體的成功抓取的概率和/或預測空間變換器網絡(在本文中也稱為“STN”)的空間變換參數。例如,一些實施方式使得能夠應用以下來作為對訓練的抓取深度神經網絡的輸入:(1)定義機器人的抓取末端執行器的候選運動(若有的話)的候選運動矢量以及(2)捕獲機器人的工作空間的至少一部分的圖像;以及基于所述應用來生成:(1)直接地或間接地指示候選運動矢量將導致成功抓取的概率的量度;和/或(2)指示抓取末端執行器將移向的圖像(或附加圖像)中的定位的空間變換參數。然后,可以在伺服通過具有抓取末端執行器的機器人的抓取嘗試的執行時使用指示概率的量度和/或空間變換參數,從而改進機器人成功地抓取其環境中的物體的能力。
那些實施方式中的一些還涉及訓練空間變換器網絡以基于接收到的空間變換參數來生成圖像的空間變換和/或涉及訓練語義深度神經網絡(例如,語義CNN)以基于空間變換來預測空間變換中的物體的類別(和/或其它語義特征)。在那些實施方式的一些版本中,可以基于以下兩者來訓練語義深度神經網絡:基于通過一個或多個機器人的抓取嘗試而生成的訓練樣本;以及來自包括不是基于通過一個或多個機器人的抓取嘗試而生成的訓練樣本(例如,來自IMAGENET圖像數據庫的訓練樣本)的其它計算機視覺數據集的訓練樣本。使用來自其它計算機視覺數據集的訓練樣本可以增加語義深度神經網絡的語義理解的準確度和/或廣度。
一些實施方式涉及利用經訓練的抓取深度神經網絡、經訓練的空間變換器網絡和/或經訓練的語義神經網絡來伺服機器人的抓取末端執行器以實現通過抓取末端執行器對具有期望的語義物體特征的物體的成功抓取。例如,可以在機器人的控制該機器人的抓取末端執行器的姿態的一個或多個致動器的運動控制命令的迭代更新中利用各個訓練的網絡,并且可以利用各個訓練的網絡來確定何時生成抓取控制命令以通過抓取末端執行器實現嘗試的抓取。例如,可以僅當在抓取深度神經網絡上生成的輸出指示成功抓取的可能性滿足閾值時并且當在語義深度神經網絡上生成的輸出指示抓取將很可能是針對具有期望的語義物體特征的物體的時,生成抓取控制命令并將它提供給對應致動器。
使用訓練的網絡來實現對具有期望的語義物體特征的物體的成功抓取可以使得機器人能夠執行針對具有特定物體特征的物體的各個動作,其中那些特定物體特征由人類生成的用戶接口輸入和/或由另一組件(例如,更高級的任務計劃器)規定。例如,用戶可以提供指示期望抓取具有一個或多個特定物體特征的物體的用戶接口輸入(例如,口頭的、鍵入的),并且只有當如下情況時機器人才可以利用經訓練的網絡來嘗試抓取:抓取很可能成功并且很可能是針對具有特定物體特征的物體的。例如,用戶可以提供“拾取勺子”的用戶接口輸入并且機器人可以基于在抓取深度神經網絡上生成的指示抓取很可能成功的輸出并且基于在語義深度神經網絡上生成的指示抓取很可能是針對具有“勺子”的分類的物體的輸出來嘗試抓取。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于谷歌有限責任公司,未經谷歌有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780018883.0/2.html,轉載請聲明來源鉆瓜專利網。





