[發(fā)明專利]用于機(jī)器人抓取的深度機(jī)器學(xué)習(xí)方法和裝置在審
| 申請?zhí)枺?/td> | 202010527977.4 | 申請日: | 2017-03-02 |
| 公開(公告)號: | CN111832702A | 公開(公告)日: | 2020-10-27 |
| 發(fā)明(設(shè)計)人: | 蘇達(dá)赫恩德拉·維婭亞納拉辛漢;章繼鴻;彼得·帕斯特桑佩德羅;謝爾蓋·萊文 | 申請(專利權(quán))人: | 谷歌有限責(zé)任公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06N3/00;B25J9/16;B25J13/08;B25J15/08 |
| 代理公司: | 中原信達(dá)知識產(chǎn)權(quán)代理有限責(zé)任公司 11219 | 代理人: | 李寶泉;任慶威 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 機(jī)器人 抓取 深度 機(jī)器 學(xué)習(xí)方法 裝置 | ||
本發(fā)明涉及用于機(jī)器人抓取的深度機(jī)器學(xué)習(xí)方法和裝置。一些實(shí)施方式涉及訓(xùn)練語義抓取模型以預(yù)測指示機(jī)器人的末端執(zhí)行器的運(yùn)動數(shù)據(jù)是否將導(dǎo)致對物體的成功抓取的量度;并且預(yù)測指示所述物體是否具有期望的語義特征的附加量度。一些實(shí)施方式涉及利用經(jīng)訓(xùn)練的語義抓取模型來伺服機(jī)器人的抓取末端執(zhí)行器以實(shí)現(xiàn)對具有期望的語義特征的物體的成功抓取。
本申請屬于申請日為2017年3月2日的中國發(fā)明專利申請No.201780018883.0的分案申請。
背景技術(shù)
許多機(jī)器人被編程為利用一個或多個末端執(zhí)行器來抓取一個或多個物體。例如,機(jī)器人可以利用諸如“沖擊式(impactive)”抓爪或“侵入式(ingressive)”抓爪的抓取末端執(zhí)行器(例如,使用銷、針等在物理上穿透物體)來從第一定位拾取物體,將該物體移動到第二定位,并且在第二定位處放下該物體。可以抓取物體的機(jī)器人末端執(zhí)行器的一些附加示例包括“收縮式(astrictive)”末端執(zhí)行器(例如,使用抽吸或真空來拾取物體)和一個或多個“接觸式(contigutive)”末端執(zhí)行器(例如,使用表面張力、冷凍或粘合劑來拾取物體),僅舉幾例。
發(fā)明內(nèi)容
本說明書大體涉及與通過機(jī)器人的末端執(zhí)行器對物體的操縱有關(guān)的深度機(jī)器學(xué)習(xí)方法和裝置。一些實(shí)施方式涉及訓(xùn)練抓取深度神經(jīng)網(wǎng)絡(luò),諸如卷積神經(jīng)網(wǎng)絡(luò)(在本文中也稱為“CNN”),以預(yù)測用于機(jī)器人的末端執(zhí)行器的候選運(yùn)動數(shù)據(jù)將導(dǎo)致通過末端執(zhí)行器對一個或多個物體的成功抓取的概率和/或預(yù)測空間變換器網(wǎng)絡(luò)(在本文中也稱為“STN”)的空間變換參數(shù)。例如,一些實(shí)施方式使得能夠應(yīng)用以下來作為對訓(xùn)練的抓取深度神經(jīng)網(wǎng)絡(luò)的輸入:(1)定義機(jī)器人的抓取末端執(zhí)行器的候選運(yùn)動(若有的話)的候選運(yùn)動矢量以及(2)捕獲機(jī)器人的工作空間的至少一部分的圖像;以及基于所述應(yīng)用來生成:(1)直接地或間接地指示候選運(yùn)動矢量將導(dǎo)致成功抓取的概率的量度;和/或(2)指示抓取末端執(zhí)行器將移向的圖像(或附加圖像)中的定位的空間變換參數(shù)。然后,可以在伺服通過具有抓取末端執(zhí)行器的機(jī)器人的抓取嘗試的執(zhí)行時使用指示概率的量度和/或空間變換參數(shù),從而改進(jìn)機(jī)器人成功地抓取其環(huán)境中的物體的能力。
那些實(shí)施方式中的一些還涉及訓(xùn)練空間變換器網(wǎng)絡(luò)以基于接收到的空間變換參數(shù)來生成圖像的空間變換和/或涉及訓(xùn)練語義深度神經(jīng)網(wǎng)絡(luò)(例如,語義CNN)以基于空間變換來預(yù)測空間變換中的物體的類別(和/或其它語義特征)。在那些實(shí)施方式的一些版本中,可以基于以下兩者來訓(xùn)練語義深度神經(jīng)網(wǎng)絡(luò):基于通過一個或多個機(jī)器人的抓取嘗試而生成的訓(xùn)練樣本;以及來自包括不是基于通過一個或多個機(jī)器人的抓取嘗試而生成的訓(xùn)練樣本(例如,來自IMAGENET圖像數(shù)據(jù)庫的訓(xùn)練樣本)的其它計算機(jī)視覺數(shù)據(jù)集的訓(xùn)練樣本。使用來自其它計算機(jī)視覺數(shù)據(jù)集的訓(xùn)練樣本可以增加語義深度神經(jīng)網(wǎng)絡(luò)的語義理解的準(zhǔn)確度和/或廣度。
一些實(shí)施方式涉及利用經(jīng)訓(xùn)練的抓取深度神經(jīng)網(wǎng)絡(luò)、經(jīng)訓(xùn)練的空間變換器網(wǎng)絡(luò)和/或經(jīng)訓(xùn)練的語義神經(jīng)網(wǎng)絡(luò)來伺服機(jī)器人的抓取末端執(zhí)行器以實(shí)現(xiàn)通過抓取末端執(zhí)行器對具有期望的語義物體特征的物體的成功抓取。例如,可以在機(jī)器人的控制該機(jī)器人的抓取末端執(zhí)行器的姿態(tài)的一個或多個致動器的運(yùn)動控制命令的迭代更新中利用各個訓(xùn)練的網(wǎng)絡(luò),并且可以利用各個訓(xùn)練的網(wǎng)絡(luò)來確定何時生成抓取控制命令以通過抓取末端執(zhí)行器實(shí)現(xiàn)嘗試的抓取。例如,可以僅當(dāng)在抓取深度神經(jīng)網(wǎng)絡(luò)上生成的輸出指示成功抓取的可能性滿足閾值時并且當(dāng)在語義深度神經(jīng)網(wǎng)絡(luò)上生成的輸出指示抓取將很可能是針對具有期望的語義物體特征的物體的時,生成抓取控制命令并將它提供給對應(yīng)致動器。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于谷歌有限責(zé)任公司,未經(jīng)谷歌有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010527977.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





