[發明專利]一種基于深度學習的機器人避障軌跡規劃方法及系統在審
| 申請號: | 201810863999.0 | 申請日: | 2018-08-01 |
| 公開(公告)號: | CN109213147A | 公開(公告)日: | 2019-01-15 |
| 發明(設計)人: | 劉成良;陶建峰;覃程錦;劉宸;方曄陽;虞潔攀 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G05D1/02 | 分類號: | G05D1/02;G06F17/50;G06N3/04 |
| 代理公司: | 上海漢聲知識產權代理有限公司 31236 | 代理人: | 莊文莉 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積神經網絡 機器人避障 仿真環境 軌跡規劃 一維向量 更新 角度拍攝圖像 工業機器人 工業自動化 仿真軟件 接口調用 卷積運算 輸入信息 圖像輸入 循環執行 自主避障 機械臂 連接層 目標點 特征圖 學習 照相機 生產能力 圖像 | ||
1.一種基于深度學習的機器人避障軌跡規劃方法,其特征在于,包括:
圖像輸入步驟:在仿真環境中加入照相機,從多個角度拍攝圖像并同時輸入到卷積神經網絡中;
新姿態獲取步驟:根據輸入信息得到機械臂更新角度的信息,通過接口調用仿真軟件進行更新,獲取姿態;
網絡訓練步驟:用深度學習進行卷積神經網絡訓練,輸入的圖像經過卷積運算后,將得到的特征圖變成一個一維向量,將一維向量輸入到后續的全連接層中,得到每個動作對應的q值,選擇q值最大的動作并更新姿態,將更新姿態傳入仿真環境得到新的圖像輸入;
循環執行網絡訓練步驟,直至達到目標點。
2.根據權利要求1所述的基于深度學習的機器人避障軌跡規劃方法,其特征在于,所述網絡訓練步驟中,每個動作都會得到一個獎勵,獎勵分為三部分:
第一部分:每次動作之后都會得到一個負的獎勵;
第二部分:每次動作之后都會得到一個負的獎勵,在沒有觸碰到障礙物之前,距離障礙物越近則得到的負的獎勵越大,碰到障礙物后則停止循環,并給予一個更大的負的獎勵;
第三部分:每次動作之后都會得到一個正的獎勵,在沒有到達目標點之前,距離目標點越近,則得到的正的獎勵越大,在到達目標點之后,得到一個更大的正的獎勵并結束此次循環,進行下一次探索。
3.根據權利要求2所述的基于深度學習的機器人避障軌跡規劃方法,其特征在于,在所述網絡訓練步驟之后還包括:
經驗池采樣步驟:所有探索得到的結果都放入經驗池中,后續每選擇完一個動作都要在經驗池中進行采樣并使用采樣的數據對卷積神經網絡進行訓練。
4.根據權利要求3所述的基于深度學習的機器人避障軌跡規劃方法,其特征在于,在所述經驗池采樣步驟之后還包括:
輸出步驟:根據訓練好的卷積神經網絡輸出的最優的路徑規劃軌跡。
5.根據權利要求1所述的基于深度學習的機器人避障軌跡規劃方法,其特征在于,在所述圖像輸入步驟之前還包括:
算法初始化步驟:確定算法的初始條件,并進行算法初始化;
機械臂建模步驟:對算法中使用的機械臂進行建模,將得到的模型導入仿真軟件,對各個關節進行約束設置。
6.一種基于深度學習的機器人避障軌跡規劃系統,其特征在于,包括:
圖像輸入模塊:在仿真環境中加入照相機,從多個角度拍攝圖像并同時輸入到卷積神經網絡中;
新姿態獲取模塊:根據輸入信息得到機械臂更新角度的信息,通過接口調用仿真軟件進行更新,獲取姿態;
網絡訓練模塊:用深度學習進行卷積神經網絡訓練,輸入的圖像經過卷積運算后,將得到的特征圖變成一個一維向量,將一維向量輸入到后續的全連接層中,得到每個動作對應的q值,選擇q值最大的動作并更新姿態,將更新姿態傳入仿真環境得到新的圖像輸入,循環執行直至達到目標點。
7.根據權利要求6所述的基于深度學習的機器人避障軌跡規劃系統,其特征在于,所述網絡訓練模塊中,每個動作都會得到一個獎勵,獎勵分為三部分:
第一部分:每次動作之后都會得到一個負的獎勵;
第二部分:每次動作之后都會得到一個負的獎勵,在沒有觸碰到障礙物之前,距離障礙物越近則得到的負的獎勵越大,碰到障礙物后則停止循環,并給予一個更大的負的獎勵;
第三部分:每次動作之后都會得到一個正的獎勵,在沒有到達目標點之前,距離目標點越近,則得到的正的獎勵越大,在到達目標點之后,得到一個更大的正的獎勵并結束此次循環,進行下一次探索。
8.根據權利要求7所述的基于深度學習的機器人避障軌跡規劃系統,其特征在于,還包括:
經驗池采樣模塊:所有探索得到的結果都放入經驗池中,后續每選擇完一個動作都要在經驗池中進行采樣并使用采樣的數據對卷積神經網絡進行訓練。
9.根據權利要求8所述的基于深度學習的機器人避障軌跡規劃系統,其特征在于,還包括:
輸出模塊:根據訓練好的卷積神經網絡輸出的最優的路徑規劃軌跡。
10.根據權利要求6所述的基于深度學習的機器人避障軌跡規劃系統,其特征在于,還包括:
算法初始化模塊:確定算法的初始條件,并進行算法初始化;
機械臂建模模塊:對算法中使用的機械臂進行建模,將得到的模型導入仿真軟件,對各個關節進行約束設置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810863999.0/1.html,轉載請聲明來源鉆瓜專利網。





