[發明專利]機械學習裝置及方法、機器人系統有效
| 申請號: | 201811360279.9 | 申請日: | 2016-07-29 |
| 公開(公告)號: | CN109434832B | 公開(公告)日: | 2022-04-26 |
| 發明(設計)人: | 津田丈嗣;岡野原大輔;奧田遼介;松元睿一;河合圭悟 | 申請(專利權)人: | 發那科株式會社;優選網絡公司 |
| 主分類號: | B25J9/16 | 分類號: | B25J9/16;B25J13/00;B25J13/08 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 曾賢偉;郝慶芬 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 機械 學習 裝置 方法 機器人 系統 | ||
1.一種機械學習裝置,其特征在于,具備:
狀態觀測部,其取得在人與機器人協作來進行作業的期間的表示上述機器人的狀態的狀態變量;
判定數據取得部,其取得與上述人的負擔度以及作業效率中的至少一方相關的判定數據;
回報計算部,其根據上述判定數據設定上述人的負擔度越小、或者上述作業效率越高則越大的回報;以及
函數更新部,其根據上述回報以及上述狀態變量,更新表示用于設定上述機器人的行為的函數的神經網絡。
2.根據權利要求1所述的機械學習裝置,其特征在于,
上述狀態變量包括上述機器人的位置、姿勢、速度以及加速度中的至少一個。
3.根據權利要求1所述的機械學習裝置,其特征在于,
上述判定數據是基于在上述協作作業中上述人施加的力而計算出的。
4.根據權利要求1所述的機械學習裝置,其特征在于,
上述判定數據包括上述機器人感知的負荷的大小及其方向、上述機器人的周圍感知的負荷的大小及其方向、上述機器人的周圍的負擔度以及上述機器人的移動時間中的至少一個。
5.根據權利要求1所述的機械學習裝置,其特征在于,
上述機器人的行為包括上述機器人移動時的位置、姿勢、速度、以及加速度中的至少一個。
6.根據權利要求1所述的機械學習裝置,其特征在于,
上述神經網絡表示預先決定的各移動點的上述函數。
7.根據權利要求1所述的機械學習裝置,其特征在于,
上述函數更新部根據上述人的判別結果,更新上述神經網絡。
8.根據權利要求1所述的機械學習裝置,其特征在于,
共享基于對與上述機器人不同的第2機器人取得的狀態變量以及回報而學習到的信息。
9.一種機器人系統,其特征在于,具備:權利要求1至8中任一項所述的機械學習裝置;
機器人,其與人協作來進行作業;以及
行為控制部,其控制上述機器人的行為,
上述機器人的行為是基于神經網絡的輸出而設定的。
10.根據權利要求9所述的機器人系統,其特征在于,
上述機械學習裝置被設定在云服務器上。
11.一種機器人系統,其特征在于,
該機器人系統具備:
第2機器人,其與人協作來進行作業;
行為控制部,其控制上述第2機器人的行為;
狀態觀測部,其取得在上述人與上述第2機器人協作來進行作業的期間的表示上述第2機器人的狀態的狀態變量;以及
神經網絡,其被權利要求1至7中任一項所述的機械學習裝置更新,
上述第2機器人的行為是基于上述神經網絡的輸出而設定的。
12.一種機械學習方法,其特征在于,包括如下步驟:
取得在人與機器人協作來進行作業的期間的表示上述機器人的狀態的狀態變量的步驟;
取得與上述人的負擔度以及作業效率中的至少一方相關的判定數據的步驟;
根據上述判定數據來設定上述人的負擔度越小、或者上述作業效率越高則越大的回報的步驟;以及
根據上述狀態變量以及上述回報,更新表示用于設定上述機器人的行為的函數的神經網絡的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于發那科株式會社;優選網絡公司,未經發那科株式會社;優選網絡公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811360279.9/1.html,轉載請聲明來源鉆瓜專利網。





