[發(fā)明專利]機(jī)器學(xué)習(xí)裝置、數(shù)控裝置、工作機(jī)械及機(jī)器學(xué)習(xí)方法有效
| 申請?zhí)枺?/td> | 201880095230.7 | 申請日: | 2018-07-06 |
| 公開(公告)號: | CN112368656B | 公開(公告)日: | 2021-08-20 |
| 發(fā)明(設(shè)計)人: | 加藤勇太;石田泰一 | 申請(專利權(quán))人: | 三菱電機(jī)株式會社 |
| 主分類號: | G05B19/4155 | 分類號: | G05B19/4155;B23B15/00;B23B31/00;B23Q17/00 |
| 代理公司: | 北京天昊聯(lián)合知識產(chǎn)權(quán)代理有限公司 11112 | 代理人: | 何立波;張?zhí)焓?/td> |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 機(jī)器 學(xué)習(xí) 裝置 數(shù)控 工作 機(jī)械 學(xué)習(xí)方法 | ||
1.一種機(jī)器學(xué)習(xí)裝置,其在對工件進(jìn)行抓持而輸送的第1卡盤、和對所述工件進(jìn)行抓持而接收的第2卡盤之間的所述工件的交接時,對向使所述第1卡盤移動的驅(qū)動機(jī)構(gòu)的位置指令進(jìn)行學(xué)習(xí),
該機(jī)器學(xué)習(xí)裝置的特征在于,具有:
狀態(tài)觀測部,其將向所述驅(qū)動機(jī)構(gòu)的所述位置指令、和來自所述驅(qū)動機(jī)構(gòu)的反饋數(shù)據(jù)作為狀態(tài)變量進(jìn)行觀測;以及
學(xué)習(xí)部,其按照基于所述狀態(tài)變量創(chuàng)建的數(shù)據(jù)集,對抑制所述第1卡盤和所述第2卡盤之間的所述工件的交接位置的位置偏移的所述位置指令進(jìn)行學(xué)習(xí),
所述反饋數(shù)據(jù)包含反饋位置,該反饋位置表示對所述工件進(jìn)行輸送的輸送機(jī)構(gòu)的位置,
所述學(xué)習(xí)部具有:
回報計算部,其基于向所述驅(qū)動機(jī)構(gòu)的所述位置指令所示的位置和所述反饋位置的差分,對回報進(jìn)行計算;以及
函數(shù)更新部,其基于所述回報,對用于決定所述位置指令的函數(shù)進(jìn)行更新。
2.一種數(shù)控裝置,其特征在于,具有:
權(quán)利要求1所述的機(jī)器學(xué)習(xí)裝置;以及
控制部,其將由所述學(xué)習(xí)部學(xué)習(xí)到的所述位置指令向所述驅(qū)動機(jī)構(gòu)進(jìn)行輸出。
3.根據(jù)權(quán)利要求2所述的數(shù)控裝置,其特征在于,
所述反饋數(shù)據(jù)包含反饋電流,該反饋電流是表示所述驅(qū)動機(jī)構(gòu)為了使所述第1卡盤移動而從所述驅(qū)動機(jī)構(gòu)輸出的電流的數(shù)據(jù),
所述回報計算部基于所述差分及所述反饋電流對所述回報進(jìn)行計算。
4.根據(jù)權(quán)利要求3所述的數(shù)控裝置,其特征在于,
所述回報計算部在所述差分小于或等于閾值、且所述反饋電流小于或等于基準(zhǔn)電流值的情況下使所述回報增大,在所述差分大于所述閾值或者所述反饋電流大于所述基準(zhǔn)電流值的情況下使所述回報減少。
5.根據(jù)權(quán)利要求3或4所述的數(shù)控裝置,其特征在于,
所述函數(shù)更新部按照所述回報,對表示所述函數(shù)的行動價值表進(jìn)行更新。
6.根據(jù)權(quán)利要求3所述的數(shù)控裝置,其特征在于,
所述狀態(tài)觀測部在所述差分大于閾值或者所述反饋電流大于基準(zhǔn)電流值的情況下,判定為所述交接失敗,
如果判定為所述交接失敗,則所述學(xué)習(xí)部對所述位置指令進(jìn)行學(xué)習(xí),
如果判定為所述交接失敗,則所述控制部通過由所述學(xué)習(xí)部學(xué)習(xí)到的所述位置指令進(jìn)行所述交接的重試。
7.根據(jù)權(quán)利要求2至6中任一項所述的數(shù)控裝置,其特征在于,
所述學(xué)習(xí)部對向所述驅(qū)動機(jī)構(gòu)的所述位置指令中的、向與所述第1卡盤和所述第2卡盤之間的所述交接的方向垂直的第1方向的位置指令進(jìn)行學(xué)習(xí)。
8.一種工作機(jī)械,其特征在于,
由權(quán)利要求2至7中任一項所述的數(shù)控裝置進(jìn)行控制,通過所述驅(qū)動機(jī)構(gòu)進(jìn)行驅(qū)動。
9.一種機(jī)器學(xué)習(xí)方法,其在對工件進(jìn)行抓持而輸送側(cè)的第1卡盤和對所述工件進(jìn)行抓持而接收側(cè)的第2卡盤之間的所述工件的交接時,對向使所述第1卡盤移動的驅(qū)動機(jī)構(gòu)的位置指令進(jìn)行學(xué)習(xí),
該機(jī)器學(xué)習(xí)方法的特征在于,包含:
狀態(tài)觀測步驟,將向所述驅(qū)動機(jī)構(gòu)的所述位置指令和來自所述驅(qū)動機(jī)構(gòu)的反饋數(shù)據(jù)作為狀態(tài)變量進(jìn)行觀測;以及
學(xué)習(xí)步驟,按照基于所述狀態(tài)變量創(chuàng)建的數(shù)據(jù)集,對抑制所述第1卡盤和所述第2卡盤之間的所述工件的交接位置的位置偏移的所述位置指令進(jìn)行學(xué)習(xí),
所述反饋數(shù)據(jù)包含反饋位置,該反饋位置表示對所述工件進(jìn)行輸送的輸送機(jī)構(gòu)的位置,
所述學(xué)習(xí)步驟具有:
回報計算步驟,其基于向所述驅(qū)動機(jī)構(gòu)的所述位置指令所示的位置和所述反饋位置的差分,對回報進(jìn)行計算;以及
函數(shù)更新步驟,其基于所述回報,對用于決定所述位置指令的函數(shù)進(jìn)行更新。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于三菱電機(jī)株式會社,未經(jīng)三菱電機(jī)株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880095230.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:鑄型造型用粘結(jié)劑組合物
- 下一篇:治療用途和方法
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





