[發明專利]機器學習裝置、控制系統以及機器學習方法在審
| 申請號: | 202010196171.1 | 申請日: | 2020-03-19 |
| 公開(公告)號: | CN111722530A | 公開(公告)日: | 2020-09-29 |
| 發明(設計)人: | 恒木亮太郎;豬飼聰史 | 申請(專利權)人: | 發那科株式會社 |
| 主分類號: | G05B13/04 | 分類號: | G05B13/04 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 曾賢偉;范勝杰 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 機器 學習 裝置 控制系統 以及 學習方法 | ||
1.一種機器學習裝置,其特征在于,
所述機器學習裝置進行根據評價函數對第1系數和第2系數進行優化的機器學習,其中,所述第1系數是在控制電動機的電動機控制裝置中設置的濾波器的系數,所述第2系數是在該電動機控制裝置中設置的伺服控制部的速度前饋部的系數,所述函數是在所述電動機控制裝置的外部設置的外部測量器得到的加減速后的測量信息、輸入到所述電動機控制裝置的位置指令、該位置指令的值與位置反饋信息之差即位置偏差的函數,該位置反饋信息來自所述伺服控制部的檢測器。
2.根據權利要求1所述的機器學習裝置,其特征在于,
所述外部測量器的測量信息包含位置、速度、加速度中的至少一個。
3.根據權利要求1或2所述的機器學習裝置,其特征在于,
所述伺服控制部具有位置反饋環和速度反饋環中的至少一個,
所述濾波器處于所述位置反饋環或者所述速度反饋環的外部。
4.根據權利要求1或2所述的機器學習裝置,其特征在于,
所述伺服控制部具有反饋環,
所述外部測量器的測量信息不用于所述反饋環的反饋控制。
5.根據權利要求1~4中任一項所述的機器學習裝置,其特征在于,
在基于機器學習的所述濾波器的調整后,拆下所述外部測量器。
6.根據權利要求1~5中任一項所述的機器學習裝置,其特征在于,
所述濾波器是二階以上的IIR濾波器。
7.根據權利要求1~6中任一項所述的機器學習裝置,其特征在于,
所述機器學習裝置具有:
狀態信息取得部,其取得包含所述測量信息、所述位置指令、所述位置偏差、所述濾波器的所述第1系數以及所述速度前饋部的所述第2系數的狀態信息;
行為信息輸出部,其向所述濾波器和所述速度前饋部輸出行為信息,該行為信息包含所述狀態信息所包含的所述第1系數和所述第2系數的調整信息;
回報輸出部,其輸出使用了評價函數的強化學習中的回報值,其中,所述評價函數是所述測量信息、所述位置指令、所述位置偏差的函數;以及
價值函數更新部,其根據由所述回報輸出部輸出的回報值、所述狀態信息、所述行為信息來更新行為價值函數。
8.根據權利要求7所述的機器學習裝置,其特征在于,
所述機器學習裝置具有:優化行為信息輸出部,其根據由所述價值函數更新部更新而得的價值函數,輸出所述第1系數和所述第2系數的調整信息。
9.一種控制系統,其特征在于,具有:
電動機控制裝置,其包含權利要求1~8中任一項所述的機器學習裝置、電動機、具有速度前饋部的伺服控制部、濾波器,所述電動機控制裝置對所述電動機進行控制;以及
外部測量器,其設置于所述電動機控制裝置的外部。
10.一種機器學習裝置的機器學習方法,其特征在于,
所述機器學習裝置取得第1系數和第2系數、測量信息、位置指令、位置偏差,并進行根據評價函數對所述第1系數和所述第2系數進行優化的機器學習,其中,所述第1系數是在控制電動機的電動機控制裝置中設置的濾波器的系數,所述第2系數是在該電動機控制裝置中設置的伺服控制部的速度前饋部的系數,所述測量信息是在所述電動機控制裝置的外部設置的外部測量器得到的加減速后的測量信息,所述位置指令是輸入到所述電動機控制裝置的位置指令,所述位置偏差是該位置指令的值與位置反饋信息之差,所述函數是所述測量信息、所述位置指令、所述位置偏差的函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于發那科株式會社,未經發那科株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010196171.1/1.html,轉載請聲明來源鉆瓜專利網。





