[發明專利]一種基于增強學習的串行生產系統生產維護聯合優化方法有效
| 申請號: | 202110264883.7 | 申請日: | 2021-03-11 |
| 公開(公告)號: | CN113112051B | 公開(公告)日: | 2022-10-25 |
| 發明(設計)人: | 靳文瑞;易琦;周炳海 | 申請(專利權)人: | 同濟大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/04;G06K9/62;G06F30/27 |
| 代理公司: | 上海科盛知識產權代理有限公司 31225 | 代理人: | 趙繼明 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 增強 學習 串行 生產 系統 維護 聯合 優化 方法 | ||
1.一種基于增強學習的串行生產系統生產維護聯合優化方法,其特征在于,包括以下步驟:
通過馬爾科夫鏈表示串行生產系統的系統狀態,確定串行生產系統的狀態轉移概率的計算方法,構建包括狀態空間、動作空間、轉移矩陣和成本函數的馬爾科夫模型;
采用貪心策略求解所述馬爾科夫模型,從所述動作空間中選取維護策略,構建回放記憶數據集;采用所述回放記憶數據集對預先建立的神經網絡進行迭代訓練,直至達到預設的迭代終止條件;
采用訓練后的所述神經網絡,獲取實際串行生產系統的生產維護策略;
所述系統狀態的表達式為:
s(t)=[α1(t),...,αM+1(t),b1(t),...,bM(t)]
bm(t)=bm(t-1)+THm(t)-THm+1(t)
式中,s(t)為系統狀態,t為時間,THm(t)為在時間t機器Mm的產量,Mm為生產系統的第m臺機器,αM+1(t)為機器Mm的運行狀態變量,1表示在在時間t機器m處于加工工件狀態,反之為0,bM(t)為在時間t緩沖區Bm的容量;
所述串行生產系統的系統狀態的轉移概率的計算過程包括:
計算所述串行生產系統中各機器的狀態轉移概率,從而計算所述系統狀態的轉移概率,所述串行生產系統中各機器的狀態轉移概率的計算表達式為:
式中,為時間t的機器狀態序列,為各臺機器在t時刻的維護決策cm(t)的序列,pm為第m臺機器的轉移概率;
所述系統狀態的轉移概率的計算表達式為:
式中,s(t)為系統在t時刻的狀態;
所述馬爾科夫模型的求解目標是找到最優維護策略π*,最小化長期期望成本,即
當選擇策略π時,帶折扣因子的期望成本的表達式為:
式中,為每個時間單位的決策成本,s為系統狀態,Eπ為選擇策略π時,帶折扣因子的期望成本,γt(0<γt<1)為表示折扣因子;
所述馬爾科夫模型的目標函數的表達式為:
式中,s′為下一個時刻的機器狀態,V(s′)為下一個狀態s′的值函數。
2.根據權利要求1所述的一種基于增強學習的串行生產系統生產維護聯合優化方法,其特征在于,所述THm(t)的計算表達式為:
式中,vm(αM(t))為機器Mm在狀態αM(t)下的速度。
3.根據權利要求1所述的一種基于增強學習的串行生產系統生產維護聯合優化方法,其特征在于,所述決策成本的計算表達式為:
式中,gb為單位庫存成本,g-為單位缺貨成本,x-(t)=vM+1(αM+1(t))-THM+1,gm(t)表示維護成本,即
4.根據權利要求1所述的一種基于增強學習的串行生產系統生產維護聯合優化方法,其特征在于,所述回放記憶數據集的構建過程包括:
有ε的概率從動作空間隨機選取有1-ε的概率根據第一算式選取所述第一算式的表達式為:
構建經驗存進回放記憶數據集Dt=(e1,....,et)中,為系統在狀態s+1時的最優價值函數,為神經網絡中函數逼近權重。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學,未經同濟大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110264883.7/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





