[發明專利]基于深度強化學習的制造網絡維修-檢測聯合優化方法在審
| 申請號: | 202310333773.0 | 申請日: | 2023-03-30 |
| 公開(公告)號: | CN116384969A | 公開(公告)日: | 2023-07-04 |
| 發明(設計)人: | 葉正梗;蔡志強;司書賓;王鑫;柯勇偉;李丁林;周福禮 | 申請(專利權)人: | 鄭州大學 |
| 主分類號: | G06Q10/20 | 分類號: | G06Q10/20;G06Q10/0639;G06Q10/04;G06N3/04;G06N3/08 |
| 代理公司: | 鄭州優盾知識產權代理有限公司 41125 | 代理人: | 張彬 |
| 地址: | 450001 河南*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 強化 學習 制造 網絡 維修 檢測 聯合 優化 方法 | ||
1.一種基于深度強化學習的制造網絡維修-檢測聯合優化方法,其特征在于,其步驟如下:
步驟一:對于機器層面,在考慮機器故障停機導致的動態生產速度的情況下,構建了考慮進料質量影響的機器可靠性模型和考慮機器可靠性影響的加工質量模型;
步驟二:基于可靠性模型和質量模型對制造網絡狀態和性能進行系統評估;并搭建制造網絡維修和質量檢測聯合優化模型;
步驟三:在系統層面,以制造網絡的經濟運行作為策略評價的標準,通過設計的一種深度確定性策略梯度算法學習給定制造網絡狀態下質量檢測與維修的最優策略。
2.根據權利要求1所述的基于深度強化學習的制造網絡維修-檢測聯合優化方法,其特征在于,在機器層面,可靠性模型和質量模型的構建方法為:
計算動態生產速度:
將每個機器看作一個節點,利用有向無循環圖G(V,E)對n個節點的無循環制造網絡進行建模,其中V={v1,v2,…,vn}為制造網絡的節點集合,為制造網絡中有向邊的集合;i、j均為節點;
當制造網絡中沒有機器故障停機時,將機器的生產速度定義為最大生產速度,表示為Prm=[Prm1,Prm2,…,Prmn];制造網絡中機器的實際生產速度記為Pra(t)=[Pra1(t),Pra2(t),…,Pran(t)],且滿足Pra≤Prm;其中,Prmn表示第n臺機器的最大生產速度,Pran(t)表示第n臺機器的實際生產速度;
當節點i的生產速度改變ΔPrai(t)時,其緊鄰上游節點的生產速度的變化量ΔPrak(t)和緊鄰下游節點的生產速度的變化量ΔPraj(t)分別表示為:
其中,表示與節點i相連的緊鄰上游節點集合,表示與節點i相連的緊鄰下游節點集合;表示流入節點i的所有在制品中來自上游節點k的概率,表示節點i流出的在制品中流入到下游節點j的概率;
計算動態維修費用:
當考慮生產速度的動態性時,將加工合格進料時的故障率定義為基礎故障率rb(t):
rb(t)=(β/α)·(tr/α)β-1;
其中,α是尺度參數,β是形狀參數;是以最大生產速度為標準計算的機器的相對運行時間;t為機器運行的實際時間;
考慮到不合格進料可能造成的沖擊,實際故障率r(t)定義為:
其中,Δri′為機器不合格進料導致的累積失效率增量,N(t)是機器在[0,t)時間內加工的不合格在制品數量;通過推導得到機器失效的概率分布函數F(t)為:
F(t)=1-exp(-(tr/α)β-∫Δr(t)dt);
其中,為直到t時刻機器加工不合格進料導致的累積失效率增量;Δr(t)的積分的計算公式為:
其中,ti′為第i′個失效率增量的實際發生時刻;
假設機器的糾正性維修和預防性維修的維修時間分別服從以下正態分布:和且μcm≥μpm,糾正性維修和預防性維修的單位時間維修費用分別為ccm和cpm,那么在[0,t)時間內機器的總維修費用cm(t)可表示為:
其中,Ncm(t)為機器在[0,t)時間內的糾正性維修的次數,Npm(t)為機器在[0,t)時間內的預防性維修的次數,tcm_i1為機器第i1次糾正性維修花費的時間,tpm_j1為機器第j1次預防性維修花費的時間;
構建動態加工質量與檢測活動模型:
將M(t)定義為[0,t)時間內產生的不合格品數量,M(t)滿足強度函數λ(t)的非齊次泊松過程:
λ(t)=ω-ε·e-δ·r(t);
其中,ω0表示最大不合格品產生強度,ε0和δ0均為失效率對強度函數的影響系數,且ω-ελ(t)ωPra(t);定義nd為機器在[t,t+Δt)時間內產生的不合格品數量,其概率為:
其中,為[0,t)時間段內的不合格產品產出的期望值,Δt為質量統計周期;定義nq為機器在[t,t+Δt)時間段內加工的合格產品的總數,表示為:
在檢測活動中,對不合格品與合格品的錯誤判斷為:第I類錯誤,表示錯誤拒絕,概率為pI;第II類錯誤,表示錯誤接受,概率為pII;假設檢測活動中的抽樣比例為sa,sa∈[0,1],則任意合格在制品發生I類錯誤的聯合概率為sa·pI,任意不合格在制品發生II類錯誤的聯合概率為sa·pII;定義第I類錯誤和第II類錯誤的次數分別為nfr和nfa,且分別服從二項分布B(nq,sa·pI)和B(nd,sa·pII);因此,流出機器的不合格在制品數M'(t)是非齊次泊松過程M(t)和二項分布B(nd,sa·pII)的復合,則nfa個不合格在制品在[t,t+Δt)時間段內流出機器的概率為:
其中,m′(t)是[0,t]時間段內流出機器的平均不合格在制品數量;此外,在[t,t+Δt)時間段內合格在制品被拒絕的概率為:
其中,D(t)是累積到時間t時被拒絕的合格在制品,表示從nq個不合格品中隨機抽取nfr個樣本的可能組合數量;
機器在[t,t+Δt)時間段內加工出的產品被正確判定為不合格品的數量ncr與被正確判定為合格品的數量nca分別表示為:
在此基礎上,可以獲得機器在[t,t+Δt)時間內通過檢測活動判別出的不合格產品比例為:
假設機器檢測單個產品的檢測費用為cins,則機器在[t,t+Δt)時間內的檢測總費用:
假設單個在制品從制造網絡輸入節點到當前加工節點i的加工過程帶來的累計價值增量為vsi,則節點i對應的機器加工單件在制品帶來的平均工序價值增量vai可定義為:
其中,vsk表示節點i的上游節點k的累計價值增量;
將檢測過程發生II類錯誤的不合格在制品造成的價值損失定義為因此,機器i在[0,t)時間內加工的所有在制品帶來的凈價值增量vnet_i為所有正確接受的在制品的價值增量、錯誤接受的在制品的價值損失與所有被拒絕的在制品的價值損失三個部分之和:
其中,nca_i表示節點i對應的機器正確接受的在制品數量,nfa_i表示節點i對應的機器錯誤接受的在制品數量,ncr_i表示節點i對應的機器正確拒絕的在制品數量,nfr_i分別表示節點i對應的機器錯誤拒絕的在制品數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鄭州大學,未經鄭州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310333773.0/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





