[發(fā)明專利]一種多目標(biāo)優(yōu)化的機床柔性車間調(diào)度方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202110986700.2 | 申請日: | 2021-08-26 |
| 公開(公告)號: | CN113759841A | 公開(公告)日: | 2021-12-07 |
| 發(fā)明(設(shè)計)人: | 杜宇;李俊青 | 申請(專利權(quán))人: | 山東師范大學(xué) |
| 主分類號: | G05B19/418 | 分類號: | G05B19/418 |
| 代理公司: | 濟南圣達知識產(chǎn)權(quán)代理有限公司 37221 | 代理人: | 張勇 |
| 地址: | 250014 山*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 多目標(biāo) 優(yōu)化 機床 柔性 車間 調(diào)度 方法 系統(tǒng) | ||
本公開提供了一種多目標(biāo)優(yōu)化的機床柔性車間調(diào)度方法,包括初始化目標(biāo)網(wǎng)絡(luò)和在線網(wǎng)絡(luò)Q;利用激勵函數(shù)進行深度Q網(wǎng)絡(luò)DQN訓(xùn)練;通過初始化策略進行種群初始化;進行非支配排序和擁擠度排序并獲得較優(yōu)解。本公開利用EAs和DRL的優(yōu)點,提出了針對FJSP的基于知識的分布估計算法(EDA)和DQN的混合算法EDA?DQN。利用基于Pareto方法對最大完工時間和總電費進行優(yōu)化。在EDA?DQN中,DQN部分為一個局部搜索選擇器,負(fù)責(zé)在不同的調(diào)度狀態(tài)下選擇適宜的局部搜索策略;EDA部分用于提高算法的探索能力,DQN部分用于提高算法的挖掘能力。
技術(shù)領(lǐng)域
本公開涉及車間調(diào)度技術(shù)領(lǐng)域,特別涉及一種多目標(biāo)優(yōu)化的機床柔性車間調(diào)度方法及系統(tǒng)。
背景技術(shù)
本部分的陳述僅僅是提供了與本公開相關(guān)的背景技術(shù),并不必然構(gòu)成現(xiàn)有技術(shù)。
柔性車間調(diào)度問題(FJSP)在半導(dǎo)體制造、化工過程以及手機裝配等領(lǐng)域中得到了廣泛的研究和應(yīng)用。在實際生產(chǎn)中,分時電價(TOUEP)的影響在經(jīng)濟和綠色發(fā)展中應(yīng)得到考慮,因此,電量最好在低電價區(qū)間使用更為合適。更進一步地,機床的加工速度設(shè)置應(yīng)當(dāng)在生產(chǎn)計劃和企業(yè)利潤之間進行權(quán)衡,耗電量高的工序應(yīng)當(dāng)安排在低電價區(qū)間加工,耗電量低的工序可適當(dāng)安排在高電價區(qū)間加工。
目前的現(xiàn)有技術(shù)中解決了各種約束的FJSP,但是存在著在大規(guī)模問題中的性能會急劇下降的問題。為了解決這個問題,考慮利用目前被認(rèn)為具有較強智能優(yōu)化能力的強化學(xué)習(xí)(RL)來提高對FJSP的優(yōu)化能力。最近,結(jié)合RL和深度學(xué)習(xí)的深度強化學(xué)習(xí)(DRL)逐漸應(yīng)用于求解組合優(yōu)化問題(COPs),顯示出DRL解決COPs的強大能力。
現(xiàn)已有多個研究利用RL對EAs的參數(shù)進行優(yōu)化。Emary等人利用RL和神經(jīng)網(wǎng)絡(luò)對GWO的參數(shù)進行了優(yōu)化。Cao等人提出了帶RL和代理模型的布谷鳥搜索算法來解決半導(dǎo)體最終測試的調(diào)度問題,其中RL用來確保種群的多樣性和搜索強度;盡管RL已被應(yīng)用于通過調(diào)整EAs的參數(shù)值來增強優(yōu)化效果,但RL的智能優(yōu)勢沒有直接參與到優(yōu)化過程中。
最近,更多的研究直接把RL作為優(yōu)化的策略。Lin等學(xué)者利用多級DQN來解決車間調(diào)度問題,優(yōu)化了其中的最大完工時間。Park等人提出了利用RL的準(zhǔn)備切換調(diào)度理論來最小化芯片生產(chǎn)中的最大完工時間。Luo針對動態(tài)FJSP設(shè)計了DQN算法為RL解決FJSP提供了基礎(chǔ)算法。Hu等人以帶混合規(guī)則的車輛自動導(dǎo)航調(diào)度方法解決柔性車間生產(chǎn)問題,優(yōu)化了最大完工時間和延遲率。He等人利用DQN模型解決了敏捷衛(wèi)星的調(diào)度問題。Park等學(xué)者將圖神經(jīng)網(wǎng)絡(luò)和RL結(jié)合來解決車間調(diào)度問題,其中基于RL的近端策略優(yōu)化用于訓(xùn)練模型。Zhao等人提出了基于RL的協(xié)同水波優(yōu)化算法來解決分布式裝配無等待流水車間調(diào)度問題。Han和Yang構(gòu)建了端到端的DRL框架來解決FJSP,其中采用了改進的指針網(wǎng)絡(luò)用于對工序進行編碼,卷積神經(jīng)網(wǎng)絡(luò)被用作解碼網(wǎng)絡(luò)。Kim和Lee提出了Petri網(wǎng)絡(luò)作為RL中的環(huán)境來解決流水車間調(diào)度問題,優(yōu)化了最大完工時間。Xu等學(xué)者設(shè)計了基于RL的差分進化算法來解決工業(yè)整合能耗系統(tǒng)的多級能耗調(diào)度問題。在以上研究中,COPs通過RL的各種方法予以解決,RL的智能性得到利用,然而,大多數(shù)研究只優(yōu)化了單目標(biāo)問題,對于多目標(biāo)問題的RL方法需要更進一步地研究。另外,EAs和RL的優(yōu)勢需要結(jié)合起來以更好地提高算法的優(yōu)化性能。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)的不足,本公開提供了一種多目標(biāo)優(yōu)化的機床柔性車間調(diào)度方法及系統(tǒng),利用EAs和DRL的優(yōu)點,提出了針對FJSP的基于知識的分布估計算法(EDA)和DQN的混合算法EDA-DQN。利用基于Pareto方法對最大完工時間和總電費進行優(yōu)化。在EDA-DQN中,DQN部分為一個局部搜索選擇器,負(fù)責(zé)在不同的調(diào)度狀態(tài)下選擇適宜的局部搜索策略;EDA部分用于提高算法的探索能力,DQN部分用于提高算法的挖掘能力。
為了實現(xiàn)上述目的,本公開采用如下技術(shù)方案:
本公開第一方面提供了一種多目標(biāo)優(yōu)化的機床柔性車間調(diào)度方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東師范大學(xué),未經(jīng)山東師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110986700.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于實現(xiàn)多目標(biāo)方業(yè)務(wù)或操作的方法和裝置
- 基于智能視頻分析平臺的多目標(biāo)跟蹤方法及其系統(tǒng)
- 多目標(biāo)設(shè)計選擇方法和系統(tǒng)
- 一種針對多目標(biāo)的地面導(dǎo)航系統(tǒng)及其方法
- 一種無斷點多目標(biāo)信號合成方法
- 基于多智能體深度增強學(xué)習(xí)的多目標(biāo)跟蹤方法
- 一種多目標(biāo)跟蹤方法
- 一種航空紅外視頻多目標(biāo)檢測與跟蹤方法及裝置
- 一種多目標(biāo)推薦方法、多目標(biāo)推薦模型生成方法以及裝置
- 一種區(qū)域多目標(biāo)衛(wèi)星探測仿真方法及系統(tǒng)





