[發明專利]一種基于深度強化學習和遺傳算法的分批調度優化方法有效
| 申請號: | 202011373229.1 | 申請日: | 2020-11-30 |
| 公開(公告)號: | CN112488315B | 公開(公告)日: | 2022-11-04 |
| 發明(設計)人: | 譚琦;賈鋮鈺;余榮坤;孫晨皓;唐昊;夏田林 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G06N3/12 | 分類號: | G06N3/12;G06N3/08;G06K9/62;G06Q10/04 |
| 代理公司: | 合肥云道爾知識產權代理事務所(特殊普通合伙) 34230 | 代理人: | 閆興貴 |
| 地址: | 230000 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 強化 學習 遺傳 算法 分批 調度 優化 方法 | ||
1.基于深度強化學習和遺傳算法的分批調度優化方法,其特征在于:是按如下步驟進行:
步驟I、建立差異工件批調度問題的數學模型;
針對所述差異工件批調度問題作如下定義,工件集合J={1,2,…,n},其中,工件j的加工時間為pj,工件尺寸為sj;批處理機的機器容量為C,在滿足容量約束的前提下,機器可同時加工多個工件;待加工批的集合為K,其中,批k的加工時間為Pk,等于批k中工件加工時間的最大值;Xjk表示決策變量,若工件j在批k中,則Xjk=1,否則,Xjk=0;Yk表示決策變量,若批k被建立,則Yk=1,否則,Yk=0;
根據上述定義,對單機不同尺寸工件的批調度問題可建如下數學模型:
目標函數:
約束條件:
步驟II、采用指針網絡建立該問題的策略模型;
步驟III、利用actor-critic算法訓練指針網絡模型;
步驟IV、定義并初始化遺傳算法的參數:種群規模PopNum、最大迭代次數TGA、以及工件個數n,令當前已經完成的迭代次數tGA=0;
步驟V、使用步驟III訓練完成的指針網絡優化遺傳算法的初始種群;
步驟VI、采用遺傳算法對問題進行進一步求解;
步驟VII、利用遺傳算法得到的最優方案作為批處理機加工工件的生產方案;
步驟V所述的使用訓練完成的指針網絡優化遺傳算法的初始種群主要包括如下步驟:
步驟i、采用實數編碼方式以LPT啟發式規則生成種群中的一個個體;
步驟ii、種群中的PopNum–1個個體采用三角模糊數的方式生成;
步驟iii、將上述種群中的個體通過指針網絡得到新的種群;
步驟iv、將兩個種群中的所有個體按適應度值升序排序,取前PopNum個個體作為遺傳算法的初始種群;
步驟VI采用遺傳算法對問題進行進一步求解主要包括如下步驟:
步驟i、按照輪盤賭方式選擇PopNum個父代個體;
步驟ii、將所有父代個體兩兩結合,采用改進的多點交叉方式生成子代個體;
步驟iii、對所有子代個體采用單點變異方式執行變異操作;
步驟iv、令tGA=tGA+1,并計算所有子代個體的適應度值;
步驟v、判斷tGATGA是否成立,若成立,跳轉到步驟i,否則執行步驟vi;
步驟vi、算法結束,輸出最優調度方案;
步驟VI中的步驟ii采用改進的多點交叉方式生成子代主要包括如下步驟:
步驟a、初始化子代為空、選擇待交叉父代Parent1與Parent2、令當前遺傳父代Parent=Parent1、基因復制起始位置Index=0以及隨機產生復制基因個數num,其中num的范圍為1到n;
步驟b、從parent中下標為Index處開始,向左右兩邊查找不在子代中的num個基因,若查找的基因已存在于子代中則忽略,若查找下標已達邊界,則停止當前方向的搜索,若所有基因都已經被復制,直接轉到步驟d;
步驟c、將上述步驟中搜索得到的基因段按其在parent中的順序復制到子代中;
步驟d、判斷子代是否復制完父代中所有的基因,若復制完成,跳轉到步驟f,否則執行步驟e;
步驟e、令parent為另一個父代、Index為當前子代最后一個基因的值、重新生成待復制基因個數num,并跳轉到步驟b;
步驟f、得到交叉后的子代個體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011373229.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:數據處理方法、裝置、除濕機及存儲介質
- 下一篇:用于水泥生產的提升機





