[發(fā)明專利]一種基于深度強(qiáng)化學(xué)習(xí)的航天起爆器生產(chǎn)調(diào)度方法在審
| 申請?zhí)枺?/td> | 202110268713.6 | 申請日: | 2021-03-12 |
| 公開(公告)號: | CN112884239A | 公開(公告)日: | 2021-06-01 |
| 發(fā)明(設(shè)計(jì))人: | 魏善碧;余笑;王昱;肖勇;王輝陽;吳睿 | 申請(專利權(quán))人: | 重慶大學(xué) |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/06;G06Q50/04;G06N7/00;G06N3/08 |
| 代理公司: | 濟(jì)南鼎信專利商標(biāo)代理事務(wù)所(普通合伙) 37245 | 代理人: | 賈國浩 |
| 地址: | 400044 重*** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 強(qiáng)化 學(xué)習(xí) 航天 起爆 生產(chǎn) 調(diào)度 方法 | ||
1.一種基于深度強(qiáng)化學(xué)習(xí)的航天起爆器生產(chǎn)調(diào)度方法,其特征在于,包括步驟:
S1、從起爆器生產(chǎn)車間獲取生產(chǎn)加工的實(shí)時信息;
S2、根據(jù)起爆器生產(chǎn)車間收集的實(shí)時信息,確定起爆器柔性生產(chǎn)車間調(diào)度問題描述和相關(guān)假設(shè);
S3、確定起爆器生產(chǎn)車間調(diào)度優(yōu)化的目標(biāo)函數(shù)及約束條件;
S4、將起爆器生產(chǎn)調(diào)度問題構(gòu)造為馬爾科夫決策模型,將實(shí)時信息轉(zhuǎn)化為實(shí)時狀態(tài);
S5、將實(shí)時狀態(tài)信息存儲在記憶庫中,作為深度強(qiáng)化學(xué)習(xí)DQN算法訓(xùn)練的輸入;
S6、深度強(qiáng)化學(xué)習(xí)DQN算法的訓(xùn)練;
S7、起爆器生產(chǎn)實(shí)時調(diào)度。
2.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的航天起爆器生產(chǎn)調(diào)度方法,其特征在于:步驟S1中,所述實(shí)時信息包括機(jī)器設(shè)備總臺數(shù)、生產(chǎn)加工計(jì)劃、各生產(chǎn)工序加工時間、工件加工工序數(shù)以及各加工工序開完工時間。
3.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的航天起爆器生產(chǎn)調(diào)度方法,其特征在于:步驟S1中,所述起爆器柔性生產(chǎn)車間調(diào)度問題描述為合理地將每道工序分配到一個具體的設(shè)備,同時排列設(shè)備上工件的加工順序,并確定開始加工的時間,使其滿足調(diào)度優(yōu)化目標(biāo)。
4.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的航天起爆器生產(chǎn)調(diào)度方法,其特征在于:步驟S2中,所述相關(guān)假設(shè)包括第一假設(shè)、第二假設(shè)、第三假設(shè);
所述第一假設(shè)為:各生產(chǎn)機(jī)器設(shè)備相互獨(dú)立,加工過程中互不影響;
所述第二假設(shè)為:在零時刻,任意設(shè)備和工件均準(zhǔn)備就緒;
所述第三假設(shè)為:每臺設(shè)備在任意時刻正在加工的產(chǎn)品只能有一個。
5.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的航天起爆器生產(chǎn)調(diào)度方法,其特征在于:步驟S3中,所述目標(biāo)函數(shù)為:
其中,
Minmize W表示最小化機(jī)器總負(fù)荷;Minmize M表示最少加工等待時間;A表示需要生產(chǎn)加工的起爆器的數(shù)量;m表示第m個工件,m∈(1,2,…A);sj表示每個起爆器需要多少道加工工序;n表示第n道工序,n∈(1,2,…sj);Q表示設(shè)備數(shù)量;q表示第q臺設(shè)備,q∈(1,2,…Q);
Omn表示加工工件m的第n道工序;Gmnq表示設(shè)備q加工工序Omn的加工時間;Umnq表示工件m在q設(shè)備上進(jìn)行n工序的加工,當(dāng)工序Omn選擇設(shè)備q加工,則Umnq=1,其它則為0;Em表示加工工件m的的總加工時間;Nmn表示工序Omn有無存儲固化,當(dāng)有存儲固化,Nmn=1,若無,則為0;Pmn表示工序Omn有無配膠環(huán)節(jié),當(dāng)有配膠時,Pmn=1,若無,則為0;Tn表示加工工序n的存儲固化工序時間;Ln表示加工工序n的配膠工序時間;In表示加工工序n的稱、裝藥時間;Hn表示試裝工序時間;Cm表示加工工件m的任務(wù)交期。
6.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的航天起爆器生產(chǎn)調(diào)度方法,其特征在于:步驟S3中,所述約束條件包括:
約束每個工件每道工序只能被加工一次:
約束起爆器工件交期時間:Em≤Cm;
約束存儲固化工序時間:12≤Tn≤24;
約束試裝工序時間:2≤Hn≤3;
約束配膠工序時間:6≤Ln≤12;
約束稱、裝藥工序時間:3≤In≤6。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶大學(xué),未經(jīng)重慶大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110268713.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運(yùn)輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





