[發(fā)明專利]基于Q-learning和GA的多目標(biāo)柔性作業(yè)車間調(diào)度自學(xué)習(xí)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202110383136.5 | 申請(qǐng)日: | 2021-04-09 |
| 公開(kāi)(公告)號(hào): | CN113034026B | 公開(kāi)(公告)日: | 2023-10-24 |
| 發(fā)明(設(shè)計(jì))人: | 常鏡洳;康玲;張明會(huì);石冬凌;彭鈺瑩;邱謙 | 申請(qǐng)(專利權(quán))人: | 大連東軟信息學(xué)院 |
| 主分類號(hào): | G06Q10/063 | 分類號(hào): | G06Q10/063;G06Q10/04;G06Q50/04;G06N3/126 |
| 代理公司: | 大連至誠(chéng)專利代理事務(wù)所(特殊普通合伙) 21242 | 代理人: | 張海燕;謝冰 |
| 地址: | 116000 遼*** | 國(guó)省代碼: | 遼寧;21 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 learning ga 多目標(biāo) 柔性 作業(yè) 車間 調(diào)度 自學(xué)習(xí) 方法 | ||
本發(fā)明公開(kāi)了基于Q?learning和GA的多目標(biāo)柔性作業(yè)車間調(diào)度自學(xué)習(xí)方法,采用分段編碼規(guī)則,全局、局部和隨機(jī)結(jié)合的機(jī)器選擇方式初始化種群,采用基于Pareto支配關(guān)系的非劣解快速排序方法分配染色體解的適應(yīng)度值,然后設(shè)計(jì)錦標(biāo)賽和精英策略結(jié)合選擇算子,設(shè)計(jì)對(duì)應(yīng)的交叉和變異算子;在GA算法基礎(chǔ)上結(jié)合增強(qiáng)機(jī)器學(xué)習(xí)中Q?learning算法構(gòu)建自學(xué)習(xí)模型,設(shè)計(jì)狀態(tài)集、行動(dòng)集、獎(jiǎng)勵(lì)方法、行動(dòng)選擇策略等,在染色體種群迭代間動(dòng)態(tài)調(diào)整交叉概率Pc和變異概率Pm,從而,提高算法時(shí)間復(fù)雜度和解的精準(zhǔn)度,進(jìn)而提高車間生產(chǎn)的自適應(yīng)性、可靠性以及智能化水平。
技術(shù)領(lǐng)域
本發(fā)明涉及制造生產(chǎn)車間的調(diào)度技術(shù)領(lǐng)域,尤其涉及一種基于Q-learning和GA的多目標(biāo)柔性作業(yè)車間調(diào)度自學(xué)習(xí)方法。
背景技術(shù)
隨著客戶需求定制化和加工設(shè)備的多功能發(fā)展,傳統(tǒng)作業(yè)車間調(diào)度(JSP)很難達(dá)到最優(yōu)化排產(chǎn)調(diào)度,造成生產(chǎn)率較低、資源浪費(fèi)、成本增加,因此設(shè)計(jì)并實(shí)現(xiàn)柔性作業(yè)車間調(diào)度的自學(xué)習(xí)智能化方法成為生產(chǎn)調(diào)度的關(guān)鍵任務(wù),以滿足制造企業(yè)的實(shí)際需求。
柔性作業(yè)車間調(diào)度(FJSP)在1990年由Bruker和Schlic首次提出,具有顯著的離散性、計(jì)算復(fù)雜性、多約束性、不確定性和多目標(biāo)性特征作為經(jīng)典作業(yè)車間調(diào)度(JSP)問(wèn)題的擴(kuò)展,突破生產(chǎn)資源唯一性限制,每道生產(chǎn)工序可在不同機(jī)器上加工,更迎合實(shí)際生產(chǎn)環(huán)境,增加了調(diào)度的靈活性、可靠性和自適應(yīng)性,且是一種公認(rèn)的強(qiáng)NP-hard問(wèn)題;實(shí)際生產(chǎn)中調(diào)度問(wèn)題常常多目標(biāo)的,有效的調(diào)度優(yōu)化方案不僅能提高生產(chǎn)效率、設(shè)備利用率,保證按時(shí)交貨,降低企業(yè)成本,而且還節(jié)能減排實(shí)現(xiàn)綠色生產(chǎn)。
目前,F(xiàn)JSP常用解決方法有遺傳算法、禁忌搜索、蟻群算法、模擬退火、粒子群算法、蜂群算法等;遺傳算法是一種隱含并行搜索的隨機(jī)全局搜索算法,優(yōu)越的全局搜索和較強(qiáng)的魯棒性使得遺傳算法非常適合求解多目標(biāo)優(yōu)化FJSP問(wèn)題。但遺傳算法中的交叉概率和變異概率等關(guān)鍵參數(shù)不能被動(dòng)態(tài)精準(zhǔn)調(diào)整,從而影響算法的效率和解的質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明提供基于Q-learning和GA的多目標(biāo)柔性作業(yè)車間調(diào)度自學(xué)習(xí)方法,以克服上述技術(shù)問(wèn)題。
本發(fā)明基于Q-learning和GA的多目標(biāo)柔性作業(yè)車間調(diào)度自學(xué)習(xí)方法,包括:
S1、建立柔性作業(yè)車間調(diào)度模型及其約束條件;
S2、初始化遺傳算法基本參數(shù);根據(jù)所述遺傳算法的分段編碼規(guī)則,并根據(jù)所述基本參數(shù)進(jìn)行染色體種群初始化;
S3、對(duì)各染色體支配關(guān)系進(jìn)行分類劃定帕累托階層,計(jì)算同一帕累托階層內(nèi)各染色體之間的擁擠距離,根據(jù)染色體所在的帕累托階層及所述擁擠距離計(jì)算適應(yīng)度值;
S4、判斷種群迭代次數(shù)是否達(dá)到預(yù)設(shè)上限,若達(dá)到,則輸出最優(yōu)解;否則,利用增強(qiáng)學(xué)習(xí)算法,并根據(jù)所述適應(yīng)度值優(yōu)化所述遺傳算法中的交叉概率Pc和變異概率Pm;
S5、選擇參與交叉的染色體種群,根據(jù)所述交叉概率Pc對(duì)所述參與交叉的染色體種群進(jìn)行交叉操作,生成參與變異的染色體種群;
S6、根據(jù)所述變異概率Pm對(duì)所述參與變異的染色體種群進(jìn)行變異操作,生成新染色體種群;返回S3,基于所述新染色體種群進(jìn)行計(jì)算。
進(jìn)一步地,所述建立柔性作業(yè)車間調(diào)度模型及其約束條件,包括:所述柔性作業(yè)車間調(diào)度模型描述為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連東軟信息學(xué)院,未經(jīng)大連東軟信息學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110383136.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測(cè)或優(yōu)化,例如線性規(guī)劃、“旅行商問(wèn)題”或“下料問(wèn)題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉(cāng)儲(chǔ)、裝貨、配送或運(yùn)輸;存貨或庫(kù)存管理,例如訂貨、采購(gòu)或平衡訂單
G06Q10-10 .辦公自動(dòng)化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- M-Learning無(wú)線網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)
- 一種客觀評(píng)價(jià)e-learning用戶體驗(yàn)質(zhì)量的方法
- 基于DeepLearning的領(lǐng)域概念抽取方法
- 基于E-Learning的海量數(shù)據(jù)挖掘分析系統(tǒng)
- 一種基于Q-learning的移動(dòng)端音樂(lè)播放器動(dòng)態(tài)調(diào)節(jié)能耗優(yōu)化方法
- 一種快速獲取到達(dá)程序指定點(diǎn)測(cè)試用例的方法
- 一種雙有源半橋直流變換器能耗優(yōu)化方法
- 一種基于改進(jìn)的Q-learning的最優(yōu)決策方法
- Q-learning輔助的連續(xù)消除翻轉(zhuǎn)譯碼器及其譯碼方法
- 基于Q-Learning算法的調(diào)整運(yùn)動(dòng)速度的方法、跑步機(jī)及提示裝置
- 用于實(shí)現(xiàn)多目標(biāo)方業(yè)務(wù)或操作的方法和裝置
- 基于智能視頻分析平臺(tái)的多目標(biāo)跟蹤方法及其系統(tǒng)
- 多目標(biāo)設(shè)計(jì)選擇方法和系統(tǒng)
- 一種針對(duì)多目標(biāo)的地面導(dǎo)航系統(tǒng)及其方法
- 一種無(wú)斷點(diǎn)多目標(biāo)信號(hào)合成方法
- 基于多智能體深度增強(qiáng)學(xué)習(xí)的多目標(biāo)跟蹤方法
- 一種多目標(biāo)跟蹤方法
- 一種航空紅外視頻多目標(biāo)檢測(cè)與跟蹤方法及裝置
- 一種多目標(biāo)推薦方法、多目標(biāo)推薦模型生成方法以及裝置
- 一種區(qū)域多目標(biāo)衛(wèi)星探測(cè)仿真方法及系統(tǒng)





