[發(fā)明專利]一種可拓展多微波源協(xié)同輸出的智能微波反應(yīng)器系統(tǒng)有效

申請(qǐng)?zhí)枺?/td>	202110151601.2	申請(qǐng)日：	2021-02-03
公開（公告）號(hào)：	CN112947174B	公開（公告）日：	2023-04-07
發(fā)明（設(shè)計(jì)）人：	楊彪;高皓;成宬;杜婉;劉承;馬紅濤	申請(qǐng)（專利權(quán)）人：	昆明理工大學(xué)
主分類號(hào)：	G05B19/042	分類號(hào)：	G05B19/042
代理公司：	昆明人從眾知識(shí)產(chǎn)權(quán)代理有限公司 53204	代理人：	何嬌
地址：	650093 云***	國(guó)省代碼：	云南;53
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種拓展微波協(xié)同輸出智能反應(yīng)器系統(tǒng)
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫(kù) 專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種可拓展多微波源協(xié)同輸出的智能微波反應(yīng)器系統(tǒng)，其特征在于：包括用于實(shí)現(xiàn)基于強(qiáng)化學(xué)習(xí)的控制策略的PC模塊(1)、用于給磁控管(13)供電的磁控管電源模塊(7)、與各個(gè)磁控管電源連接用于直接精準(zhǔn)調(diào)節(jié)磁控管功率的功率控制模塊(5)、用于溝通功率控制模塊(5)與PC模塊(1)的通信模塊(3)、以及用作參數(shù)反饋的采樣模塊(10)；

實(shí)現(xiàn)Q學(xué)習(xí)的步驟如下：

Step1：基礎(chǔ)配置；

Step2：各模塊自檢與初始數(shù)據(jù)的打包廣播，饋入功率，進(jìn)入加熱過程；

Step3：收集采樣數(shù)據(jù)與分發(fā)功率控制數(shù)據(jù)；

Step4：根據(jù)不同的CAN應(yīng)用協(xié)議設(shè)置各源數(shù)據(jù)的過濾情況，組成不同額通信拓?fù)浣Y(jié)構(gòu)；

Step5：使用免模型的異策略Q-學(xué)習(xí)算法，計(jì)算各源需要的最佳饋入功率；

Step5.1設(shè)置算法參數(shù)；α∈[0，1]，貪心參數(shù)ε∈[0，1]，折扣因子γ∈[0，1]；

Step5.2初始化值函數(shù)矩陣Q(S，A)；

除最終狀態(tài)Q外，Q(s，a)＝0；

Step5.3開始一個(gè)回合，選取當(dāng)前回合的起始狀態(tài)S；

Step5.4從當(dāng)前起始狀態(tài)S的動(dòng)作空間中使用ε-貪心法構(gòu)造一個(gè)隨機(jī)的行動(dòng)策略；

Step5.5執(zhí)行動(dòng)作A，觀察獲得其對(duì)應(yīng)的R和S′；其中S′為執(zhí)行動(dòng)作后的下一個(gè)狀態(tài)，R為執(zhí)行動(dòng)作的即時(shí)獎(jiǎng)勵(lì)；

Step5.6使用Q(S，A)←Q(S，A)+α[R+γmax_aQ(S′，a)-Q(S，A)]，更新Q函數(shù)；

Step5.7更新狀態(tài)，S←S′；

Step5.8S是否已經(jīng)達(dá)到最終狀態(tài)，沒有則轉(zhuǎn)到Step5.4；否則此回合結(jié)束；

Step5.9開始下一回合，轉(zhuǎn)到Step5.3；

Step6：完成一次加熱，保存數(shù)據(jù)，本次最優(yōu)策略作為下次加熱初始策略；

所述PC模塊(1)即為在電腦上設(shè)計(jì)的一個(gè)上位機(jī)控制軟件，其中包含窗口化的人機(jī)交互控制界面以及后臺(tái)用于運(yùn)算控制策略的強(qiáng)化學(xué)習(xí)算法；

所述強(qiáng)化學(xué)習(xí)算法采用Q-學(xué)習(xí)算法，用如式(1)所示的離散化指標(biāo)作為狀態(tài)表征：

設(shè)系統(tǒng)中有m組微波源，離散地，將微波源的功率劃分為k個(gè)功率檔，則整個(gè)系統(tǒng)中將會(huì)有種行為，由狀態(tài)和行為來構(gòu)建獎(jiǎng)勵(lì)矩陣R，并在迭代運(yùn)算過程中根據(jù)獎(jiǎng)勵(lì)矩陣更新Q值矩陣，最后由Q值矩陣推斷出一個(gè)最優(yōu)控制策略，并在每一次加熱過程中不斷學(xué)習(xí)并優(yōu)化控制策略；

狀態(tài)確定后就要確定使?fàn)顟B(tài)發(fā)生的動(dòng)作；

設(shè)系統(tǒng)中有m組微波源，離散地將微波源的功率劃分為k個(gè)功率檔，則整個(gè)系統(tǒng)中將會(huì)有種行為；

根據(jù)狀態(tài)和行為構(gòu)建如式(2)所示的獎(jiǎng)勵(lì)矩陣R_xy為：

其中x為表示狀態(tài)的編號(hào)，y為表示行為的編號(hào)，如r(x，y)就是在狀態(tài)s_x執(zhí)行動(dòng)作a_y的即時(shí)獎(jiǎng)勵(lì)R；其中數(shù)值，需要按照目標(biāo)要求進(jìn)行設(shè)置與調(diào)整，具體方法為：若狀態(tài)從s_i到s_j，i＜j，即狀態(tài)向著更均勻方向轉(zhuǎn)移，則獎(jiǎng)勵(lì)值為正，且i，j之間差值越大，獎(jiǎng)勵(lì)值越大；反之則獎(jiǎng)勵(lì)值為負(fù)，越小；然后在隨機(jī)選擇動(dòng)作后，觀察轉(zhuǎn)移到的狀態(tài)，即有了起始狀態(tài)s_i和下一狀態(tài)s_j，由此得到r(x，y)；如算法Step5.5中所述，在迭代過程中，就由如算法Step5.5來獲取即時(shí)獎(jiǎng)勵(lì)帶入Step5.6運(yùn)算，用來更新Q(S，A)；

將Step5.6中不停迭代更新的Q(S，A)構(gòu)構(gòu)建如式(3)所示的Q值矩陣Q_xy為：

其中x為表示狀態(tài)的編號(hào)，y為表示行為的編號(hào)，如Q(x，y)就是在狀態(tài)s_x執(zhí)行動(dòng)作a_y的Q值；在進(jìn)行多回合循環(huán)迭代后，最后得到一個(gè)Q值矩陣，用這個(gè)矩陣作為指導(dǎo)，每一步挑出一個(gè)使Q值最大的步驟，就能輸出一個(gè)最優(yōu)策略。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于昆明理工大學(xué)，未經(jīng)昆明理工大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110151601.2/1.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

上一篇：四邊彎曲結(jié)構(gòu)凹面整面印刷裝置及方法
下一篇：一種壓裂液低溫破膠劑及其制備方法

同類專利

專利分類

G 物理

G05 控制；調(diào)節(jié)
G05B 一般的控制或調(diào)節(jié)系統(tǒng)；這種系統(tǒng)的功能單元；用于這種系統(tǒng)或單元的監(jiān)視或測(cè)試裝置
G05B19-00 程序控制系統(tǒng)
G05B19-02 .電的
G05B19-43 .流體的
G05B19-44 ..氣動(dòng)的
G05B19-46 ..液壓的
G05B19-04 ..除數(shù)字控制外的程序控制，即順序控制器或邏輯控制器

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】