[發明專利]一種基于強化學習的基片集成波導參數優化方法及結構有效
| 申請號: | 202111165664.X | 申請日: | 2021-09-30 |
| 公開(公告)號: | CN113889737B | 公開(公告)日: | 2022-04-08 |
| 發明(設計)人: | 黃永茂;何宇;王未來;江婉 | 申請(專利權)人: | 西華大學 |
| 主分類號: | H01P11/00 | 分類號: | H01P11/00;H01P3/00;G06N20/00;G06F30/367;G06F30/27;G06F115/12 |
| 代理公司: | 成都睿道專利代理事務所(普通合伙) 51217 | 代理人: | 薛波 |
| 地址: | 610039 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 強化 學習 集成 波導 參數 優化 方法 結構 | ||
1.一種基于強化學習的基片集成波導參數優化方法,其特征在于,包括如下步驟:
步驟一、對待優化基片集成波導進行參數提取:基片集成波導的上表面金屬層上設有由N個直接連接的阻抗單元構成的阻抗網絡,N為大于等于1的正整數,阻抗單元的延伸方向與波導寬度方向呈θ的夾角,阻抗單元為橢圓形金屬貼片及其延伸方向連接的微帶線的組合,金屬貼片上開設有橢圓形缺口,其尺寸參數為L,包括橢圓形金屬貼片的短軸長度L1、長軸長度L2、微帶線長度L3以及微帶線間距離L4;
步驟二、根據Q-learning算法,基于強化學習中的ε貪婪策略,以待優化基片集成波導的參數夾角θ和尺寸L做范圍變化并代入三維電磁場仿真軟件進行變量仿真測試,得到參數對應的獎勵值或懲罰值,其中,所述參數夾角θ的取值范圍為0°~90°;
步驟三、根據所述參數對應的獎勵值或懲罰值,得到最優參數。
2.如權利要求1所述的基于強化學習的基片集成波導參數優化方法,其特征在于,所述步驟二具體包括:
對待優化基片集成波導的參數夾角θ和尺寸L進行初始化并建模,其中,對待優化的參數取隨機數,通過三維電磁場仿真軟件仿真得到仿真增益并將仿真增益設為初始狀態s;
以待優化基片集成波導的參數夾角θ和尺寸L做范圍變化,構建動作集A,以及設置獎懲函數R;
基于強化學習中的ε貪婪策略,根據初始狀態s從動作集A中選擇動作,將初始狀態s和動作輸入Q-learning強化學習模型進行計算,得到獎勵值或懲罰值,并對Q表進行更新,狀態由s轉移到s'。
3.如權利要求2所述的基于強化學習的基片集成波導參數優化方法,其特征在于,所述步驟二中,選取仿真增益在指定頻率內的最大值作為初始狀態s。
4.一種基片集成波導結構,其特征在于,由上述權利要求1-3任一項所述的基于強化學習的基片集成波導參數優化方法所得。
5.如權利要求4所述的基片集成波導結構,其特征在于,包括:介質基片(2),所述介質基片(2)的兩側設有金屬化通孔陣列(3),連接上、下表面金屬層(1);
所述介質基片(2)的上表面金屬層(1)上設置有與其連接的阻抗網絡(4),所述阻抗網絡(4)由N個阻抗單元構成,N為大于等于1的正整數,每個阻抗單元為金屬層(1)加工蝕刻成波導寬度方向的金屬貼片及其延伸方向連接的微帶線的組合,所述波導寬度方向的金屬貼片上開設有缺口,相鄰阻抗單元的金屬貼片之間由所述微帶線連接。
6.如權利要求5所述的基片集成波導結構,其特征在于,所述金屬貼片為橢圓形金屬貼片,所述缺口設置為橢圓形缺口,所述微帶線連接于橢圓形金屬貼片的短軸,每個阻抗單元的橢圓形金屬貼片的長軸依次連接。
7.如權利要求6所述的基片集成波導結構,其特征在于,所述橢圓形金屬貼片的長軸方向與波導寬度方向平行。
8.如權利要求6所述的基片集成波導結構,其特征在于,所述橢圓形金屬貼片的短軸長度L1/2為0.45mm,長軸長度L2/2為0.9mm、微帶線長度L3為0.3mm以及微帶線間距離L4為1.5mm。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西華大學,未經西華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111165664.X/1.html,轉載請聲明來源鉆瓜專利網。





