[發(fā)明專利]一種智能反射表面監(jiān)聽優(yōu)化方法、裝置及控制器有效
| 申請?zhí)枺?/td> | 202110975595.2 | 申請日: | 2021-08-24 |
| 公開(公告)號: | CN113810930B | 公開(公告)日: | 2023-05-23 |
| 發(fā)明(設計)人: | 李保罡;崔康佳;侯思祖;項洪印 | 申請(專利權)人: | 華北電力大學(保定) |
| 主分類號: | H04W24/02 | 分類號: | H04W24/02;H04B17/391;G06F30/27;G06N3/04;G06N3/08;G06N7/01;G06F111/04;G06F111/08 |
| 代理公司: | 石家莊國為知識產(chǎn)權事務所 13120 | 代理人: | 付曉娣 |
| 地址: | 071000 河*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 智能 反射 表面 監(jiān)聽 優(yōu)化 方法 裝置 控制器 | ||
1.一種智能反射表面監(jiān)聽優(yōu)化方法,其特征在于,應用于監(jiān)聽系統(tǒng)中的控制器,所述監(jiān)聽系統(tǒng)包括發(fā)送終端、智能反射表面、接收終端、監(jiān)聽終端和所述控制器,所述方法包括:
獲取所述監(jiān)聽系統(tǒng)中通信鏈路的信道狀態(tài)信息;
基于所述信道狀態(tài)信息建立所述監(jiān)聽系統(tǒng)的監(jiān)聽優(yōu)化模型,所述監(jiān)聽優(yōu)化模型的優(yōu)化目標為監(jiān)聽速率最大;
將所述監(jiān)聽優(yōu)化模型轉換為馬爾科夫過程;
基于深度學習算法對所述馬爾科夫過程進行求解,得到所述智能反射表面的最優(yōu)控制方案;
所述監(jiān)聽優(yōu)化模型包括目標函數(shù)和約束條件;
所述監(jiān)聽優(yōu)化模型的目標函數(shù)包括:
其中,α為所述監(jiān)聽終端的監(jiān)聽狀態(tài)指標,RD為所述接收終端的接收信息速率,Θ為所述智能反射表面的反射矩陣參數(shù);
所述監(jiān)聽優(yōu)化模型的約束條件包括:
其中,RE為所述監(jiān)聽終端的接收信息速率,θl為第l個反射單元的相位,Φ為離散相位范圍,L為所述智能反射表面的反射單元數(shù)量,約束C1和約束C2用于確保在α=1時可以成功監(jiān)聽到目標信號,約束條件C3是智能反射表面各個單元的相位約束;
所述將所述監(jiān)聽優(yōu)化模型轉換為馬爾科夫過程,包括:
將所述馬爾科夫過程表示為元組形式:
S,A,P,R,γ
其中,S代表狀態(tài)空間,A代表動作空間,P為狀態(tài)轉換概率函數(shù),R為獎勵函數(shù),γ為折扣系數(shù);
馬爾科夫決策的過程為,在時隙t內,觀測馬爾科夫決策過程的當前狀態(tài)st,根據(jù)當前狀態(tài)和預設的決策策略選擇一個行動at,在行動后接收到返回值rt,并進入下一狀態(tài)st+1中,循環(huán)執(zhí)行以上步驟,直至完成所有時隙的行動,在以上決策過程中,尋優(yōu)目標為積累獎勵值最大;其中,所述馬爾科夫決策過程為所述馬爾科夫過程;
所述積累獎勵值的表達式為:
其中,T為所有時隙的總時長;
所述基于深度學習算法對所述馬爾科夫過程進行求解,得到所述智能反射表面的最優(yōu)控制方案,包括:
基于所述馬爾科夫過程構建Q功能函數(shù);
基于貝爾曼法則和所述Q功能函數(shù)構建最優(yōu)策略下的最優(yōu)Q功能函數(shù);
基于深度學習神經(jīng)網(wǎng)絡計算最接近所述最優(yōu)Q功能函數(shù)的Q功能函數(shù)及對應的最優(yōu)控制方案。
2.如權利要求1所述的智能反射表面監(jiān)聽優(yōu)化方法,其特征在于,所述基于所述信道狀態(tài)信息建立所述監(jiān)聽系統(tǒng)的監(jiān)聽優(yōu)化模型,包括:
基于所述信道狀態(tài)信息確定第一接收信號和第二接收信號;所述第一接收信號為所述接收終端接收的信號,所述第二接收信號為所述監(jiān)聽終端接收的信號;
基于所述第一接收信號確定第一速率,所述第一速率為接收終端接收信息的速率;
基于所述第二接收信號確定第二速率,所述第二速率為監(jiān)聽終端接收信息的速率;
基于所述第一速率和所述第二速率建立所述監(jiān)聽優(yōu)化模型。
3.如權利要求1所述的智能反射表面監(jiān)聽優(yōu)化方法,其特征在于,所述基于深度學習算法對馬爾科夫過程進行求解,包括:
在神經(jīng)網(wǎng)絡訓練過程中,基于經(jīng)驗回放技術打破相鄰訓練序列之間的相關性。
4.如權利要求1所述的智能反射表面監(jiān)聽優(yōu)化方法,其特征在于,所述基于深度學習算法對所述馬爾科夫過程進行求解,包括:
在所述求解過程中,基于貪心算法進行迭代更新。
5.如權利要求1所述的智能反射表面監(jiān)聽優(yōu)化方法,其特征在于,所述基于深度學習算法對所述馬爾科夫過程進行求解,得到所述智能反射表面的最優(yōu)控制方案之后,所述方法還包括:
按照所述最優(yōu)控制方案對所述智能反射表面進行調整。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華北電力大學(保定),未經(jīng)華北電力大學(保定)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110975595.2/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:行走路線智能化微調系統(tǒng)
- 下一篇:一種增材制造裝備回收裝置





