[發明專利]一種基于空基可重構智能表面的安全傳輸方法及系統有效
| 申請號: | 202110724337.7 | 申請日: | 2021-06-29 |
| 公開(公告)號: | CN113472419B | 公開(公告)日: | 2022-12-06 |
| 發明(設計)人: | 唐曉;江天奇;王大偉;翟道森;張若南 | 申請(專利權)人: | 西北工業大學 |
| 主分類號: | H04W12/122 | 分類號: | H04W12/122;H04B7/185;H04B7/06;H04B17/391;G06N20/00 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 賀小停 |
| 地址: | 710072 陜西*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 空基可重構 智能 表面 安全 傳輸 方法 系統 | ||
1.一種基于空基可重構智能表面的安全傳輸方法,其特征在于,包括以下步驟:
S1,構建無線傳輸系統模型,通過部署ARIS來增強地面合法收發節點間的信息傳輸,同時抑制地面竊聽者的干擾攻擊,聯合優化ARIS波束成形與ARIS的部署使得安全傳輸速率達到最大;
S2,根據構建的無線傳輸系統模型,對無人機與地面源節點、目的節點以及竊聽節點間的信道增益進行建模,得到目的節點以及竊聽者處接收信號的表達式,計算出瞬時信噪比和安全傳輸速率;
S3,構造以ARIS波束成形與部署為優化變量,以最大化無線傳輸系統安全傳輸速率為目標函數的優化模型;
S4,在固定ARIS部署的條件下,通過松弛和半定規劃來求解優化問題,優化ARIS的波束成形最大化安全傳輸速率;
S5,將ARIS的部署優化問題建模為馬爾可夫決策過程,通過深度強化學習來優化ARIS的部署,根據ARIS當前位置的最優波束成形以及神經網絡中存儲的價值函數和經驗回放池,更新ARIS的位置直至最優位置,以最大化系統安全傳輸速率;
構建的無線傳輸模型由地面源節點S、目的節點D、竊聽者J以及部署在空中的可重構智能反射面I組成,I反射來自S發射的信號傳遞給D達到增強合法傳輸的效果,通過優化I的波束成形以及部署位置來最大化安全傳輸速率;
在目的節點D以及竊聽者J處接收到的信號表達式如下:
其中,s為發射信號,滿足hSD,hSJ,hID,hIJ,hSI表示相對應的信道狀態矩陣,nD和nJ分別為D和J處功率為的背景高斯噪聲,是ARIS的反射系數矩陣,并且
所述瞬時信噪比的表達式如下:
其中,Z∈{D,J},系統安全傳輸速率表達式如下:
R=[log(1+γD)-log(1+γJ)]+
其中,(·)+=max(·,0);
最大化安全傳輸速率為目標的優化問題的表達式如下:
其中,R為安全傳輸速率,θ為反射元件的相移,w是ARIS部署的水平位置,全部節點都位于由定義的區域內,和表示在x軸和y軸的刻度;
在固定ARIS部署的條件下,優化ARIS波束成形的方法如下:
根據固定ARIS部署的參數,將系統安全傳輸速率改寫為:
R=log(1+ζTr(ΨHSID))-log(1+ζTr(ΨHSIJ))
再根據引理“若φ(χ,x)=log(χ)-χx+1,x>0,則得到最優解在上述的安全傳輸速率公式中引入輔助變量則對安全傳輸速率公式進行如下近似處理:
接著將Ψ作為新的優化變量,通過半定松弛法,忽略其秩為1的約束,則ARIS波束成形的優化模型表述為如下半定規劃問題:
接著用現有優化求解器,有效求解上述半定規劃問題,并對優化結果Ψ進行高斯隨機化分解得到v,最后優化的相移向量根據得出,v的第一個元素總是1;
將ARIS部署的優化問題建模為馬爾可夫決策過程,具體步驟為:
定義時序為ARIS移動過程中時間的離散化序列,每一個時隙代理更新其決策;
定義狀態空間表示ARIS的當前狀態,其中ARIS部署的范圍位于定義的區域內,將該區域離散為網格狀,wt表示ARIS在t時刻所處的水平位置;
定義動作空間為ARIS在每一個狀態下即將要移動的方向,基于所考慮區域的離散網格化,可選的動作限制于四個方向上的單元移動;
定義獎勵當ARIS采取行動后移動到不同位置后,安全傳輸速率發生了改變,若ARIS采取的行動使得速率增加,給予智能體積極的獎勵,反之亦然,獎勵函數表示為:
定義狀態轉移概率狀態轉移概率由P(st+1|st,at)表示,表示給定當前狀態和動作轉移到下一個狀態的概率;
考慮到馬爾可夫決策過程具有龐大的狀態空間,DQN利用神經網絡來估計動作值函數可以比傳統的Q學習更加有效,通過深度強化學習優化ARIS部署,包括以下步驟:
S5021、設置強化學習參數,包括學習速率α,折扣因子γ,經驗回放空間大小N,批量學習值B,貪心指數ε以及更新速率C;
S5022、用θ表示現實神經網絡Q的參數,用θ′表示目標神經網絡Q′的參數;初始化經驗回訪空間初始化每個神經網絡的參數,訓練回合數;
S5023、將ARIS部署至初始位置,選擇初始的相移
S5024、更新時間t←t+1,根據當前ARIS位置通過步驟S4優化ARIS波束成形;
S5025、智能體觀察ARIS當前狀態,以ε的概率選擇最大化價值函數Q(wt,at;θ)的動作at,否則根據動作空間隨機選取一個動作,得到瞬時回報獎勵后轉移到下一狀態,即移動到新的位置;將轉移矩陣(wt,at,rt,wt+1)作為樣本存入經驗回放空間
S5026、若回放空間存儲樣本數大于N,進行步驟S5027;否則重復步驟S5025繼續收集樣本至
S5027、從經驗回放空間中隨機取樣B個樣本(wj,aj,rj,wj+1),然后通過梯度下降法最小化損失函數L(θ)來更新現實神經網絡的參數θ,具體為:
其中目標值Y是通過目標網絡Q′生成的:
S5028、間隔C個時序后更新顯示神經網絡參數θ以及目標神經網絡參數θ′,當ARIS到達當前訓練回合最優位置時退出當前訓練回合;否則回到步驟S5025;
S5029、若各個訓練回合得出的ARIS最優部署位置以及最大安全傳輸速率達到收斂,則退出訓練過程;否則進入新的訓練回合,回到步驟S5023;
完成訓練后,得到ARIS波束成形與部署的最優解,安全傳輸速率達到最大,從而保證通信系統安全傳輸。
2.一種基于空基可重構智能表面的安全傳輸系統,其特征在于,包括:
安全傳輸系統模塊,用于構建無線傳輸系統模型,通過部署ARIS來增強地面合法收發節點間的信息傳輸,同時抑制地面竊聽者的干擾攻擊,目標在于聯合優化ARIS波束成形與ARIS的部署使得系統的安全傳輸速率達到最大;
安全傳輸速率優化模塊,用于對無人機與地面源節點、目的節點以及竊聽節點間的信道增益進行建模,得到目的節點以及竊聽者處接收信號的表達式,計算出系統的瞬時信噪比和安全傳輸速率;
ARIS優化模塊,用于構造以ARIS波束成形與部署為優化變量,以最大化系統安全傳輸速率為目標函數的優化模型;
ARIS波束成形優化模塊,用于在固定ARIS部署的條件下,通過松弛和半定規劃來求解優化問題,優化ARIS的波束成形最大化安全傳輸速率;
ARIS部署優化模塊,用于將ARIS的部署優化問題建模為馬爾可夫決策過程,通過深度強化學習來優化ARIS的部署,根據ARIS當前位置的最優波束成形以及神經網絡中存儲的價值函數和經驗回放池,更新ARIS的位置直至最優位置,以最大化系統安全傳輸速率;
將基于空基可重構智能表面的安全傳輸系統裝配至無人機上,將攜帶著ARIS的無人機部署到目標區域,無人機根據所屬區域的網絡拓撲關系以及信道情況自行移動到最優位置,協助地面收發節點完成信息的安全傳輸;
構建的無線傳輸模型由地面源節點S、目的節點D、竊聽者J以及部署在空中的可重構智能反射面I組成,I反射來自S發射的信號傳遞給D達到增強合法傳輸的效果,通過優化I的波束成形以及部署位置來最大化安全傳輸速率;
在目的節點D以及竊聽者J處接收到的信號表達式如下:
其中,s為發射信號,滿足hSD,hSJ,hID,hIJ,hSI表示相對應的信道狀態矩陣,nD和nJ分別為D和J處功率為的背景高斯噪聲,是ARIS的反射系數矩陣,并且
所述瞬時信噪比的表達式如下:
其中,Z∈{D,J},系統安全傳輸速率表達式如下:
R=[log(1+γD)-log(1+γJ)]+
其中,(·)+=max(·,0);
最大化安全傳輸速率為目標的優化問題的表達式如下:
其中,R為安全傳輸速率,θ為反射元件的相移,w是ARIS部署的水平位置,全部節點都位于由定義的區域內,和表示在x軸和y軸的刻度;
在固定ARIS部署的條件下,優化ARIS波束成形的方法如下:
根據固定ARIS部署的參數,將系統安全傳輸速率改寫為:
R=Iog(1+ζTr(ΨHSID))-Iog(1+ζTr(ΨHSIJ))
再根據引理“若φ(χ,x)=log(χ)-χx+1,x>0,則得到最優解χ*=1/x”,在上述的安全傳輸速率公式中引入輔助變量χ,則對安全傳輸速率公式進行如下近似處理:
接著將Ψ作為新的優化變量,通過半定松弛法,忽略其秩為1的約束,則ARIS波束成形的優化模型表述為如下半定規劃問題:
接著用現有優化求解器,有效求解上述半定規劃問題,并對優化結果Ψ進行高斯隨機化分解得到v,最后優化的相移向量根據得出,v的第一個元素總是1;
將ARIS部署的優化問題建模為馬爾可夫決策過程,具體步驟為:
定義時序為ARIS移動過程中時間的離散化序列,每一個時隙代理更新其決策;
定義狀態空間表示ARIS的當前狀態,其中ARIS部署的范圍位于定義的區域內,將該區域離散為網格狀,wt表示ARIS在t時刻所處的水平位置;
定義動作空間為ARIS在每一個狀態下即將要移動的方向,基于所考慮區域的離散網格化,可選的動作限制于四個方向上的單元移動;
定義獎勵當ARIS采取行動后移動到不同位置后,安全傳輸速率發生了改變,若ARIS采取的行動使得速率增加,給予智能體積極的獎勵,反之亦然,獎勵函數表示為:
定義狀態轉移概率狀態轉移概率由P(st+1|st,at)表示,表示給定當前狀態和動作轉移到下一個狀態的概率;
考慮到馬爾可夫決策過程具有龐大的狀態空間,DQN利用神經網絡來估計動作值函數可以比傳統的Q學習更加有效,通過深度強化學習優化ARIS部署,包括以下步驟:
S5021、設置強化學習參數,包括學習速率α,折扣因子γ,經驗回放空間大小N,批量學習值B,貪心指數ε以及更新速率C;
S5022、用θ表示現實神經網絡Q的參數,用θ′表示目標神經網絡Q′的參數;初始化經驗回訪空間初始化每個神經網絡的參數,訓練回合數;
S5023、將ARIS部署至初始位置,選擇初始的相移
S5024、更新時間t←t+1,根據當前ARIS位置通過ARIS波束成形優化模塊優化ARIS波束成形;
S5025、智能體觀察ARIS當前狀態,以ε的概率選擇最大化價值函數Q(wt,at;θ)的動作at,否則根據動作空間隨機選取一個動作,得到瞬時回報獎勵后轉移到下一狀態,即移動到新的位置;將轉移矩陣(wt,at,rt,wt+1)作為樣本存入經驗回放空間
S5026、若回放空間存儲樣本數大于N,進行步驟S5027;否則重復步驟S5025繼續收集樣本至
S5027、從經驗回放空間中隨機取樣B個樣本(wj,aj,rj,wj+1),然后通過梯度下降法最小化損失函數L(θ)來更新現實神經網絡的參數θ,具體為:
其中目標值Y是通過目標網絡Q′生成的:
S5028、間隔C個時序后更新顯示神經網絡參數θ以及目標神經網絡參數θ′,當ARIS到達當前訓練回合最優位置時退出當前訓練回合;否則回到步驟S5025;
S5029、若各個訓練回合得出的ARIS最優部署位置以及最大安全傳輸速率達到收斂,則退出訓練過程;否則進入新的訓練回合,回到步驟S5023;
完成訓練后,得到ARIS波束成形與部署的最優解,安全傳輸速率達到最大,從而保證通信系統安全傳輸。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110724337.7/1.html,轉載請聲明來源鉆瓜專利網。





