[發明專利]環境不確定遙感衛星網絡下的智能資源聯合調度方法有效

申請號：	202011251365.3	申請日：	2020-11-09
公開（公告）號：	CN112422171B	公開（公告）日：	2021-09-03
發明（設計）人：	周笛;王怡昕;盛敏;李建東;吳家鑫;戴諾伊;王晨光;白衛崗	申請（專利權）人：	西安電子科技大學
主分類號：	H04B7/185	分類號：	H04B7/185;H04L12/24;H04W24/02;H04W24/06;H04W28/16;H04W72/04
代理公司：	陜西電子工業專利中心 61205	代理人：	程曉霞;王品華
地址：	710071***	國省代碼：	陜西;61
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	環境不確定遙感衛星網絡智能資源聯合調度方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種環境不確定遙感衛星網絡下的智能資源聯合調度方法，其特征在于，建立的網絡模型適用于遙感衛星網絡所處環境和其資源調度場景，通過強化學習避免了直接求解高復雜度的規劃問題和狀態空間連續、無限的難題，包括有如下步驟：

(1)建立環境不確定的遙感衛星網絡模型：首先確定遙感衛星網絡規模及參數，包括遙感衛星和地面站的個數及位置，接著定義遙感衛星網絡狀態集S、動作集A、獎勵R、動作價值函數所述狀態集S＝{B×D×H×E^H}，在第i時隙開始時刻，遙感衛星網絡的狀態S_i包括電池現有電量B_i，數據緩沖區現有數據量D_i，信道參數H_i和吸收太陽能量四部分；根據ITU-R P.618-13、ITU-R P.838和ITU-R P.839建議書的標準，建立星地、星間鏈路的動態信道模型，仿真獲得信道參數H_i；考慮衛星運轉的軌道特性，建立動態能量收集模型，仿真獲得吸收太陽能量所述動作集A＝{A_r×A_t}包括接收功率{A_r}和發送功率{A_t}兩部分，可分別表示為和其中，δ表示步長，0表示不接收或不發送數據，P^MAX表示功率最大值，當傳輸鏈路為星地鏈路時，否則，所述獎勵R以衛星在時隙初始時刻發送的數據量表示；所述動作價值函數的含義是智能體以策略π為指導，在狀態S_i下，執行動作P_i后，獲得回報的期望；完成環境不確定的遙感衛星網絡模型的建立；

(2)產生環境參數的數據：通過STK軟件仿真遙感衛星網絡模型導出一個拓撲周期內環境參數的原始數據，并通過MATLAB軟件處理以上原始數據，獲得鏈路通斷、鏈路連接時長、遙感衛星的位置以及每時隙位于陽面時長，上述數據作為智能資源聯合調度方法的環境參數數據；

(3)初始化智能資源聯合調度方法所需參數：智能資源聯合調度方法所需參數包括有，一周期的時隙數T，星載電池容量B_max，電池容量門限B_min，數據存儲器容量D_max，靜態功耗P_cons，單位時隙長度τ，探索率ε，Critic網絡參數ω_critic，Actor網絡參數ω_actor，學習率α，Critic網絡參數的更新間隔T_copy，Actor網絡參數的更新間隔T_train，訓練總時隙數I，當前時隙數i，折扣因子γ；

(4)指導衛星進行功率分配：觀察狀態S_i，基于每一可行動作，通過定義反映遙感衛星工作特性及環境影響的六維特征函數，提取狀態、動作對的特征向量f_i(S_i,P_i)，結合Actor網絡參數ω_actor，使用ε-greedy策略在可行動作集中選擇一動作P_i作為當前時隙的功率分配方案，指導衛星進行功率分配；

(5)遙感衛星網絡狀態預轉移：計算環境不確定的遙感衛星網絡模型中的獎勵R_i，判斷是否完成迭代：i＝I，若是，則轉至步驟(10)，否則，進行下一步，執行新一輪迭代；

(6)指導衛星進行功率預分配：觀察預狀態S′_i，基于每一可行動作，通過定義反映遙感衛星工作特性及環境影響的六維特征函數，提取狀態、動作對的特征向量f′_i(S′_i,P_i′)，結合Actor網絡參數ω_actor，使用ε-greedy策略在可行動作集中選擇一動作P_i′作為下一時隙預選的功率分配方案，并把樣本(f_i,P_i,R_i,f_i′,P_i′)放入經驗存儲器，用于后續網絡參數更新；

(7)Critic網絡參數ω_critic更新判斷：對當前時隙數i和Critic網絡參數的更新間隔T_copy進行取余運算，判斷取余運算結果是否滿足i％T_copy＝0，若是，則按照ω_critic＝ω_actor的規則來更新Critic網絡參數ω_critic，進行下一步，否則，直接進行下一步；

(8)Actor網絡參數ω_actor更新判斷：對當前時隙數i和Actor網絡參數的更新間隔T_train進行取余運算，判斷取余運算結果是否滿足i％T_train＝0，若是，則根據梯度下降策略來更新Actor網絡參數ω_actor，進行下一步，否則，直接進行下一步；

(9)更新遙感衛星網絡的狀態、動作和當前時隙數：S_i+1＝S′_i，P_i+1＝P_i′，i＝i+1，完成一次迭代，接著轉至步驟(5)；

(10)得到指導聯合調度的網絡參數ω_critic：輸出通過環境不確定遙感衛星網絡下的智能資源聯合調度方法訓練得到的網絡參數ω_critic，環境不確定遙感衛星網絡下的智能資源聯合調度方法結束；在實際應用中，基于此參數，根據greedy策略，即ε＝0下的ε-greedy策略，產生資源聯合調度方案。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學，未經西安電子科技大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202011251365.3/1.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

H 電學

H04 電通信技術
H04B 傳輸
H04B7-00 無線電傳輸系統，即使用輻射場的
H04B7-005 .傳輸的控制;均衡
H04B7-01 .減少相移
H04B7-015 .減少回波效應
H04B7-02 .分集系統
H04B7-14 .中繼系統

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】