[發明專利]基于能量收割技術的在線無人機輔助數據收集方法及裝置有效
| 申請號: | 202011392994.8 | 申請日: | 2020-12-02 |
| 公開(公告)號: | CN112752357B | 公開(公告)日: | 2022-06-17 |
| 發明(設計)人: | 張寧;劉娟;謝玲富;童鵬 | 申請(專利權)人: | 寧波大學 |
| 主分類號: | H04W84/18 | 分類號: | H04W84/18 |
| 代理公司: | 北京華創智道知識產權代理事務所(普通合伙) 11888 | 代理人: | 彭隨麗 |
| 地址: | 315211 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 能量 收割 技術 在線 無人機 輔助 數據 收集 方法 裝置 | ||
1.一種基于能量收割技術的在線無人機輔助數據收集方法,其特征在于,包括:
初始化:無人機的無線傳感器網絡中,有1架無人機和M個隨機分布的地面傳感器節點,無人機作為移動中繼收集每個傳感器節點采集到的采樣數據并轉發到數據中心,在一定時間內按照一定路徑飛行,在每一個飛行時刻,無人機節點向當前時刻調度出的地面傳感器節點發射無線信號,確認無人機是否需要進行數據收集和能量補充;以傳感器節點所處平面為X軸和Y軸,以所述平面垂直方向為Z軸進行三維立體圖初始化設計;每個所述傳感器節點的位置記為Lm=[xm,ym](m=1,2,3,……,M),作為接收無人機傳輸數據的數據中心位置記為L0;設定無人機在空中的水平飛行高度是h米;無線傳感網絡中以時隙劃分時間,設Tts表示一個時隙長度;初始化全局網絡的策略網絡參數θa和評價網絡參數θc,子網絡的策略網絡參數θ’a=θa和評價網絡參數設置為θ’c=θc;無人機的飛行模式包括工作模式和等待模式,所述工作模式為無人機進行正常飛行和轉發其服務范圍內的傳感器節點數據;所述等待模式為當所述無人機在所述工作模式下剩余能量低于第一閾值Eth,無人機降落在地面上以避免能量不足引起意外墜毀,對應能耗為降落能耗edes;設定所述工作模式和等待模式切換的第一閾值為Eth,初始化時隙數為n=1,每經過一個時隙n自增1;初始化無人機飛行的最長時隙數為N;
步驟S1:初始化所述全局網絡的策略網絡參數θa和評價網絡參數θc的梯度dθa=0,dθc=0;初始化更新全局網絡的時間間隔nup個時隙;無人機攜帶能量用E(n)表示,能耗用e(n)表示,n為時隙數;無人機初始位置所攜帶電量為滿電量E(1)=Eumax,初始位置為Lu(1)=[x1,y1];初始化傳感器節點數據的信息年齡Am(n),m=1,2,3,……,M;生命長度Um(n),m=1,2,3,……M和隊列長度qm(n),m=1,2,3,……,M;
步驟S2:無人機遍歷獲取時隙n初始時刻所有傳感器節點數據的信息年齡、生命長度和隊列長度;并將所述信息年齡、生命長度、隊列長度、無人機的位置Lu與無人機攜帶能量E(n)作為該時隙的狀態s(n),判斷無人機攜帶能量E(n)是否小于能量閾值Eth,若是,執行步驟S3進入等待模式,若否,執行步驟S4進入工作模式,用Zm(n)∈{0,1}表示節點m在時隙n的服務狀態;其中Zm(n)=1表示傳感器節點m的數據上傳到無人機并由無人機轉發數據至數據中心,反之Zm(n)=0;因此傳感器節點m的隊列長度更新為:
qm(n+1)=max{qm(n)-Zm(n)qm(n),0}+Cm(n);
用表示傳感器節點m最新采樣的數據包在時隙n的生命長度;在時隙n,若有一個新的數據包到達,則其生命長度記為1,即Um(n)=1;若沒有新的數據包到達,且節點將數據上傳到無人機,那么傳感器節點數據為空,即Um(n)=0;否則生命周期隨著時隙數以1為起點遞增,其更新過程為:
信息年齡表示采樣數據的新鮮程度,若無人機在時隙n將節點m的數據轉發至數據中心,該節點信息年齡記為節點的生命長度Um(n),否則隨著時隙數以1遞增,其更新過程為
步驟S3:無人機停止在空中飛行,選擇降落在地面上,無人機依靠太陽能、風能進行能量收集,待無人機能量超過等待模式切換至工作模式的第二閾值Efl后執行步驟S4,時隙數n自增1;
步驟S4:子網絡的策略網絡給出狀態s(n)下采取各個動作的概率π(a(n)|s(n);θ′a),子網絡的評價網絡給出狀態s(n)下的評價價值V(s(n);θ'c),無人機執行子網絡的策略網絡決定的動作a(n),所述動作包括飛行動作af(n)和或選取節點傳輸動作ai(n);
步驟S5:判斷動作a(n)中是否包括選取節點傳輸動作ai(n),若是,則傳感器節點將其緩存內所有數據上傳至無人機,由無人機轉發所述數據至所述數據中心;若否,則無人機將在整個時隙內用于飛行,時隙數n自增1;
步驟S6:判斷n是否為nup的倍數或n是否等于無人機飛行的最長時隙數N,若是,則分別利用所述全局網絡的策略網絡參數θa和評價網絡參數θc的梯度dθa=0,dθc=0,更新全局網絡參數θa和θc,子網絡獲取全局參數θ'a=θa,θ'c=θc,無人機執行a(n)后達到時隙數n為nup的倍數或n等于無人機飛行的最長時隙數N時,利用無人機所得到的nup個時隙下作出的每個動作的代價值集合c、狀態集合s和動作集合a來計算相應的梯度,時隙j梯度的累積計算方式如下:
其中表示從時隙j起始的長期回報,γ為折扣因子,β為熵的權重,利用熵H(π(s(j);θ'a))來加大動作探索;若否,則執行步驟S7;
步驟S7:判斷n是否小于無人機飛行的最長時隙數N,若是,則返回步驟S2;若否,則停止數據收集,返回無人機所采集的所有傳感器節點信息年齡的平均值和無人機采集過程中的能耗e(n)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寧波大學,未經寧波大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011392994.8/1.html,轉載請聲明來源鉆瓜專利網。





