[發明專利]一種通過動態調度無人終端最小化感知數據獲取時延方法有效
| 申請號: | 202011613662.8 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112867023B | 公開(公告)日: | 2021-11-19 |
| 發明(設計)人: | 劉馳;戴子彭 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | H04W16/22 | 分類號: | H04W16/22;H04W24/02;H04W56/00;H04W72/12 |
| 代理公司: | 北京中海智圣知識產權代理有限公司 11282 | 代理人: | 楊樹芬 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 通過 動態 調度 無人 終端 最小化 感知 數據 獲取 方法 | ||
1.一種通過動態調度無人終端最小化感知數據獲取時延方法,其特征在于,包括:
步驟1、基站主進程設立分布式優先經驗復用池并初始化所有傳感器的數據獲取時延;
步驟2、基站開啟子進程模擬無人終端軌跡數據獲取時延上傳至分布式優先經驗復用池;
步驟3、基站基于分布式優先經驗復用池采用分位數誤差矩陣算法求解最小化感知數據獲取時延的最優軌跡;
步驟301、基站判斷分布式優先經驗復用池是否收集10%存儲空間的經驗數據,當不滿足時,各子進程還需要采用異步執行方式獲取10%存儲空間的經驗數據;
步驟302、當分布式優先經驗復用池存在滿足10%空間的經驗數據,分布式優先級經驗復用池中依照現有的優先級w采樣出批量經驗數據;
步驟303、基站的主進程根據批量經驗數據,按照第一計算模型計算當前最佳動作第一計算模型如下式(1):
上式(1)中,為滿足0到0.25間的均勻分布的一個隨機乘子,為價值采樣,G為采樣次數,argmax表示選取期望值最大的向量元素操作;
步驟304、基站將當前最佳動作發送至仿真環境中的無人終端,無人終端根據當前最佳動作更新到下一個局面狀態st+1,基站的主進程按照第一計算模型計算下一最佳動作
步驟305、基站的主進程根據當前局面狀態st、本次移動和數據獲取動作at、以及下一個局面狀態st+1、下一最佳動作按照第二模型計算誤差矩陣TD的各個元素TDij,第二計算模型如下式(2):
上式(2)中,TDij為誤差矩陣TD的各個元素,rt為當前局面獎勵,為當前局面分布的獨立均勻采樣,為下一個局面分布的獨立均勻采樣,γ為衰減因子;
步驟306、基站的主進程通過第三計算模型的梯度下降法更新參數,第三計算模型如下式(3):
上式(3)中,為目標函數,Huber為組合數學中常用的分位數誤差計算函數;
步驟307、基站的主進程通過誤差矩陣TD的各個元素TDij和第四計算模型更新優先級經驗復用池的優先級wt,第四計算模型如下式(4):
上式(4)中,wmin為給定的優先級下限;
步驟308、基站的主進程初始化仿真環境,并基于優化后的優先級經驗復用池的優先級wt輸出無人終端每一步的最佳動作,在無人終端執行完T步動作時,輸出該動作序列,該序列為可最小化當前環境感知數據獲取時延的最優軌跡;
步驟4、基站向無人終端發送最優軌跡動態調動指令獲取感知區域內傳感器的最新數據。
2.根據權利要求1所述的通過動態調度無人終端最小化感知數據獲取時延方法,其特征在于,步驟1所述基站主進程設立分布式優先經驗復用池并初始化所有傳感器的數據獲取時延包括:
在移動群智感知技術場景的基站上建立一個空的分布式優先級經驗復用池,然后建立多個子進程,并初始化各子進程中仿真環境的參數,其中,仿真環境的參數包括無人終端位置、無人終端電量、傳感器位置和各傳感器的數據獲取時延。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011613662.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:間歇定量高粘度生物制劑噴涂槍
- 下一篇:一種比例控制的安全閥泄壓方法及裝置





