[發明專利]面向頻譜認知的無人機路徑自主規劃裝置及方法有效
| 申請號: | 202010213159.7 | 申請日: | 2020-03-24 |
| 公開(公告)號: | CN111431644B | 公開(公告)日: | 2022-06-10 |
| 發明(設計)人: | 劉東;黃洋;朱秋明;吳啟暉;仲偉志;胡田鈺;吳光宇;成能;杜孝夫 | 申請(專利權)人: | 南京航空航天大學 |
| 主分類號: | H04B17/382 | 分類號: | H04B17/382;G05D1/10;G01S11/06 |
| 代理公司: | 江蘇圣典律師事務所 32237 | 代理人: | 賀翔 |
| 地址: | 210016 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 頻譜 認知 無人機 路徑 自主 規劃 裝置 方法 | ||
1.一種面向頻譜認知的無人機路徑自主規劃方法,其特征在于:步驟如下:
第一步:測量前檢查裝置同步校準設備,檢查各模塊之間線纜連接是否正常,初始化系統各模塊設置,根據當前執行的頻譜認知任務,狀態信息認知單元(1-2)的中央處理器模塊(1-7)選擇調用算法程序模塊;
第二步:無人機飛行動作記為ak,其中ak為定義為多方向的某一方向上飛行一定距離,所有的動作組成了此次頻譜認知任務中的無人機飛行動作集合A,控制無人機處于設定的高度,在懸停位置旋轉多個方向或者利用天線陣列通過控制接收波束成型測量多個方向的信號,無人機平臺單元(1-1)的狀態信息獲取模塊(1-4)完成當前無人機飛行位置每一方向上的頻譜認知任務狀態信息的獲取,并將獲取的頻譜認知任務狀態信息傳遞給無人機平臺單元的機載數據鏈收發模塊(1-5),機載數據鏈收發模塊(1-5)發送頻譜認知任務狀態信息數據給狀態信息認知單元(1-2)的地面接收模塊接收(1-6),地面接收模塊(1-6)傳輸頻譜認知任務狀態信息數據給中央處理器模塊(1-7);
第三步,在中央處理器模塊(1-7)中,基于從地面接收模塊(1-6)收到的當前無人機飛行位置每一個方向上的頻譜認知任務狀態信息得到對應方向上的狀態和對應方向上的獎勵回報值,狀態記為sk,獎勵回報值記為rk,通過相鄰時刻獲取的微弱信號源強度信息的變化來設置rk,rk滿足以下要求:
rk為當前無人機在該時刻執行動作獲得的微弱信號源強度和上一時刻獲得的微弱信號源強度的差值,即rk=Pr(k)-Pr(k-1),記長期累加回報獎勵值折扣因子為γ∈[0,1];
定義每個無人機狀態和無人機飛行動作組成一個狀態—動作對(s,a),記Q為狀態—動作對所映射的值,狀態—動作對與該值構成值函數Q(s,a),表示指定狀態—動作對的累積獎賞回報值,則基于動作集、狀態集組成了一張表格記作Q值表,初始化時置零,通過每次執行無人機飛行動作后狀態的變化及得到的獎勵回報值來不斷更新Q值表,然后基于Q值表和當前無人機狀態決策出下一時刻的無人機飛行動作;
以上更新Q值表的過程,描述如下:執行當前動作ak后的獎勵回報值rk加上執行當前動作后的無人機飛行狀態sk+1對應Q值表中的最大值φ的γ倍,γ為長期累加回報獎勵值折扣因子減去無人機當前對應的狀態記為sk和無人機當前執行的動作記為ak對應的Q值表中的Q值Q(sk,ak)得到結果的α倍再加上無人機當前對應的狀態記為sk和無人機當前執行的動作記為ak對應的Q值表中的Q值Q(sk,ak),其結果為在此迭代過程中的新的Q值Q(sk,ak);
其中,執行飛行動作ak后,在k+1時刻無人機飛行狀態到達sk+1狀態,φ為sk+1狀態下所有飛行動作里的對應的最大Q值;
當執行微弱信號源探測的頻譜認知任務時:
無人機狀態s和Pr對應關系可采用以下方式:
當Pr>P1時:s=1;當P1≤Pr﹤P2時:s=2;當P2≤Pr﹤P3時:s=3;...當Pr<Pn時:s=n;其中,P1,P2,P3,...,Pn為初始設置的、表示信號強度的常量值
即所有無人機狀態組成狀態集s∈{1,2,3,...,n};
rk采用以下方式:
當獲取的方向性信號強度得到的平均值為Pr(k)大于等于P0+θ或者小于等于P0+θ時,rk等于ω0乘以e的二分之Pr(k)減P0的平方次冪,ω0為一系數常量;
當獲取的方向性信號強度得到的平均值為Pr(k)大于等于P0+θ或者小于等于P0+θ時,rk等于ω0乘以e的二分之P0平方次冪;
第四步,狀態信息認知單元(1-2)的中央處理器模塊(1-7)中的無人機飛行動作決策部分基于ε-greedy動作選擇策略,來決策出無人機下一時刻的飛行動作,接著中央處理器模塊(1-7)向無人機平臺單元(1-1)的機載數據鏈收發模塊(1-4)發出的無人機飛行動作決策指令信息;
第五步,狀態信息認知單元(1-2)的中央處理器模塊(1-7)發出的無人機飛行動作決策指令信息由無人機平臺單元(1-1)的機載數據鏈收發模塊(1-4)的接收,然后反饋給無人機平臺單元(1-1)的飛行路徑控制模塊(1-3),飛行路徑控制模塊(1-3)根據收到的無人機飛行動作決策指令信息執行下一時刻無人機的飛行動作;
第六步,若沒有達到預先設定的頻譜認知任務完成的條件,則返回第二步繼續迭代執行高動態環境下的頻譜認知任務,若達到了預先設定的頻譜認知任務完成的條件,則結束任務。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京航空航天大學,未經南京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010213159.7/1.html,轉載請聲明來源鉆瓜專利網。





