[發明專利]無人機定點誘騙方法、裝置、電子設備與存儲介質有效
| 申請號: | 202011176052.6 | 申請日: | 2020-10-29 |
| 公開(公告)號: | CN112019297B | 公開(公告)日: | 2021-03-30 |
| 發明(設計)人: | 劉鑫;姜化京;姜維 | 申請(專利權)人: | 上海特金無線技術有限公司 |
| 主分類號: | H04K3/00 | 分類號: | H04K3/00;G08G5/00 |
| 代理公司: | 上海慧晗知識產權代理事務所(普通合伙) 31343 | 代理人: | 徐海晟 |
| 地址: | 201114 上海市閔*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 無人機 定點 誘騙 方法 裝置 電子設備 存儲 介質 | ||
1.一種無人機定點誘騙方法,應用于誘騙設備,其特征在于,包括:
確定目標無人機當前時刻的環境狀態,所述環境狀態記載了對應時刻的位置以及該時刻之前多個時刻的位置;所述目標無人機為進入監管區域的無人機;
若當前所選擇的誘騙策略選擇方式為第一方式,則將所述當前時刻的環境狀態輸入識別模型,以利用所述識別模型識別出采用每個誘騙策略的當前長遠回報,并選擇當前長遠回報最高的誘騙策略作為所述當前時刻的誘騙策略,以實現所述第一方式;其中,不同誘騙策略對應不同的定位信號,所述當前時刻的誘騙策略所對應的定位信號為所述誘騙定位信號;
以預設功率將所述誘騙定位信號發送至所述目標無人機,以利用所述誘騙定位信號壓制所述目標無人機的真實定位信號;
根據所述目標無人機在當前時刻的位置,以及預設的誘騙目的地,計算采用上一個時刻的誘騙策略所產生的當前瞬時回報;
獲取所述當前時刻的環境狀態、所述上一個時刻的環境狀態,以及所述當前瞬時回報作為一組誘騙經驗,并利用所獲取到的誘騙經驗,更新用于訓練所述識別模型的數據集;
其中,根據所述目標無人機在當前時刻的位置,以及預設的誘騙目的地,計算采用上一個時刻的誘騙策略所產生的當前瞬時回報,包括:
根據所述誘騙目的地相對于所述目標無人機當前位置的方位,以及所述目標無人機的當前速度方向,確定當前方位收益;所述當前速度方向表征了在所述當前時刻,所述目標無人機的飛行速度的方向
根據所述目標無人機當前位置與所述誘騙目的地的當前距離,確定當前距離收益;
根據所述當前方位收益與所述當前距離收益,確定所述當前瞬時回報;
所述識別模型為卷積神經網絡,所識別出的長遠回報是利用Q函數的Q值來表征的;
所述Q函數的定義式為:
其中:
表示獎勵折扣系數;
Q* ()表示Q函數的Q值;
r表示瞬時回報;
表示誘騙策略;
表示下一個狀態的誘騙策略;
S表示環境狀態。
2.根據權利要求1所述的無人機定點誘騙方法,其特征在于,所述當前瞬時回報是通過以下公式確定的:
;
;
;
;
;
其中:
表征了當前瞬時回報;
表征了所述誘騙目的地相對于所述目標無人機當前位置的方向與所述目標無人機的當前速度方向之間的夾角;
表征了當前方位收益;
L表征了所述目標無人機當前位置與所述誘騙目的地的當前距離;
表征了當前距離收益。
3.根據權利要求1或2所述的無人機定點誘騙方法,其特征在于,確定目標無人機當前時刻的環境狀態之后,還包括:
根據選擇概率信息,選擇所述第一方式或第二方式作為當前的誘騙策略選擇方式,其中,所述第一方式的選擇概率與所述第二方式的選擇概率之和為1;
若選擇所述第二方式,則隨機自多個誘騙策略中選擇一個作為當前時刻的誘騙策略,以實現所述第二方式。
4.根據權利要求3所述的無人機定點誘騙方法,其特征在于,所述識別模型采用卷積神經網絡,所述選擇概率信息中,所述第一方式的選擇概率為固定概率值與動態概率值中較大的一個概率值,所述動態概率值是隨所述卷積神經網絡中當前更新步長的衰減系數確定的。
5.根據權利要求1或2所述的無人機定點誘騙方法,其特征在于,所述數據集中記錄了所獲取到的至少部分誘騙經驗;
所述識別模型是根據以下過程訓練的:
在所述數據集中所記錄的各誘騙經驗中,隨機抽取誘騙經驗;
根據所抽取的誘騙經驗,構建對應環境狀態的目標Q值;
根據所述目標Q值與對應環境狀態的真實Q值,更新所述卷積神經網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海特金無線技術有限公司,未經上海特金無線技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011176052.6/1.html,轉載請聲明來源鉆瓜專利網。





