[發(fā)明專利]一種基于生成對(duì)抗網(wǎng)絡(luò)的無人機(jī)集群任務(wù)預(yù)分配方法在審
| 申請(qǐng)?zhí)枺?/td> | 202210336032.3 | 申請(qǐng)日: | 2022-03-31 |
| 公開(公告)號(hào): | CN114841055A | 公開(公告)日: | 2022-08-02 |
| 發(fā)明(設(shè)計(jì))人: | 畢文豪;嚴(yán)鈺文;張安 | 申請(qǐng)(專利權(quán))人: | 西北工業(yè)大學(xué) |
| 主分類號(hào): | G06F30/27 | 分類號(hào): | G06F30/27;G06N3/04;G06N3/08;G06Q10/06;G06Q50/26 |
| 代理公司: | 西北工業(yè)大學(xué)專利中心 61204 | 代理人: | 金鳳 |
| 地址: | 710072 *** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 生成 對(duì)抗 網(wǎng)絡(luò) 無人機(jī) 集群 任務(wù) 分配 方法 | ||
1.一種基于生成對(duì)抗網(wǎng)絡(luò)的無人機(jī)集群任務(wù)預(yù)分配方法,其特征在于包括下述步驟:
步驟1:數(shù)據(jù)預(yù)處理
對(duì)無人機(jī)信息與目標(biāo)信息進(jìn)行預(yù)處理,其中無人機(jī)信息包括彈藥量、對(duì)目標(biāo)的毀傷概率、對(duì)目標(biāo)的偵察收益、無人機(jī)續(xù)航能力;目標(biāo)信息包括目標(biāo)重要度、目標(biāo)打擊收益、目標(biāo)偵察收益;
預(yù)處理包括以下三個(gè)步驟:
a).將無人機(jī)信息表示為1×n1的信息向量la,其中n1為無人機(jī)數(shù)量,a=1,2,...,k1,k1為無人機(jī)信息種類數(shù)量;將目標(biāo)信息表示為1×n2的信息向量kb,其中n2等于目標(biāo)數(shù)量,b=1,2,...,k2,k2為目標(biāo)信息種類數(shù)量;
b).由于n1、n2存在長(zhǎng)度不同的情況,取n=max(n1,n2)為指定長(zhǎng)度,將小于指定長(zhǎng)度的向量la、kb后進(jìn)行補(bǔ)零處理,最終得到長(zhǎng)度都為n的無人機(jī)信息向量l_newa和目標(biāo)信息向量k_newb,之后將各個(gè)信息向量按行組合成為(k1+k2,n)的信息矩陣M;
c).使用如下公式對(duì)信息矩陣M中每一行數(shù)據(jù)進(jìn)行歸一化處理:
式中x_norm(i,j)為第i行第j列進(jìn)行歸一化后的數(shù)據(jù),xi,j為第i行第j個(gè)數(shù)據(jù),Mini為第i行值最小的數(shù)據(jù),Maxi為第i行值最大的數(shù)據(jù),i=1,2,...,k1+k2,j=1,2,...,n,記經(jīng)過歸一化處理后的矩陣為M_norm;
將經(jīng)過歸一化后的矩陣M_norm作為模型的輸入數(shù)據(jù),記為datai,同時(shí)將與無人機(jī)和目標(biāo)信息對(duì)應(yīng)的真實(shí)的任務(wù)分配序列記為reali,進(jìn)入步驟2;
步驟2:建立生成對(duì)抗網(wǎng)絡(luò)的生成模型G(x)并生成分配序列;
步驟3:建立生成對(duì)抗網(wǎng)絡(luò)的判別模型D(x)并對(duì)生成序列評(píng)價(jià);
判別模型由詞嵌入模型、深度卷積網(wǎng)絡(luò)、全連接網(wǎng)絡(luò)組成,三者作為判別模型的基本架構(gòu);
判別模型評(píng)價(jià)指標(biāo)如下:
其中G(z)為生成模型生成的序列,D(y))為判別模型得到的評(píng)分,表示真實(shí)分配序列通過判別模型后評(píng)分的期望,表示生成的分配序列經(jīng)過判別模型后評(píng)分的期望;
步驟4:采用梯度下降最優(yōu)化目標(biāo):min-V(G,D);
根據(jù)步驟(3)中的序列評(píng)價(jià)指標(biāo)V(D,G),使用隨機(jī)最速下降法更新判別模型中的參數(shù),包括判別模型中卷積網(wǎng)絡(luò)每一個(gè)卷積核的參數(shù)、全連接網(wǎng)絡(luò)中每一個(gè)神經(jīng)元的權(quán)值以及每一個(gè)神經(jīng)元的偏置;
步驟5:計(jì)算生成模型優(yōu)化目標(biāo);
生成模型優(yōu)化的目標(biāo)函數(shù)如下:
J(θ)=E[RT|s0,θ] (2)
式(2)中s0為初始狀態(tài),θ為生成模型中的參數(shù),RT為判別模型對(duì)完整的生成序列給出的評(píng)價(jià);J(θ)表示對(duì)評(píng)價(jià)的期望,即在某一個(gè)初始條件s0和參數(shù)θ的條件下,產(chǎn)生某個(gè)完全的序列的評(píng)價(jià)的期望值;
期望的計(jì)算公式如下:
式中Gθ(y1|s0)表示利用生成模型生成某一個(gè)y1序列的概率;(表示當(dāng)生成器Gθ生成了一個(gè)未完全序列y1后,通過蒙特卡洛方法對(duì)該序列進(jìn)行多次補(bǔ)全后放入判別器Dφ中得到補(bǔ)全序列的評(píng)價(jià)指標(biāo)值,隨后對(duì)由y1產(chǎn)生的多個(gè)序列評(píng)價(jià)指標(biāo)值取平均后的均值;
步驟6:采用梯度下降最優(yōu)化目標(biāo)min-J(θ)
根據(jù)式(2),使用隨機(jī)最速下降法優(yōu)化目標(biāo)min-J(θ),更新生成模型中的參數(shù),即生成模型中LSTM網(wǎng)絡(luò)中的wi、bi與全連接網(wǎng)絡(luò)的權(quán)重與偏置;
步驟7:對(duì)抗訓(xùn)練;
進(jìn)行生成模型和判別模型的對(duì)抗訓(xùn)練,即重復(fù)步驟(2)到步驟(6),直到達(dá)到設(shè)定的終止條件,終止條件為達(dá)到最大訓(xùn)練次數(shù)或模型網(wǎng)絡(luò)的loss值不再變化,即認(rèn)為生成模型的網(wǎng)絡(luò)收斂,保存生成模型,即為本發(fā)明的任務(wù)分配生成模型;
步驟8:任務(wù)分配序列生成
給定戰(zhàn)場(chǎng)信息,按照步驟1對(duì)輸入數(shù)據(jù)進(jìn)行處理后,將無人機(jī)信息和目標(biāo)信息輸入任務(wù)分配生成模型,即可快速得到期望的任務(wù)分配結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西北工業(yè)大學(xué),未經(jīng)西北工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210336032.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 農(nóng)業(yè)信息對(duì)抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源線性規(guī)劃最優(yōu)分配方法
- 基于聚類數(shù)據(jù)挖掘的對(duì)抗行為搜索算法
- 面向多種對(duì)抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對(duì)抗強(qiáng)度的對(duì)抗訓(xùn)練方法
- 對(duì)抗攻擊模型的訓(xùn)練方法及裝置
- 對(duì)抗樣本的生成方法和裝置
- 多樣本對(duì)抗擾動(dòng)生成方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算設(shè)備
- 一種無人集群協(xié)同博弈對(duì)抗的控制方法及系統(tǒng)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





