[發明專利]對抗單位的動態分配裝置有效
| 申請號: | 202010642634.2 | 申請日: | 2020-07-06 |
| 公開(公告)號: | CN112464548B | 公開(公告)日: | 2021-05-14 |
| 發明(設計)人: | 張海林;齊智敏;馬賢明;王全東;黃謙;王銳華;皮雄軍;高和順 | 申請(專利權)人: | 中國人民解放軍軍事科學院評估論證研究中心;白楊時代(北京)科技有限公司 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06N3/02;G06N3/08 |
| 代理公司: | 北京豐浩知識產權代理事務所(普通合伙) 11781 | 代理人: | 李學康 |
| 地址: | 100091 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對抗 單位 動態分配 裝置 | ||
1.一種對抗單位的動態分配裝置,其特征在于,具體包括:
獲取模塊,用于獲取數字戰場環境中的對抗信息,所述對抗信息包括:n個對抗單位的屬性信息、若干個攻擊單位的屬性信息和若干個目標單位的屬性信息,所述對抗單位用于執行對抗任務且屬于對抗雙方中的一方,所述攻擊單位用于阻礙所述對抗單位執行對抗任務,目標單位為對抗單位執行對抗任務的目標方,所述攻擊單位和所述目標單位均屬于對抗雙方中的另一方,n≥2且為正整數;
預處理模塊,用于對所述對抗信息進行預處理,得到符合循環神經網絡模型輸入要求的預處理信息;
輸出模塊,用于利用訓練好的循環神經網絡模型對作為初始狀態的分組開始向量和作為初始輸入的所述預處理信息進行處理,得到第一步輸出,利用注意力模型對所述第一步輸出與n個所述對抗單位的屬性信息、分組結束單位的分組結束向量進行處理,然后再進行歸一化處理,得到歸一化結果,所述歸一化結果為(n+1)維歸一化結果向量,(n+1)維向量中各分量依次表示采集到各對抗單位、分組結束單位的概率;
采樣模塊,用于根據預設的隨機采樣規則,對所述歸一化結果進行采樣,得到采樣結果,與所述采樣結果對應的對抗單位屬于分組信息;
循環模塊,用于重復執行所述輸出模塊和所述采樣模塊的功能,并依次將訓練好的循環神經網絡模型的上一步得到的狀態和所述預處理信息作為訓練好的循環神經網絡模型的本步的輸入,直至本次的采樣結果為與所述分組結束單位對應的分量;其中,分組開始向量和分組結束向量均經過訓練得到;
上述五個模塊依次連接。
2.如權利要求1所述的對抗單位的動態分配裝置,其特征在于,所述預處理模塊用于:對每個所述對抗單位的屬性信息、每個所述攻擊單位的屬性信息和每個所述目標單位的屬性信息進行若干層變換和融合處理得到高維向量,所述高維向量為符合循環神經網絡模型模型輸入要求的預處理信息,所述變換包括全連接層變換和激活函數處理;融合處理是指將多個向量處理為一個向量,處理過程是各矩陣或向量對應位置相加或取最大值。
3.如權利要求1所述的對抗單位的動態分配裝置,其特征在于,所述采樣模塊用于:隨機生成判斷閾值t,t∈[0,1];若k是滿足p0+p1+…+pi=t的所有i中的最小的數,則本次采樣結果為pk;其中,k和i均為自然數且均屬于[0,n],pi表示(n+1)維歸一化結果向量中第(i+1)個分量。
4.如權利要求1所述的對抗單位的動態分配裝置,其特征在于,所述循環模塊在執行完上述功能后,還判斷當前時刻與上一次決策時刻的間隔是否為預設決策間隔;若判斷為是,則依次執行獲取模塊、預處理模塊、輸出模塊、采樣模塊的功能,其中,所述上一次決策時刻為循環模塊中采樣到分組結束單位的時刻;若判斷為否,則繼續等待直到時間間隔為預設決策間隔。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍軍事科學院評估論證研究中心;白楊時代(北京)科技有限公司,未經中國人民解放軍軍事科學院評估論證研究中心;白楊時代(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010642634.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種全自動磁環蒸汽清洗設備
- 下一篇:對抗單位的動態分配方法





