日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于深度強化學習模型的兵棋推演協作策略獲取方法在審

專利信息
申請號: 202210270021.X 申請日: 2022-03-18
公開(公告)號: CN114722701A 公開(公告)日: 2022-07-08
發明(設計)人: 馮旸赫;梁星星;劉忠;程光權;黃金才;許乃夫;陳麗;姚晨蝶 申請(專利權)人: 中國人民解放軍國防科技大學
主分類號: G06F30/27 分類號: G06F30/27;G06K9/62;G06F111/08
代理公司: 長沙國科天河知識產權代理有限公司 43225 代理人: 李楊
地址: 410073 湖*** 國省代碼: 湖南;43
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 深度 強化 學習 模型 推演 協作 策略 獲取 方法
【權利要求書】:

1.一種基于深度強化學習模型的兵棋推演協作策略獲取方法,其特征在于,所述方法包括:

在兵棋平臺上搭建多智能體系統環境;

根據所述多智能體系統環境結合預設元組進行建模,生成決策模型;

根據專家先驗知識設計子目標,將所述子目標用于獎勵塑造;

選擇分布式決策、集中式訓練的多智能體強化學習架構結合分層獎勵塑造框架生成基于所述獎勵塑造的QMIX算法;

通過QMIX算法對所述決策模型進行求解以獲取兵棋推演協作策略。

2.如權利要求1所述的方法,其特征在于,所述根據所述多智能體系統環境結合預設元組進行建模,生成決策模型的步驟,包括:

使用改進的元組G=<S,U,P,r,Z,O,n,γ>對所述多智能體系統環境進行決策模型的建模,其中s∈S描述紅方對訓練環境全局態勢的觀測,在每一個時間步,每個智能體n在可選動作集Un中選取一個動作,所有智能體選擇的動作組成聯合動作u∈U≡Un,聯合動作推動環境上的狀態轉移,狀態轉移定義如下P(s'|s,u):S×U×S→[0,1],所有智能體共享同一個獎勵函數r(s,u):S×U→γ并且γ∈[0,1)。

3.如權利要求1所述的方法,其特征在于,所述根據專家先驗知識設計子目標,將所述子目標用于獎勵塑造的步驟,包括:

根據專家先驗知識確定子目標序列;

確定強化學習所學習的抽象狀態,并在所述抽象狀態上構建馬爾可夫決策模型;

搭建神經網絡求解所述馬爾可夫決策模型;

對神經網絡進行訓練,在所述神經網絡訓練收斂以后使用獲得的V(Z)值作為狀態的勢能,進行獎勵塑造。

4.如權利要求3所述的方法,其特征在于,所述搭建神經網絡求解所述馬爾可夫決策模型的步驟,包括:

在所述神經網絡中,輸入空間維度為四維,當達到第一個子目標時,第一維輸入是1,否則是0,第二、三、四維也是如此,經過一層維度為10維的隱藏層,選擇使用均值為0,標準差為0.01的正態分布進行參數初始化,輸出抽象狀態函數值以求解所述馬爾可夫決策模型。

5.如權利要求1所述的方法,其特征在于,所述選擇分布式決策、集中式訓練的多智能體強化學習架構結合分層獎勵塑造框架生成基于所述獎勵塑造的QMIX算法的步驟,包括:

選擇分布式決策、集中式訓練的多智能體強化學習架構,結合分層獎勵塑造框架搭建QMIX算法,所述QMIX算法包含一組DRQN和一個混合網絡,組中的每個DRQN網絡對應一個分布式執行的策略,混合網絡把一組DRQN網絡組合輸出的一組Qa以一種復雜的非線性模式加權組合,從而輸出Qtot。

6.如權利要求5所述的方法,其特征在于,所述選擇分布式決策、集中式訓練的多智能體強化學習架構結合分層獎勵塑造框架生成基于所述獎勵塑造的QMIX算法的步驟之后,還包括:

將輸入信息經過一層MLP網絡,選擇使用均值為0,標準差為1的正態分布進行參數初始化,并輸出一組特征向量;

使用整流線性單元對所述特征向量進行非線性化處理;

將處理好的特征向量和上一步存儲的隱藏層信息輸入到RNN層中,根據時序訓練的要求,將當前時間步的特征向量和上一步的隱藏層信息在RNN層融合生成新的特征向量和新的隱藏層信息;

將RNN層的輸出傳入最后一層MLP以獲得Q值;

采取epislon-greedy的方法,當隨機生成的概率小于預設概率時,使用argmax函數,選擇狀態動作值最大的動作并執行;

在生成的概率小于設定概率時,等概率隨機抽取動作并將當前步獲得的存入回放池中,等到網絡更新時再取出。

7.如權利要求1至6任一項所述的方法,其特征在于,所述通過QMIX算法對所述決策模型進行求解以獲取兵棋推演協作策略的步驟之前,還包括:

獲取預設地址中M個智能體的Q值列表;

獲取全局狀態St并經過一層單獨的線形層進行特征處理;

再經過一層絕對值激活函數,對特征進行非線性化處理,以生成混合網絡的權重;

輸出結果是四個向量<W1,W2,bias1,bias2,這四個向量被用于對第x1個智能體到第xm個智能體的Q值列表進行加權組合;

根據所述Q值列表作為混合網絡的輸入,經過計算后輸出Qtot(τ,a)值。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202210270021.X/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 免费看性生活片| 欧美精品粉嫩高潮一区二区| 精品国产91久久久| 91高跟紫色丝袜呻吟在线观看| 99精品国产99久久久久久97| 久久久久久久亚洲视频| 一区二区三区欧美精品| 欧美综合在线一区| 亚洲欧美日本一区二区三区 | 日韩av在线免费电影| 欧美一区二区三区另类| 亚洲乱在线| 99日韩精品视频| 国产午夜精品一区二区三区欧美| 亚洲欧美自拍一区| 欧美日韩精品影院| 扒丝袜网www午夜一区二区三区| 国产精品伦一区二区三区视频| 午夜毛片电影| 精品国产乱码久久久久久免费| 日韩国产精品一区二区| 亚洲国产另类久久久精品性| 亚洲女人av久久天堂| 综合在线一区| 亚洲少妇一区二区三区| 国产精品亚洲欧美日韩一区在线| 精品一区二区三区中文字幕| 91嫩草入口| 国产精品高潮呻吟久| 亚洲精品20p| 国产精品国产三级国产专区53| 美女被羞羞网站视频软件| 久久久午夜爽爽一区二区三区三州| 国产精品色在线网站| 亚洲国产精品国自产拍久久| 精品a在线| 国产精品久久久久久久久久久新郎 | 四虎国产精品永久在线国在线| 丝袜脚交一区二区| 亚洲无人区码一码二码三码| 亚洲欧洲日韩在线| 国产性猛交96| xxxxx色| 国产精品久久久久久亚洲调教| 国产足控福利视频一区| 国产区一区| 国产一区二区伦理| 亚洲精品国产一区| 久久久久国产精品www| 国产亚洲精品久久午夜玫瑰园 | 欧美午夜一区二区三区精美视频| 麻豆国产一区二区三区| 欧美一区二区三区久久综合| 强制中出し~大桥未久在线播放| 一区二区三区在线观看国产| 国产在线播放一区二区| 欧美日韩不卡视频| 久久99国产综合精品| 麻豆精品久久久| 欧美精品二区三区| 日韩欧美国产高清91| 十八无遮挡| 免费精品一区二区三区第35| 亚洲天堂国产精品| 亚洲一二三在线| 91麻豆精品国产91久久久资源速度 | 99爱精品在线| www.午夜av| 亚洲精品456| 欧美日韩一卡二卡| 野花国产精品入口| 欧美日韩久久精品| 亚洲va国产2019| 欧美二区在线视频| 国产精品一卡二卡在线观看| 日韩亚洲精品在线观看| 欧美午夜羞羞羞免费视频app| 97欧美精品| 97国产精品久久久| 一级久久久| 日韩精品一区二区免费| 国产精品一区二区人人爽| 久久99久国产精品黄毛片入口| 亚洲欧美自拍一区| 一区二区三区日韩精品| 国产天堂一区二区三区| 999久久久国产精品| 91嫩草入口| 国产精品视频一区二区在线观看| 精品少妇一区二区三区| 2023国产精品自产拍在线观看| 日韩中文字幕在线一区| 国产精品一区二区三| 99久久夜色精品国产网站| 日韩精品一区二区三区免费观看| xxxxx色| 一区二区91| 国产精品一区在线观看你懂的 | 国产精品免费专区| 九九热国产精品视频| 国产视频在线一区二区| 国产88久久久国产精品免费二区| 国产福利一区在线观看| 福利片午夜| 欧美日韩亚洲国产一区| 91热国产| 99久久精品国产国产毛片小说| 国产午夜精品免费一区二区三区视频| 91精品资源| 欧美日韩一级二级| 2020国产精品自拍| 亚洲国产精品一区在线观看| 国产馆一区二区| 国产精品伦一区二区三区级视频频| 久久国产欧美一区二区三区免费| 国产精品爽到爆呻吟高潮不挺| 午夜av影视| 久久国产精品视频一区| 991本久久精品久久久久| 国产精品视频久久久久| 最新av中文字幕| 亚洲第一天堂无码专区| 日韩av中文字幕一区二区| 国产日本欧美一区二区三区| 国产一区二区三区伦理| 欧美高清性xxxx| 国产精品欧美久久久久一区二区| 狠狠插狠狠爱| 99热一区二区| 精品99免费视频| 欧美国产亚洲精品| 国产精品久久久久四虎| 国产国产精品久久久久| 欧美日韩国产一二| 国产一区网址| 欧美67sexhd| 中文字幕一区二区三区乱码| 中文字幕另类日韩欧美亚洲嫩草| 国产一区二区综合| 日韩久久精品一区二区三区| 亚洲制服丝袜在线| 999亚洲国产精| 欧美精品久久一区二区| 国产69久久久欧美一级 | 亚洲欧洲另类精品久久综合| 国产乱xxxxx国语对白| 欧美一级免费在线视频| 91看片app| 国产二区不卡| 蜜臀久久99精品久久久| 免费a级毛片18以上观看精品| 一区二区午夜| 亚洲精品国产精品国自 | 国产精品一区二区6| 一区二区免费在线观看| 国产精品乱码一区| 久99久视频| 国产精品视频一二区| 亚洲精品久久久久中文第一暮| 国产麻豆91欧美一区二区| 91久久免费| 国产欧美二区| 国产精品久久久区三区天天噜| 亚洲精品国产setv| 国内久久久久久| 欧美国产三区| 少妇av一区二区三区| 国产全肉乱妇杂乱视频在线观看| 精品少妇一区二区三区免费观看焕| 国产无套精品一区二区| 午夜精品一区二区三区aa毛片| 国产精品白浆视频| 午夜肉伦伦影院九七影网| 日本精品一区视频| 一区二区在线国产| 亚洲精品久久久久999中文字幕| 久久夜色精品久久噜噜亚| 97视频一区| 香港三日本三级三级三级| 国产精品偷伦一区二区| 国产1区2区3区| 91精品国产九九九久久久亚洲| 久久久久久久亚洲视频| 精品久久二区| а√天堂8资源中文在线| 欧美在线观看视频一区二区三区| 欧美69精品久久久久久不卡| 亚洲欧美一区二区精品久久久| 69久久夜色精品国产69–| 91精品国模一区二区三区| 欧美三区视频| 欧美黄色一二三区| 国产一级在线免费观看| 国产精品日韩一区二区三区| 精品一区二区超碰久久久| 丰满岳妇伦4在线观看| 欧美日韩一二三四区| 国产精品视频二区不卡| 国产精品高潮呻| 国产日韩一区在线| 国产在线一卡| 国产一区二区三区小说| 国产欧美精品久久| 综合欧美一区二区三区| 亚洲视频h| 窝窝午夜理伦免费影院| 亚洲精品97久久久babes| 国产欧美精品va在线观看| 在线国产一区二区三区| 偷拍久久精品视频| 日本亚洲国产精品| 国产精品九九九九九| 国产乱人伦精品一区二区| 最新av中文字幕| 日韩av中文字幕第一页| 久久精品国产综合| 一区二区久久精品| 国产1区在线观看| 一区二区三区欧美日韩| 蜜臀久久99精品久久一区二区| 欧美日韩激情在线| 日韩a一级欧美一级在线播放| 自偷自拍亚洲| 日韩国产不卡| 亚洲欧洲一区| 国产一区免费在线| 99欧美精品| 日本三级香港三级网站| 91一区二区在线观看| 中出乱码av亚洲精品久久天堂| 国产69久久久欧美一级| 热久久一区二区| 国产在线视频二区| 91精品久久久久久综合五月天| 午夜一级免费电影| 日韩亚洲精品在线观看| 色婷婷精品久久二区二区我来| а√天堂8资源中文在线| 国产69精品久久| 国产精品视频二区不卡| 日本福利一区二区| 国产91免费在线| 欧美精品在线观看一区二区| 中文字幕1区2区3区| 欧美福利三区| 狠狠色噜噜狠狠狠色综合|