日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于深度確定性策略梯度的異構多智能體協同決策方法在審

專利信息
申請號: 201810397866.9 申請日: 2018-04-28
公開(公告)號: CN108600379A 公開(公告)日: 2018-09-28
發明(設計)人: 李瑞英;王瑞;胡曉惠;張慧 申請(專利權)人: 中國科學院軟件研究所
主分類號: H04L29/08 分類號: H04L29/08;H04L12/24
代理公司: 北京科迪生專利代理有限責任公司 11251 代理人: 楊學明;顧煒
地址: 100190 *** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 異構 多智能體 智能體 確定性 運動環境 協同 構建 智能 決策 策略優化 動作空間 決策領域 決策行動 實際需求 特征屬性 梯度算法 系統領域 訓練學習 運動狀態 智能感知 狀態空間 狀態序列 評判 反饋 評估
【權利要求書】:

1.一種基于深度確定性策略梯度的異構多智能體協同決策方法,其特征在于,包括以下步驟:

步驟1:定義異構多智能體的特征屬性和獎懲規則,明確智能體的狀態空間和動作空間,將每一個智能體抽象為環境中的一個運動節點,構建異構多智能體進行協同決策的運動環境;

步驟2:基于深度確定性策略梯度算法,建立進行決策行動的actor模塊和評判反饋的critic模塊,隨機初始化參數;

步驟3:多智能體在步驟1構建的運動環境中,自主隨機地進行運動探索:各智能體根據當前的狀態s,由actor模塊得到動作a,并到達下一狀態s';同時,依據獎懲規則計算在當前狀態s下采取動作a到達下一狀態s'時環境所給予的獎懲回報r,將每一步的<當前狀態s,當前動作a,下一步狀態s',獎懲回報r>儲存到經驗池中;

步驟4:根據步驟3經驗池中存儲的<s,a,s',r>對,對critic模塊和actor模塊的參數進行訓練和學習,同時用新產生的<s,a,s',r>對替換經驗池中之前存儲的<s,a,s',r>對,重復步驟4,直至滿足多智能體協同決策的優化終止條件或最大迭代步數;

步驟5:利用訓練好的模型,在已知智能體當前狀態s的情況下,得到智能體的當前動作a,并到達下一狀態s',重復步驟5,直到完成任務或達到環境的終止條件,得到智能體的狀態序列;同時,依據環境設置的獎懲規則,完成智能體運動狀態序列的態勢評估。

2.根據權利要求1所述的基于深度確定性策略梯度的異構多智能體協同決策方法,其特征在于,所述步驟1的具體實現子步驟包括:

步驟1.1:根據異構智能體的特征屬性,將每個智能體抽象為環境中的一個運動節點;

步驟1.2:設定智能體的動作:[下一步的運動方向];設定智能體的狀態:[自身的位置坐標x、y,目標的位置坐標x、y,自身位置與目標位置的方位角θ];

步驟1.3:設置環境中的獎懲規則;

步驟1.4:多智能體抽象的運動節點,智能體的動作空間和狀態空間,環境中的獎懲規則共同構建了一個異構多智能體進行協同決策的運動環境。

3.根據權利要求1所述的基于深度確定性策略梯度的異構多智能體協同決策方法,其特征在于,所述步驟2的具體實現子步驟如下:

步驟2.1:設立一個單獨的經驗池存儲各智能體的狀態-動作對<當前狀態s,當前動作a,下一步狀態s',回報r>;

步驟2.2:建立actor模塊,將各智能體的狀態s作為網絡的輸入,經過若干中間層得到各智能體的下一步輸出動作a;同時,保留一個actor網絡結構副本,該actor網絡結構副本只在一定的時間步長才進行參數的更新;

步驟2.3:建立critic模塊,將智能體的狀態s和動作a作為網絡的輸入,經過若干中間層輸出為動作-價值Q;同時,保留一個critic網絡結構副本,該critic網絡結構副本同樣在一定的時間步長才進行參數的更新。

4.根據權利要求1所述的基于深度確定性策略梯度的異構多智能體協同決策方法,其特征在于,所述步驟4具體實現子步驟如下:

步驟4.1:critic模塊包含了兩個結構完全相同、參數更新時間不一致的網絡模型,將即時更新參數的網絡模型Q稱之為在線critic,其參數表示為θQ;將延遲更新的網絡模型Q'稱之為目標critic,其參數表示為θQ'

對于目標critic,根據經驗池<當前狀態s,當前動作a,下一步狀態s',回報r>,在當前狀態s下采取動作a,到達下一狀態s',并得到即時回報r;利用目標actor網絡估計得到下一狀態s'時采取的下一動作a',計算目標動作-價值函數可表示為Q'(s',a'|θQ'),則由Q'可以得出在當前狀態s下采取動作a的估計期望回報y:

y=r+γQ'(s',a'|θQ')

其中,γ(γ∈[0,1])表示一個衰減因子;

對于在線critic,根據經驗池中的當前狀態s和當前動作a,計算得到動作-價值Q,即在線期望回報Q(s,a|θQ);

估計期望回報y與在線期望回報Q(s,a|θQ)的均方誤差計算公式為:

利用誤差L可以完成對在線critic網絡的參數更新;

目標critic是在線critic的延遲更新,目標critic的參數更新公式為:

θQ'=τθQ+(1-τ)θQ'

其中,τ是一個平衡因子;

步驟4.2:actor模塊包含兩個結構完全相同、參數更新時間不一致的網絡模型,及時更新參數的網絡模型μ為在線actor,其參數表示為θμ;延遲更新參數的網絡模型μ'為目標actor,其參數表示為θμ'

對于目標actor,根據經驗池<當前狀態s,當前動作a,下一步狀態s',回報r>中的下一狀態s',計算得到s'的下一動作a',即μ'(s'|θμ'),用于計算目標critic的目標動作-價值函數Q'(s',a'|θQ');

對于在線actor,根據經驗池中的當前狀態s,計算實際的當前動作,即μ(s|θμ);通過當前狀態s的實際動作μ(s|θμ)和在線critic輸出的Q(s,a|θQ)聯合更新在線actor網絡的參數,其梯度下降公式為:

目標actor是在線actor的延遲更新,目標actor的參數更新公式為:

θμ'=τθμ+(1-τ)θμ'

其中,τ是一個平衡因子;

步驟4.3:訓練critic網絡和actor網絡的模型參數,并用新產生的<s,a,s',r>對替換經驗池中之前存儲的<s,a,s',r>對;重復步驟4,直至滿足多智能體協同決策的優化終止條件或達到最大迭代步數。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院軟件研究所,未經中國科學院軟件研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201810397866.9/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 亚洲免费永久精品国产 | 久久99国产精品视频| www.久久精品视频| 国产欧美一区二区三区在线| 欧美一区二区三区久久| 亚洲欧美国产日韩综合| 日韩一区二区三区福利视频| 中文字幕亚洲欧美日韩在线不卡| 精品国产一区二区三区忘忧草| 亚洲精品人| 夜夜嗨av色一区二区不卡| 久久人做人爽一区二区三区小说| 在线播放国产一区| 久久精品亚洲精品| 扒丝袜pisiwa久久久久| 国产区二区| 国产一级一区二区| 窝窝午夜精品一区二区| 亚欧精品在线观看| 国产欧美一区二区精品久久| 国产91综合一区在线观看| 高清欧美xxxx| 综合久久一区| 狠狠色狠狠色合久久伊人| 鲁丝一区二区三区免费观看| 精品久久香蕉国产线看观看gif| 国产日韩欧美91| 久久久精品视频在线| www.久久精品视频| 国产精品v亚洲精品v日韩精品| 国产高清无套内谢免费| 国产一区免费播放| 少妇bbwbbwbbw高潮| 亚洲国产欧美一区二区丝袜黑人| 国产麻豆一区二区三区在线观看| 午夜无遮挡| 国产日韩欧美自拍| 99国产精品免费观看视频re| 午夜av免费观看| 日韩区欧美久久久无人区| 性生交片免费看片| 精品无人国产偷自产在线 | 国产精品99在线播放| 91一区二区三区视频| 久久国产精品久久| 欧美精品一卡二卡| 一区二区欧美精品| 日韩一级视频在线| 国产精品免费自拍| 日韩精品久久久久久久酒店| 国产午夜亚洲精品羞羞网站| 黄色香港三级三级三级| 国产欧美一区二区三区精品观看| 在线亚洲精品| 国产在线精品区| 国产影院一区二区| 久久国产精品广西柳州门| 一区二区欧美视频| 91精品一区| 国产九九影院| 午夜电影三级| 91精品啪在线观看国产| 狠狠色很很在鲁视频| 国产69精品久久99不卡免费版| 欧美午夜看片在线观看字幕| 国产一级片一区二区| 国产91综合一区在线观看| 国产精品麻豆自拍| 中文字幕在线一二三区| 农村妇女精品一区二区| 国产一区二区麻豆| 激情aⅴ欧美一区二区三区| 99久久精品国| 国产一区二区黄| 国产精品国产三级国产专区55| 久久国产精彩视频| 国产九九影院| 麻豆精品一区二区三区在线观看| 欧美在线视频一二三区| 国产69精品福利视频| 狠狠色综合久久婷婷色天使| 亚洲精品日日夜夜| 国产一区二区在线观| 国产精品美女www爽爽爽视频| 精品一区电影国产| 欧美日韩中文国产一区发布| 久久一区二区精品| 国产精品国产三级国产专区52| 国产精品视频99| 久久国产精品二区| 欧美精品二区三区| 国产欧美一区二区三区在线| 欧美激情精品一区| 91精品国产综合久久福利软件| 911久久香蕉国产线看观看| 激情欧美一区二区三区| 国产区图片区一区二区三区| 中文文精品字幕一区二区| 日韩精品中文字幕一区二区三区| 一区二区三区欧美日韩| 欧美一区二三区| 岛国黄色av| 国产亚洲精品久久久久动| 欧美日本三级少妇三级久久| 久久综合激情网| 亚洲久久在线| 97涩国一产精品久久久久久久| 久久久久国产亚洲| 久久精品国产综合| 99re热精品视频国产免费| 中文字幕理伦片免费看| 毛片大全免费看| 亚洲欧美一二三| 欧美日韩国产精品一区二区| 日韩在线一区视频| 亚洲午夜国产一区99re久久| 精品久久综合1区2区3区激情 | 国产一二区在线观看| 欧美午夜精品一区二区三区| 日韩美一区二区三区| 国产午夜精品一区二区三区视频| 手机看片国产一区| 亚欧精品在线观看| 国产精品免费一区二区区| 国产欧美日韩精品一区二区三区| 97久久国产亚洲精品超碰热| 99久久国产综合| 欧美在线视频二区| 热re99久久精品国99热蜜月| 夜夜嗨av禁果av粉嫩av懂色av | 欧美高清性xxxx| 天干天干天干夜夜爽av| 欧美国产精品久久| 欧美日韩国产精品一区二区三区| 一区二区在线精品| 狠狠色噜噜狠狠狠狠视频| 国产69精品久久久久999天美| 国产精品高潮呻吟视频| 亚洲视频h| 黑人巨大精品欧美黑寡妇| 91精品资源| 午夜影院毛片| 欧美一区二区三区四区五区六区| 久久精品com| 91黄在线看 | 亚洲国产美女精品久久久久∴| 欧美乱妇在线观看| 欧美精品一区二区久久久| 91久久精品久久国产性色也91| 亚洲精品久久久久中文字幕欢迎你| 88国产精品视频一区二区三区| 亚洲精品久久久久www| 蜜臀久久精品久久久用户群体| 狠狠色狠狠色很很综合很久久| 国产日韩一区二区在线| 狠狠色噜噜狠狠狠狠米奇777| 午夜一区二区视频| 丝袜脚交一区二区| 欧美xxxxhdvideos| 亚洲国产精品精品| 国产91久| 国产精品久久久久99| 精品国产一区二区在线| 久久国产精品麻豆| 国产日产欧美一区二区| 国产精品久久人人做人人爽| 国产欧美日韩综合精品一| 素人av在线| 日韩中文字幕一区二区在线视频| 国产精品欧美久久久久一区二区| 亚洲精品一区在线| 国产性生交xxxxx免费| 午夜生活理论片| 91久久国产视频| 午夜精品在线播放| 欧美精品日韩一区| 国产精品国产三级国产专区51区| 日韩av电影手机在线观看| 国产精品一区二区三| 国产91精品高清一区二区三区| 99国产精品9| 久久er精品视频| 日本精品一二三区| 夜色av网站| 国产69精品久久久久777糖心| 欧美日韩偷拍一区| 国产午夜伦理片| 国产高清精品一区二区| 在线国产一区二区| 欧美日韩一区二区三区免费| 国偷自产中文字幕亚洲手机在线 | 99久久久国产精品免费无卡顿| 午夜精品一区二区三区三上悠亚 | 激情久久精品| 欧美一区二区三区久久| 国产视频一区二区三区四区| 丝袜脚交一区二区| 一区二区免费在线观看| bbbbb女女女女女bbbbb国产| 欧美一区二区三区久久久久久桃花 | 国产精品一区不卡| 亚洲三区在线| 国产精品国产三级国产专区51区 | 91精品久久久久久综合五月天| 国产一区二区三区国产| 国产九九九精品视频 | 91狠狠操| 欧美精品一卡二卡| 99re6国产露脸精品视频网站| 日韩欧美国产另类| 欧美一区二区性放荡片| 欧美黄色片一区二区| 日韩欧美一区二区久久婷婷| 精品一区中文字幕| 国产一级自拍片| 亚洲欧美制服丝腿| 国产欧美精品一区二区三区小说| 国产一区免费在线观看| 91看片免费| 中文字幕在线播放一区| 精品香蕉一区二区三区| 91丝袜国产在线观看| 国产综合亚洲精品| 日韩av在线资源| 国产精品日韩一区二区| 色综合久久久久久久粉嫩| 亚洲精品少妇一区二区| 国产1区2区视频| 国产精品999久久久| 亚洲久久在线| 激情久久一区| 亚洲欧洲日韩在线| 日本精品一二三区| 91精品中综合久久久婷婷| 男女无遮挡xx00动态图120秒| 日本免费电影一区二区| 午夜666| 国产一区二区伦理片| 中出乱码av亚洲精品久久天堂| 国产精品日韩一区二区| 91精品资源| 国产一区二| 满春阁精品av在线导航| 香蕉视频在线观看一区二区| 久久99国产精品久久99果冻传媒新版本| 91人人精品|