日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種多智能體協作環境強化學習算法的測試方法有效

專利信息
申請號: 202010648233.8 申請日: 2020-07-07
公開(公告)號: CN111814988B 公開(公告)日: 2023-06-30
發明(設計)人: 殷永峰;謝靜;李秋儒;王軼辰 申請(專利權)人: 北京航空航天大學
主分類號: G06N20/00 分類號: G06N20/00;A63F13/822
代理公司: 北京清大紫荊知識產權代理有限公司 11718 代理人: 張卓
地址: 100083*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 智能 體協 環境 強化 學習 算法 測試 方法
【權利要求書】:

1.一種多智能體協作環境強化學習算法的測試方法,其特征在于,包括以下步驟:

在測試前期,分析智能體UCB算法訓練算法階段特性,得出影響UCB算法模型訓練效果的智能體訓練算法階段影響因子為智能體位置空間的獎懲值設置、智能體的數量和部署的位置空間樣本量;

根據智能體訓練算法訓練影響因子,通過調整位置空間的獎懲值,產生算法的預期回報值和收斂速度;通過改變智能體的數量,查看智能體訓練的速度和歸一化程度,通過增加或減少位置空間樣本量,查看智能體訓練的預期回報值輸出和收斂速度,驗證測試影響因子有效性,得出驗證智能體學習UCB算法的測試策略;

分析QMIX算法,聯合動作值函數與單個智能體的局部值函數的單調性相同,使聯合動作值函數最大,結合算法特性,得出影響QMIX算法模型訓練效果的因子為單個智能體的動作空間屬性、對抗樣本規則、智能體的數量和樣本量;

通過修改智能體的動作空間屬性,產生算法的預期總收益值和收斂速度;通過改變樣本規則或訓練樣本量,得出智能體訓練的勝率或速度,通過增加或減少智能體數量,得出智能體訓練的預期總收益值和收斂效果,驗證測試影響因子有效性,得出驗證智能體學習QMI算法的測試策略;

測試最后階段,根據智能體UCB算法和QMIX算法的測試策略,分析協作訓練的測試策略,得出智能體訓練算法協作影響因子包括協作訓練規則、智能體訓練和測試樣本、協作智能體數量;

根據智能體訓練算法協作影響因子驗證智能體訓練效果,完成對多智能體協作環境下深度學習算法的測試。

2.根據權利要求1所述的一種多智能體協作環境強化學習算法的測試方法,其特征在于,UCB算法用于訓練動作和狀態空間固化或較小的Ⅰ類智能體,QMIX算法用于訓練動作和狀態空間大且復雜的Ⅱ類智能體。

3.根據權利要求1所述的一種多智能體協作環境強化學習算法的測試方法,其特征在于,所述驗證智能體訓練效果的測試策略,包括UCB算法訓練效果的驗證和QMIX算法訓練效果的驗證。

4.根據權利要求3所述的一種多智能體協作環境強化學習算法的測試方法,其特征在于,所述UCB算法訓練效果的驗證,具體過程為:

1)根據UCB算法得出訓練影響因子:空間位置獎懲值、智能體數量、空間位置樣本量;

2)輸入調整后的空間位置獎懲值,則空間位置獎懲值較高的位置回報值高且被選次數較多,收斂速度加快;

3)修改智能體數量后開始訓練,在智能體數量增多時算法收斂速度減慢,減小后收斂速度加快,輸出的回報值始終被歸一化;

4)修改空間位置樣本量后開始訓練,位置空間增多則收斂速度減慢,位置空間減少時收斂速度加快,被選中位置的回報值最高;

滿足上述過程,則算法訓練效果較好,反之較差。

5.根據權利要求3所述的一種多智能體協作環境強化學習算法的測試方法,其特征在于,所述QMIX算法訓練效果的驗證,具體過程為:

1)根據QMIX算法得出訓練影響因子:智能體動作空間屬性、對抗樣本規則或樣本量、智能體數量;

2)修改動作空間屬性,則智能體動作能力增強后收益值增且收斂速度加快,能力減弱后收益值減小且收斂速度減緩;

3)修改樣本規則后開始訓練,對抗樣本能力增強后勝率降低,減弱后勝率提升;修改樣本量后開始訓練,樣本量增多訓練速度加快,模型勝率提升;

4)修改智能體數量后開始訓練,數量增加時收益值上升且速度減緩,收斂速度減慢但算法依然收斂,滿足勝率要求;

滿足上述過程,則算法訓練效果較好,反之較差。

6.根據權利要求1所述的一種多智能體協作環境強化學習算法的測試方法,其特征在于,所述根據智能體訓練算法協作影響因子驗證智能體訓練效果,完成對多智能體協作環境下深度學習算法的測試,具體為:

1)分析各個智能體訓練算法協作訓練的測試策略,得出智能體訓練算法協作影響因子:協作訓練規則、對抗樣本的訓練和測試樣本、協作智能體數量;

2)修改智能體特性后開始訓練,則智能體動作能力增強后勝率提升,能力減弱后勝率降低;修改對抗樣本規則,樣本能力增強訓練速度減慢,勝率降低,樣本能力減弱則相反;

3)修改樣本量后開始訓練,樣本量增多訓練速度減慢,減小后訓練速度加快,組合算法依然收斂;

4)改變訓練和測試樣本的比例,增大比例訓練速度減緩,測試勝率不穩定,減小比例訓練速度提升勝率穩定但勝率偏低;

5)修改智能體數量后開始訓練,數量增加時收斂速度減緩,勝率提高,數量減少后勝率降低,算法依然收斂,滿足勝率要求;

滿足上述過程,則算法訓練效果較好,反之較差。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010648233.8/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 亚洲精品日本无v一区| 国产aⅴ一区二区| 视频一区二区三区中文字幕| 亚欧精品在线观看| 亚洲w码欧洲s码免费| 亚洲va国产| 亚洲国产欧洲综合997久久,| 亚洲精品www久久久久久广东| 亚洲午夜天堂吃瓜在线| 日本午夜久久| 高清国产一区二区三区| 香蕉av一区| 精品国产一级| 91偷自产一区二区三区精品| 一区二区三区电影在线观看| 国产精品综合一区二区三区| 最新国产精品久久精品| 国产一区日韩欧美| 日本xxxxxxxxx68护士| 国久久久久久| 性old老妇做受| 美国三级日本三级久久99| 亚洲二区在线播放视频| 国产一卡二卡在线播放 | 蜜臀久久99精品久久久| 少妇久久免费视频| 午夜影院一区| 毛片免费看看| 大桥未久黑人强制中出| 国产欧美精品va在线观看| 日韩一区二区福利视频| 国产丝袜一区二区三区免费视频 | 亚洲日韩aⅴ在线视频| 亚洲理论影院| 神马久久av| 国产伦理久久精品久久久久| 91精品婷婷国产综合久久竹菊 | 天堂av色婷婷一区二区三区| 好吊妞国产欧美日韩免费观看网站 | 欧美一区视频观看| 久久天天躁夜夜躁狠狠躁2022| 日韩精品一区二区中文字幕| 91麻豆精品国产91久久久久| 免费毛片a| 久久免费视频一区二区| 欧美日韩一区二区三区免费| 李采潭伦理bd播放| 狠狠色噜噜狠狠狠狠米奇777| 一区二区久久精品| 伊人av综合网| 99国精视频一区一区一三| 99精品偷拍视频一区二区三区| 国产精品久久久久久久妇女| 国产精品乱码久久久久久久| 国产videosfree性另类| 亚洲国产精品一区在线| 狠狠操很很干| 久久国产中文字幕| 日本一区二区三区中文字幕| 亚洲少妇一区二区| 欧美一级不卡| 久久精品综合视频| 91人人爽人人爽人人精88v| 亚洲国产欧洲综合997久久,| 久久精品国产99| 日韩精品少妇一区二区在线看| 欧美日韩偷拍一区| 69久久夜色精品国产69–| 午夜激情在线免费观看| 国产日韩欧美自拍| 欧美精品国产一区| 欧美精品免费看| 精品久久久久久中文字幕大豆网| 2023国产精品久久久精品双| 91国产一区二区| 色综合欧美亚洲国产| 亚洲精品国产久| 国产欧美一区二区三区沐欲| 日韩国产精品久久| 日韩中文字幕久久久97都市激情| 国产一级片一区二区| 日韩精品久久久久久久酒店| 夜夜躁狠狠躁日日躁2024| 欧美三级午夜理伦三级老人| 综合欧美一区二区三区| 国产一区二区极品| 91性高湖久久久久久久久_久久99| **毛片在线| 午夜黄色一级电影| 国产有码aaaae毛片视频| 午夜爱爱电影| 国产一区二区三区黄| 久草精品一区| 久久精品国产色蜜蜜麻豆| 狠狠色噜噜狠狠狠狠| 国产一区www| 91精品国产麻豆国产自产在线| 中文字幕区一区二| 国产二区三区视频| 欧美资源一区| 国产精品一区二区在线观看 | 精品国产伦一区二区三区免费| 午夜诱惑影院| 国产精品一区在线观看| 欧美一区二区伦理片| 扒丝袜pisiwa久久久久| 久久91久久久久麻豆精品| 久久96国产精品久久99软件| 日韩中文字幕亚洲欧美| 国产精品麻豆自拍| 欧美日韩一二三四区| 午夜av男人的天堂| 亚洲精品久久久久一区二区| 97视频一区| 免费91麻豆精品国产自产在线观看| 欧美一区二区三区片| 理论片午午伦夜理片在线播放| 91麻豆精品国产自产欧美一级在线观看 | 毛片大全免费看| 艳妇荡乳欲伦2| 激情久久一区二区三区| 国产精品9区| 精品国产一区二| 国产欧美综合一区| 国产乱xxxxx国语对白| 国产在线一区观看| 99re6国产露脸精品视频网站| 国内久久久| 久99久视频| 欧美一区二区三区免费视频| 国产精品人人爽人人做av片| 99久久精品免费视频| 亚洲欧美自拍一区| xxxx在线视频| 国产精品视频十区| 国产vsv精品一区二区62| 夜夜夜夜夜猛噜噜噜噜噜gg| 欧美极品少妇xx高潮| 曰韩av在线| 国产精品视频久久久久久| 4399午夜理伦免费播放大全| 精品国产18久久久久久依依影院| 91精品国产综合久久国产大片| 狠狠躁夜夜躁人人爽天天天天97 | 亚洲精品无吗| 91精品视频在线观看免费| 国产jizz18女人高潮| 欧美日韩中文国产一区发布| 成年人性生活免费看| 99久久国产综合精品尤物酒店| 国产一级二级在线| 91精品国产一区二区三区| 国产超碰人人模人人爽人人添| 猛男大粗猛爽h男人味| 韩日av一区二区三区| 一区二区欧美精品| 中文字幕在线播放一区| 亚洲四区在线| 国产videosfree性另类| 国产精品视频久久久久| 亚洲精品www久久久久久广东| 狠狠躁天天躁又黄又爽| 狠狠插狠狠插| 香港三日本三级三级三级| av素人在线| 亚洲欧洲一区二区| 精品a在线| 国产在线播放一区二区| 国产精品亚发布| 欧美精品xxxxx| 午夜一级免费电影| 国产一级片子| 日韩av电影手机在线观看| 久久久99精品国产一区二区三区| 国产69精品久久久久男男系列| 99爱精品视频| 毛片大全免费观看| 精品国产仑片一区二区三区| 欧美一区二区三区视频在线观看| 国内精品国产三级国产99| 中文字幕日本精品一区二区三区| 中文字幕一区二区三区四| 国产精品欧美久久久久一区二区| 精品在线观看一区二区| 国产欧美一区二区三区沐欲| 97视频久久久| 精品国产乱码久久久久久久| 久久久精品观看| 欧美视屏一区二区| 中文字幕在线一区二区三区| 国产精品1区二区| 亚洲午夜国产一区99re久久| 91精品综合在线观看| 亚洲欧洲一二三区| 夜夜精品视频一区二区| 视频一区二区三区欧美| 国产伦精品一区二区三区免费下载| 欧美一区二区三区免费视频| 国产一区二区三区精品在线| 精品一区在线观看视频| 国产精品乱码久久久久久久| 欧美3级在线| 午夜亚洲影院| 久久婷婷国产麻豆91天堂徐州| bbbbb女女女女女bbbbb国产| 狠狠色狠狠色综合久久第一次| 91精品国产九九九久久久亚洲 | 午夜av免费观看| 996久久国产精品线观看| 精品欧美一区二区精品久久小说 | 国内久久久久久| 国产一级片网站| 久久精品国产亚洲一区二区| 国产999在线观看| 国产91热爆ts人妖系列| 精品午夜电影| 日本99精品| 欧美精品久久一区| 黄毛片在线观看| 黑人巨大精品欧美黑寡妇| 国语对白一区二区| 国产伦理久久精品久久久久| 26uuu亚洲国产精品| 精品久久久久久亚洲综合网| 免费精品99久久国产综合精品应用| 精品国产一区二区三区四区vr| 国产精品久久91| 日韩精品中文字幕一区二区| 国产精品国产三级国产专区53| 国产人澡人澡澡澡人碰视| 久久久久久中文字幕| а√天堂8资源中文在线| 黄色av中文字幕| 欧美激情在线一区二区三区| 国产亚洲精品久久19p| 高清国产一区二区| 精品久久久久久中文字幕| 国产一区二区三区网站| 欧美日韩精品在线一区二区| 欧美一区二区三区久久久精品 | 激情欧美日韩| 国产麻豆一区二区三区精品| 欧美色综合天天久久| 久久一级精品视频| 国产69精品久久久久999小说| 国产精品视频久久久久久久|