日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種針對復雜條件下多智能體的訓練方法及系統(tǒng)有效

專利信息
申請?zhí)枺?/td> 202011024781.X 申請日: 2020-09-25
公開(公告)號: CN112488320B 公開(公告)日: 2023-05-02
發(fā)明(設(shè)計)人: 史殿習;張耀文;張擁軍;武云龍;秦偉;徐天齊;王功舉 申請(專利權(quán))人: 中國人民解放軍軍事科學院國防科技創(chuàng)新研究院;天津(濱海)人工智能軍民融合創(chuàng)新中心
主分類號: G06N20/00 分類號: G06N20/00;H04K3/00
代理公司: 北京安博達知識產(chǎn)權(quán)代理有限公司 11271 代理人: 徐國文
地址: 100071 *** 國省代碼: 北京;11
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 針對 復雜 條件下 智能 訓練 方法 系統(tǒng)
【說明書】:

發(fā)明提供了一種針對復雜條件下多智能體的訓練方法及系統(tǒng),包括:基于訓練目標,構(gòu)建訓練場景和智能體模型;將所述訓練場景按照場景復雜程度,由簡單到復雜依次分解為多個課程任務(wù);利用所述智能體模型,按場景復雜程度,依次選擇課程任務(wù)進行訓練得到各智能體的策略;其中在訓練過程中將前一課程任務(wù)的訓練結(jié)果作為下一課程任務(wù)的初始條件。本發(fā)明將訓練場景按照場景復雜程度,由簡單到復雜依次分解為多個課程任務(wù),解決了多智能體強化學習中的非平穩(wěn)問題,提升了訓練效果,同時縮短了訓練時間。

技術(shù)領(lǐng)域

本發(fā)明涉及智能體控制技術(shù)領(lǐng)域,具體涉及一種針對復雜條件下多智能體的訓練方法及系統(tǒng)。

背景技術(shù)

在多智能體系統(tǒng)研究中,一種直觀的研究方式是為智能體預定義行為規(guī)則。在任務(wù)執(zhí)行中,各智能體按照預設(shè)規(guī)則實現(xiàn)各種行為。但這種方式需定義大量的行為規(guī)則來應(yīng)對環(huán)境中各種可能出現(xiàn)的情況。而在復雜環(huán)境中,很難對環(huán)境中的各種情況進行枚舉,并且其它智能體的行為會使環(huán)境持續(xù)變化。因此,在復雜環(huán)境中,多智能體需通過與環(huán)境的持續(xù)交互學習新的行為,進而保證任務(wù)的執(zhí)行性能。強化學習(RL)作為一種學習模式,不依賴先驗知識和數(shù)據(jù),是一種處理復雜問題的有效方法。強化學習通過使智能體與環(huán)境不斷交互,進而獲得獎勵或懲罰信號,并用其指導行動策略的學習。該方法可使智能體在復雜動態(tài)環(huán)境中學習到更魯棒性的行為策略。而通過與深度學習的結(jié)合,可在更高維狀態(tài)空間中找到學習策略的更緊湊的表示形式。在深度強化學習(DRL)中,可使用深度神經(jīng)網(wǎng)絡(luò)近似表示智能體的最優(yōu)行動策略或價值函數(shù),從而實現(xiàn)表示能力的泛化。因此,深度強化學習可作為求解復雜環(huán)境下智能體決策問題的有效方法。

多智能體強化學習(MARL)是深度強化學習從單智能體到多智能體的擴展。各智能體將其它智能體看作環(huán)境的一部分,通過觀察并與環(huán)境交互,從而獲得獎懲信號,進而引導行動策略的學習。因此,在智能體觀察環(huán)境時,其計算復雜度將隨智能體個數(shù)的增加呈指數(shù)增長,計算時間也隨智能體的增加而增加。在多智能體系統(tǒng)中,每個智能體的目標是學習對其他智能體行為的最佳響應(yīng)。在復雜和高動態(tài)的系統(tǒng)中,如果其他智能體的策略也在不斷優(yōu)化調(diào)整,則當前智能體的學習目標會改變,即整個系統(tǒng)的學習策略將出現(xiàn)不穩(wěn)定的性質(zhì),學習效果也會遠離預期。

課程學習(CL)是機器學習的一種,旨在提高遷移學習的效果。在2016年美國多智能體自主系統(tǒng)協(xié)會(AAMAS)上發(fā)表的論文《Source?task?creation?for?curriculumlearning》,CL首次與RL結(jié)合。CL的主要是應(yīng)用于處理復雜任務(wù),方法是是通過生成一系列任務(wù)進行分別訓練,最終提升目標任務(wù)的最終漸近性能或減少計算時間。然而,大多數(shù)現(xiàn)有的研究集中于單智能體的研究,而其他在多智能體系統(tǒng)中考慮CL的方法使用結(jié)合相對簡單。現(xiàn)有的單一的場景研究,其智能體的數(shù)量是固定的,且具有稀疏的獎勵函數(shù)設(shè)置。

綜上,在場景較為復雜的多智能體深度強化學習的訓練過程中,尤其是在訓練多智能體的合作/競爭場景中,隨著智能體的增多,現(xiàn)有的訓練方式存在訓練不穩(wěn)定、訓練效果差,以及訓練周期長的問題。

發(fā)明內(nèi)容

為了解決現(xiàn)有技術(shù)中所存在的上述不足,本發(fā)明提供了一種針對復雜條件下多智能體的訓練方法,包括:

基于訓練目標,構(gòu)建訓練場景和智能體模型;

將所述訓練場景按照場景復雜程度,由簡單到復雜依次分解為多個課程任務(wù);

利用所述智能體模型,按場景復雜程度,依次選擇課程任務(wù)進行訓練得到各智能體的策略;

其中在訓練過程中將前一課程任務(wù)的訓練結(jié)果作為下一課程任務(wù)的初始條件。

優(yōu)選的,所述智能體模型的構(gòu)建包括:

基于不同的任務(wù)和回報方式分別構(gòu)建多個合作智能體、多個目標智能體和多個干擾智能體;

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍軍事科學院國防科技創(chuàng)新研究院;天津(濱海)人工智能軍民融合創(chuàng)新中心,未經(jīng)中國人民解放軍軍事科學院國防科技創(chuàng)新研究院;天津(濱海)人工智能軍民融合創(chuàng)新中心許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011024781.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美在线视频一二三区| 四季av中文字幕一区| 久久久久亚洲| 久久免费视频一区| 日韩精品中文字幕一区| 国产精品偷拍| 岛国精品一区二区| 国产一区不卡视频| 国模吧一区二区| 99久久精品一区二区| 久久99精品久久久秒播| 精品三级一区二区| 亚洲欧美日韩精品suv| 99精品久久久久久久婷婷| 国产呻吟久久久久久久92| 亚洲精品中文字幕乱码三区91| 国产精品精品视频一区二区三区| 欧美精品免费一区二区| 亚洲第一区国产精品| 日韩亚洲国产精品| 亚洲va欧美va国产综合先锋| 99久久国产免费,99久久国产免费大片| 亚洲精品国产91| 国产一区二区三区黄| 一本久久精品一区二区| 99re热精品视频国产免费| 国产91精品一区二区麻豆亚洲| 日韩午夜电影在线| 欧美一区二区三区视频在线观看| 亚洲欧美日韩三区| 欧美午夜一区二区三区精美视频| 国产大片黄在线观看私人影院| 91婷婷精品国产综合久久| 欧美精品一区二区久久久| 91一区在线| 日本免费电影一区二区三区| 欧美日韩国产欧美| 夜夜嗨av禁果av粉嫩av懂色av| 国产精品久久久久99| 欧美xxxxhdvideos| 国产视频一区二区三区四区| 国产在线一区观看| 久久99精品久久久秒播| 大伊人av| 91一区二区三区久久国产乱| 秋霞av电影网| 亚洲国产aⅴ精品一区二区16| 视频二区狠狠色视频| 99视频国产精品| 欧美日韩一区二区三区精品| 国产乱xxxxx国语对白| 麻豆天堂网| 国产69精品久久久久9999不卡免费 | 国产日产高清欧美一区二区三区| 狠狠色狠狠色综合日日五| 97人人澡人人爽91综合色| 日本不卡精品| 91久久国产露脸精品国产护士| 国产不卡三区| 国产日韩欧美亚洲| 国产视频一区二区不卡| 日本一区二区三区在线视频| 一区二区久久精品66国产精品| 亚洲精品日韩在线| 99精品欧美一区二区| 午夜激情影院| 午夜激情在线播放| 久久99久国产精品黄毛片入口| 欧美极品少妇xxxxⅹ| 国产91麻豆视频| 午夜wwwww| 一本一道久久a久久精品综合蜜臀 国产三级在线视频一区二区三区 日韩欧美中文字幕一区 | 人人澡超碰碰97碰碰碰| 一区二区三区四区视频在线| 亚洲欧美日韩视频一区| 国内精品久久久久影院日本| 亚洲一区欧美| 国产精品一区二区6| 日韩亚洲欧美一区二区| 国产一区二区资源| 亚洲欧美日韩精品suv| 午夜影院啪啪| 91一区二区三区视频| 狠狠插狠狠爱| 日韩av三区| 久久久精品99久久精品36亚| 亚洲欧洲日韩av| 国产精品日韩一区二区三区| 欧美一区二区三区在线视频播放| 亚洲精品日韩在线| 激情久久一区二区| 久久精品国产亚洲7777| 一区二区国产精品| 久久精品一| 国产精品国精产品一二三区| 激情久久综合网| 在线国产二区| 欧美一区二区三区白人| 免费午夜片| 蜜臀久久久久久999| 国产麻豆精品一区二区| 国产欧美一区二区精品婷| 国产精品一区二区免费视频| 国内少妇偷人精品视频免费| 亚洲福利视频一区| 国产精品剧情一区二区三区| 欧美一区二区三区激情在线视频| 欧美激情综合在线| 亚洲欧美一二三| 精品国产仑片一区二区三区| 午夜看片在线| 日韩精品一区二区久久| 中文字幕天天躁日日躁狠狠躁免费 | 91精品久| 久久精品国产精品亚洲红杏| 精品福利一区| 国产精品乱码久久久久久久久| 国产一区二区伦理| 国产三级欧美三级日产三级99| 一区二区三区国产精品| 欧美一区二区三区免费视频| 一区二区三区欧美在线| 日日噜噜夜夜狠狠| 国产97在线播放| 国产91视频一区| 国产精品一二二区| 99国产精品丝袜久久久久久| 国产欧美一区二区三区在线播放| 久久久久亚洲最大xxxx| 三上悠亚亚洲精品一区二区| 国产精品19乱码一区二区三区 | 久久久精品欧美一区二区免费| 色婷婷久久一区二区三区麻豆| 国产日韩精品一区二区| _97夜夜澡人人爽人人| 日韩精品在线一区二区三区| 福利片一区二区三区| 精品久久综合1区2区3区激情| 国产免费观看一区| 国产乱码一区二区三区| 欧美日韩精品中文字幕| 国产精品一区二区不卡| 国产精品一区二区免费视频| 热久久一区二区| 久久久久久亚洲精品中文字幕| 狠狠色噜噜狠狠狠狠2021天天| 国产一区二区极品| 日韩欧美精品一区二区| 少妇厨房与子伦在线观看| 色综合久久久| 欧美二区在线视频| 国产一区二区a| 91精品第一页| 国产91视频一区二区| freexxxxxxx| 十八无遮挡| 91精品综合| 狠狠色综合欧美激情| 久久不卡精品| 午夜国产一区二区| 一区二区三区国产精华| xxxx国产一二三区xxxx| 精品国产乱码久久久久久a丨| 91免费看国产| 99久久婷婷国产综合精品电影| 国内揄拍国产精品| 日韩欧美激情| 欧美一区二区三区爽大粗免费| 久久久999精品视频| 国产精品偷拍| 国产欧美日韩一级| 久久久国产精品一区| 日韩欧美高清一区| 日日夜夜一区二区| 欧美日韩一区二区三区四区五区 | 欧美一区二区精品久久911| 欧美三级午夜理伦三级中视频| 国产午夜精品一区二区三区欧美| 91精品一区二区在线观看| av狠狠干| 国产精品一区二区免费| 一区二区三区电影在线观看| 91热精品| 日本精品一区视频| 国产欧美一区二区三区在线看| 免费观看又色又爽又刺激的视频 | 2020国产精品自拍| 99精品国产免费久久| 蜜臀久久99精品久久一区二区| 欧美色综合天天久久| 亚洲国产精品二区| 国产极品美女高潮无套久久久| 性欧美1819sex性高播放| 国产一区亚洲一区| 大bbw大bbw超大bbw| 亚洲精品久久久久中文第一暮| 精品国产亚洲一区二区三区| 国产91一区二区在线观看| 国产精品美女www爽爽爽视频| 亚洲w码欧洲s码免费| 午夜av免费看| 99国产精品| 91精品视频在线观看免费| 国产日韩欧美三级| 国产精品96久久久| 一区二区三区国产精品| 狠狠色噜噜狠狠狠狠69| 91社区国产高清| 97精品久久人人爽人人爽| www.成| 国产高潮国产高潮久久久91| 狠狠色综合久久丁香婷婷| 日韩精品少妇一区二区在线看| 特级免费黄色片| 综合久久一区| 99久精品视频| 久爱精品视频在线播放| 中文字幕一区二区三区免费| 国产一区二区三区的电影| 色噜噜狠狠色综合中文字幕 | 96国产精品| 国产精选一区二区| 免费a级毛片18以上观看精品 | 国产999久久久| 国产伦精品一区二区三| 欧美一区二区精品久久| 欧美日韩一区二区三区四区五区| 亚洲精品日韩在线| 日本激情视频一区二区三区| 精品久久久久一区二区| 99热久久这里只精品国产www| 国产一区在线视频观看| 国产午夜一区二区三区| 国产一区二区高潮| 肥大bbwbbwbbw高潮| 久久国产精品免费视频| 欧美一区二三区| 一本大道久久a久久精品| 色综合久久综合| 国产日韩精品一区二区三区| 日韩一区二区中文字幕| 久久久久久久久久国产精品| 国产在线精品一区二区在线播放| 91精品一区二区中文字幕| 国产一区在线视频播放| 97精品国产97久久久久久|