日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]面向不完全信息博弈的集成策略學(xué)習(xí)方法、裝置和設(shè)備在審

專利信息
申請?zhí)枺?/td> 202210539137.9 申請日: 2022-05-18
公開(公告)號: CN114881194A 公開(公告)日: 2022-08-09
發(fā)明(設(shè)計)人: 陳少飛;袁唯淋;胡振震;陸麗娜;李鵬;陳佳星;蘇炯銘;劉鴻福 申請(專利權(quán))人: 中國人民解放軍國防科技大學(xué)
主分類號: G06N3/00 分類號: G06N3/00;G06N3/04;G06N3/08;G06Q10/06
代理公司: 長沙國科天河知識產(chǎn)權(quán)代理有限公司 43225 代理人: 李楊
地址: 410073 湖*** 國省代碼: 湖南;43
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 面向 不完全 信息 博弈 集成 策略 學(xué)習(xí)方法 裝置 設(shè)備
【說明書】:

本申請涉及一種面向不完全信息博弈的集成策略學(xué)習(xí)方法、裝置和設(shè)備。所述方法包括:通過集成策略學(xué)習(xí)模型中的梯度更新網(wǎng)絡(luò)從訓(xùn)練數(shù)據(jù)中的動作狀態(tài)數(shù)據(jù)提取對抗軌跡特征信息,基于注意力機制集成整合基礎(chǔ)決策模型輸出的基礎(chǔ)策略信息,進(jìn)一步集成得到預(yù)測策略信息,在完成梯度更新網(wǎng)絡(luò)的訓(xùn)練后,得到訓(xùn)練數(shù)據(jù)中每個智能體的第二集成策略信息,通過集成策略學(xué)習(xí)模型中的神經(jīng)演化模塊基于策略評估值通過交叉和變異進(jìn)行進(jìn)化,其中由于訓(xùn)練數(shù)據(jù)是小批量數(shù)據(jù),本方法通過評估并去除對抗得分值中的運氣因素值,在有限軌跡數(shù)據(jù)的基礎(chǔ)上實現(xiàn)了策略的準(zhǔn)確評估。通過策略評估值選取表現(xiàn)優(yōu)異的智能體,得到表現(xiàn)最優(yōu)的集成策略信息。

技術(shù)領(lǐng)域

本申請涉及人工智能領(lǐng)域,特別是涉及一種面向不完全信息博弈的集成策略學(xué)習(xí)方法、裝置和計算機設(shè)備。

背景技術(shù)

大規(guī)模不完全信息博弈是人工智能中的熱點研究領(lǐng)域,在城市安全、反恐維穩(wěn)、邊境緝毒以及野生動物保護等領(lǐng)域都具有廣泛應(yīng)用。不完全信息博弈是防御者和攻擊者相互對抗的形式化描述。以專家知識、博弈理論、強化學(xué)習(xí)等為典型代表的博弈求解范式,在求解不完全信息博弈時具有不同缺點。例如:博弈論中的納什均衡是一種在統(tǒng)計意義上的不敗策略,但并非最優(yōu)策略。強化學(xué)習(xí)可以在有限對局中取得較好的效果,但容易被利用。專家知識的方法在求解大規(guī)模的博弈問題時,具有很好的可解釋性和可靠性,但固化的知識容易被對手發(fā)現(xiàn)規(guī)律加以利用。

現(xiàn)有技術(shù)中,針對同一博弈問題,即使已構(gòu)建專家知識、博弈理論和強化學(xué)習(xí)等不同決策模型,但多種決策無法有效集成,更無法處理不完全信息。因此,現(xiàn)有策略集成技術(shù)存在適應(yīng)性不佳的問題。

發(fā)明內(nèi)容

基于此,有必要針對上述技術(shù)問題,提供一種能夠提高策略表現(xiàn)效果的面向不完全信息博弈的集成策略學(xué)習(xí)方法、裝置和計算機設(shè)備。

一種面向不完全信息博弈的集成策略學(xué)習(xí)方法,所述方法包括:

獲取對抗場景中博弈雙方的訓(xùn)練數(shù)據(jù);所述訓(xùn)練數(shù)據(jù)中包括對手池信息、多個迭代版本的智能體與所述對手池信息中不同對手對抗的動作狀態(tài)數(shù)據(jù)、推薦策略信息、基礎(chǔ)決策模型輸出的基礎(chǔ)策略信息;所述基礎(chǔ)決策模型為預(yù)先設(shè)計的,數(shù)量至少有兩個;所述對手池信息中對手的信息為不完全信息;

將所述訓(xùn)練數(shù)據(jù)輸入預(yù)先設(shè)計的集成策略學(xué)習(xí)模型中;所述集成策略學(xué)習(xí)模型包括梯度更新網(wǎng)絡(luò)和神經(jīng)演化模塊;所述梯度更新網(wǎng)絡(luò)包括長短時記憶網(wǎng)絡(luò)模塊,注意力機制模塊,全連接網(wǎng)絡(luò)模塊和輸出模塊;所述神經(jīng)演化模塊包括中心化評估模塊、基因編碼模塊和進(jìn)化操作模塊;

通過所述長短時記憶網(wǎng)絡(luò)模塊根據(jù)每個智能體的所述動作狀態(tài)數(shù)據(jù)提取對抗軌跡特征信息,通過所述注意力機制模塊對所述基礎(chǔ)策略信息進(jìn)行加權(quán)集成得到第一集成策略信息,通過所述全連接網(wǎng)絡(luò)根據(jù)所述對抗軌跡特征信息和所述第一集成策略進(jìn)行進(jìn)一步處理,并通過所述輸出模塊激活輸出,得到每個智能體的預(yù)測策略信息;

以所述推薦策略信息為標(biāo)簽信息,根據(jù)所述預(yù)測策略信息和所述標(biāo)簽信息對所述梯度更新網(wǎng)絡(luò)進(jìn)行有監(jiān)督訓(xùn)練,得到訓(xùn)練好的梯度更新網(wǎng)絡(luò),通過所述訓(xùn)練好的梯度更新網(wǎng)絡(luò)根據(jù)所述訓(xùn)練數(shù)據(jù)輸出所述訓(xùn)練數(shù)據(jù)的第二集成策略信息;

通過所述中心化評估模塊根據(jù)所述訓(xùn)練數(shù)據(jù)的第二集成策略信息將對應(yīng)的智能體與所述對手池信息中的每個對手分別對抗,評估并去除對抗得分值中的運氣因素值,再對所述第二集成策略進(jìn)行評估得到精確的策略評估值;

通過所述基因編碼模塊將所述訓(xùn)練數(shù)據(jù)的第二集成策略信息表示為參數(shù)待優(yōu)化的神經(jīng)網(wǎng)絡(luò);

通過所述進(jìn)化操作模塊將所有所述參數(shù)待優(yōu)化的神經(jīng)網(wǎng)絡(luò)的參數(shù)構(gòu)成種群,根據(jù)對應(yīng)的所述策略評估值將所述種群分為精英層和存活層,通過交叉操作算子和變異操作算子進(jìn)行多代種群演化,以對所述參數(shù)待優(yōu)化的神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化;其中,所述精英層中的個體對變異免疫,所述存活層中的個體必須經(jīng)過變異才能進(jìn)入下一代;

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍國防科技大學(xué),未經(jīng)中國人民解放軍國防科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202210539137.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 久久国产精品久久久久久电车| 日韩精品久久久久久久电影99爱| 久久三级精品| 91久久久久久亚洲精品禁果| 国偷自产中文字幕亚洲手机在线| 国产伦精品一区二区三区照片91| 久久影院国产精品| 日本xxxxxxxxx68护士| 色噜噜狠狠狠狠色综合久| 国产一区在线视频观看| 欧美精品日韩| 亚洲欧美一区二| 午夜伦全在线观看| 日韩亚洲欧美一区二区| 国产特级淫片免费看| 国产精品久久久久99| 欧美一区二区久久久| xxxx18hd护士hd护士| 精品国产乱码久久久久久免费| 欧美一区亚洲一区| 日韩三区三区一区区欧69国产| 欧美在线一级va免费观看| 日韩国产欧美中文字幕| 日本一二三区电影| 日韩中文字幕在线一区二区| 欧美一区二区三区白人| 日本午夜精品一区二区三区| 日韩av在线影视| 91精品国模一区二区三区| 久久99精品一区二区三区| 国产精品一区在线观看 | 中文字幕制服丝袜一区二区三区| 国产高清一区在线观看| 强制中出し~大桥未久10| 欧美精品xxxxx| 国产一区在线精品| 一区二区欧美在线| 久久久久久久亚洲视频| 国产一区免费在线观看| 午夜肉伦伦影院九七影网| 国产高清无套内谢免费| 性视频一区二区三区| 国产精品一品二区三区四区五区| 爱看av在线入口| 精品国产一区二区三区免费| xxxx18hd护士hd护士| 艳妇荡乳欲伦2| 午夜影院h| 欧美髙清性xxxxhdvid| 国产欧美一区二区三区免费看| 999久久久国产| 欧美亚洲视频一区二区| 国产精品亚洲一区二区三区| 亚洲理论影院| 欧美福利一区二区| 激情欧美一区二区三区| 91麻豆精品国产91久久久久| 国产精品不卡一区二区三区| 国产午夜三级一区二区三| 国产欧美久久一区二区三区| 香蕉av一区二区| 欧洲另类类一二三四区| 午夜欧美a级理论片915影院| 欧美精品在线一区二区| 91日韩一区二区三区| 国内揄拍国产精品| 国产精品电影免费观看| 久久午夜鲁丝片午夜精品| 国产午夜精品一区二区三区欧美| 国产91免费观看| 日韩精品中文字幕一区| 精品国产九九| 麻豆国产一区二区三区| 国产在线一卡二卡| 国产一区第一页| 欧美午夜理伦三级在线观看偷窥| 91久久香蕉| 91麻豆精品国产91久久久久| 制服.丝袜.亚洲.另类.中文| 亚洲国产精品入口| 97久久精品人人做人人爽| 亚洲欧美日韩一级| 国产在线观看免费麻豆| 2023国产精品自产拍在线观看| 国产日本一区二区三区| 天摸夜夜添久久精品亚洲人成 | 欧美黄色一二三区| 国产又色又爽无遮挡免费动态图| 香蕉av一区二区| 欧美精品日韩精品| 一级午夜影院| 激情久久一区| 国产精品一二三四五区| 欧美精品中文字幕亚洲专区| 日韩av在线免费电影| 国产亚洲精品久久久久久久久动漫 | 国产精品一二三在线观看| 99日韩精品视频| 久久影视一区二区| 国产精品一区二区av麻豆| 电影91久久久| 久久99亚洲精品久久99| 久爱精品视频在线播放| 精品久久久综合| 91超碰caoporm国产香蕉| 三上悠亚亚洲精品一区二区| 国产日韩欧美在线影视| 丰满岳乱妇在线观看中字 | 国产精品高潮呻吟88av| 男人的天堂一区二区| 97国产婷婷综合在线视频,| 欧洲国产一区| 国产精品偷伦一区二区| 亚洲综合日韩精品欧美综合区| 亚洲欧洲日韩av| 欧美日韩偷拍一区| 亚洲1区2区3区4区| 91麻豆产精品久久久| 欧美午夜羞羞羞免费视频app| 国产一区2区3区| 99视频一区| 欧美午夜一区二区三区精美视频| 久久久精品欧美一区二区免费| 国产亚洲精品久久久久秋霞| 日韩精品中文字幕久久臀| 中文字幕一区二区三区又粗| 亚洲国产精品91| 久久一区二| 欧美日韩不卡视频| 一区二区三区国产精品视频| 综合国产一区| 中文字幕一区二区三区免费视频| 91精品国产综合久久福利软件| 日韩一级精品视频在线观看| 国内自拍偷拍一区| 日本一区二区欧美| 国产精品一区二区日韩新区| 91夜夜夜| 欧美在线精品一区| 欧美日韩一卡二卡| 性欧美1819sex性高播放| 国产精品一区二区6| 国产1区2区3区| 欧美日韩国产精品一区二区三区| 久久精品手机视频| 久久激情综合网| 精品一区二区三区中文字幕| 欧美精品六区| 国产一级自拍| 国产精品视频一区二区在线观看| 国产精品v欧美精品v日韩| 日韩av在线一区| 久久精品欧美一区二区| 欧美一区二区精品久久911| 久久一二区| 欧美乱码精品一区二区| 久久天天躁狠狠躁亚洲综合公司| 国产欧美一区二区三区四区| 国产精品亚洲欧美日韩一区在线| 亚洲精品乱码久久久久久按摩| 亚欧精品在线观看| 日本三级香港三级| 国产精品久久久久久亚洲调教| 中文文精品字幕一区二区| 国产精品久久国产三级国电话系列 | 国产色99| 91一区二区三区视频| 亚洲视频h| 公乱妇hd在线播放bd| 国产精品女人精品久久久天天| 欧美日韩中文国产一区发布| 国产二区视频在线播放| 日本护士hd高潮护士| 午夜一区二区三区在线观看| 久久人做人爽一区二区三区小说 | 欧美精品久久一区| 久久久久久中文字幕| 午夜影院一区二区| 中文字幕一区一区三区| 精品视频在线一区二区三区| 国产视频一区二区不卡| 色吊丝av中文字幕| 国产精品高潮在线| 国产一区二区影院| 国内久久精品视频| 国产97免费视频| 羞羞免费视频网站| 国产三级欧美三级日产三级99| 精品国产一区二区三区在线| 日韩一级精品视频在线观看 | 亚洲日韩aⅴ在线视频| 国产.高清,露脸,对白| 亚洲视频h| 国产97久久| 亚洲精品www久久久| 日韩精品一区二区三区中文字幕| 亚洲欧美国产日韩综合| 精品无人国产偷自产在线| 国内精品99| 国产一区二区三区影院| 海量av在线| 99国产超薄丝袜足j在线观看| 欧美在线视频二区| 国产一区二区伦理片| 国产精品视频99| 年轻bbwbbw高潮| av中文字幕一区二区| 一区二区三区欧美日韩| 岛国精品一区二区| 伊人av综合网| 日本一级中文字幕久久久久久| 国产88av| 亚洲国产精品网站| 欧美日韩国产123| 亲子乱子伦xxxx| 中文字幕一区二区三区又粗| 99re6国产露脸精品视频网站| 91精品久久久久久综合五月天| 国产视频一区二区三区四区| 销魂美女一区二区| 午夜激情电影在线播放| 欧美日韩卡一卡二| 欧美日韩激情一区二区| 精品国产二区三区| 久久精品一二三四| 亚洲精品乱码久久久久久麻豆不卡| 国产精品久久久久久久妇女| 亚洲麻豆一区| 一级黄色片免费网站| 一级久久久| 午夜av资源| 国产一级不卡视频| 制服丝袜二区| 97久久国产精品| 91一区在线观看| 99re国产精品视频| 制服.丝袜.亚洲.另类.中文| 国产目拍亚洲精品区一区| 香蕉免费一区二区三区在线观看| 91精品一二区| 久久综合国产伦精品免费| 欧美性xxxxx极品少妇| 国产精品久久久久久久久久久久冷| 精品一区二区在线视频| 国内精品国产三级国产99| 日本久久丰满的少妇三区|