日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于認(rèn)知行為知識(shí)的分布式近端策略優(yōu)化方法及其應(yīng)用有效

專利信息
申請(qǐng)?zhí)枺?/td> 202110249707.6 申請(qǐng)日: 2021-03-08
公開(公告)號(hào): CN112906233B 公開(公告)日: 2023-04-18
發(fā)明(設(shè)計(jì))人: 黃健;陳浩;李嘉祥;劉權(quán);龔建興;韓潤(rùn)海 申請(qǐng)(專利權(quán))人: 中國(guó)人民解放軍國(guó)防科技大學(xué)
主分類號(hào): G06F30/20 分類號(hào): G06F30/20;G06F30/15;G06N20/00;G06N5/00
代理公司: 北京風(fēng)雅頌專利代理有限公司 11403 代理人: 曾志鵬
地址: 410003 湖*** 國(guó)省代碼: 湖南;43
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 基于 認(rèn)知 行為 知識(shí) 分布式 策略 優(yōu)化 方法 及其 應(yīng)用
【說明書】:

發(fā)明公開了一種基于認(rèn)知行為知識(shí)的分布式近端策略優(yōu)化方法及其應(yīng)用,方法包括以下步驟:采用認(rèn)知行為知識(shí)建立Agent的認(rèn)知行為模型,并將該認(rèn)知行為模型引入深度強(qiáng)化學(xué)習(xí),構(gòu)建基于認(rèn)知行為知識(shí)的深度強(qiáng)化學(xué)習(xí)框架;基于上述深度強(qiáng)化學(xué)習(xí)框架,提出基于認(rèn)知行為知識(shí)的分布式近端策略優(yōu)化算法;定量化設(shè)計(jì)認(rèn)知行為模型對(duì)Agent策略更新的引導(dǎo)方式,實(shí)現(xiàn)Agent在認(rèn)知行為知識(shí)基礎(chǔ)上持續(xù)學(xué)習(xí)。本發(fā)明提出的方法可以有效利用認(rèn)知行為知識(shí),并在此基礎(chǔ)上進(jìn)行策略更新,從而提高Agent的學(xué)習(xí)效率。

技術(shù)領(lǐng)域

本發(fā)明涉及深度強(qiáng)化學(xué)習(xí)技術(shù)領(lǐng)域,具體涉及一種基于認(rèn)知行為知識(shí)的分布式近端策略優(yōu)化方法及其在空戰(zhàn)機(jī)動(dòng)決策中的應(yīng)用。

背景技術(shù)

近年來,深度強(qiáng)化學(xué)習(xí)在視頻游戲、交通信號(hào)燈控制、機(jī)器人等領(lǐng)域取得了廣泛應(yīng)用。然而,強(qiáng)化學(xué)習(xí)算法需要大量的采樣并通過試錯(cuò)的方式不斷優(yōu)化Agent的策略。但是,巨大的采樣復(fù)雜度限制了強(qiáng)化學(xué)習(xí)算法在實(shí)際問題中的應(yīng)用,而運(yùn)用已有的認(rèn)知行為知識(shí)加速Agent策略學(xué)習(xí)是解決上述問題的有效手段。

人類與學(xué)習(xí)型Agent在認(rèn)知水平、認(rèn)知方式以及行為方式上存在較大差異,將人的認(rèn)知行為知識(shí)描述為人和Agent可以相互理解的形式并實(shí)現(xiàn)高效的認(rèn)知行為知識(shí)融合非常困難。為提升學(xué)習(xí)效率,在學(xué)習(xí)過程中,需要將人的認(rèn)知行為知識(shí)介入深度強(qiáng)化學(xué)習(xí),進(jìn)而在跨認(rèn)知層次上實(shí)現(xiàn)相互補(bǔ)充,其本質(zhì)是協(xié)調(diào)先驗(yàn)認(rèn)知行為知識(shí)和學(xué)習(xí)的關(guān)系。因此,如何利用Agent系統(tǒng)的表示方法,將認(rèn)知行為知識(shí)描述為形式化的、可被Agent理解的認(rèn)知行為模型,同時(shí)在此基礎(chǔ)上,將認(rèn)知行為模型融入深度強(qiáng)化學(xué)習(xí),使Agent實(shí)現(xiàn)認(rèn)知行為之上的再學(xué)習(xí)是強(qiáng)化學(xué)習(xí)中需要解決的難題。

發(fā)明內(nèi)容

本發(fā)明要解決的技術(shù)問題是克服現(xiàn)有技術(shù)的不足而提供一種基于認(rèn)知行為知識(shí)的分布式近端策略優(yōu)化方法及其應(yīng)用,以合理有效地利用已有的先驗(yàn)知識(shí)加速多Agent系統(tǒng)學(xué)習(xí)。

為解決上述技術(shù)問題,本發(fā)明的內(nèi)容包括:

基于認(rèn)知行為知識(shí)的分布式近端策略優(yōu)化方法,包括以下步驟:

S1.采用認(rèn)知行為知識(shí)建立Agent的認(rèn)知行為模型,并將該認(rèn)知行為模型引入深度強(qiáng)化學(xué)習(xí),構(gòu)建基于認(rèn)知行為知識(shí)的深度強(qiáng)化學(xué)習(xí)框架;

S2.對(duì)于上述深度強(qiáng)化學(xué)習(xí)框架,構(gòu)建基于認(rèn)知行為知識(shí)的分布式近端策略優(yōu)化算法;

S3.定量化設(shè)計(jì)認(rèn)知行為模型對(duì)Agent策略更新的引導(dǎo)方式,實(shí)現(xiàn)Agent在認(rèn)知行為知識(shí)基礎(chǔ)上持續(xù)學(xué)習(xí)。

進(jìn)一步的,所述步驟S1中,所述Agent的認(rèn)知行為模型以當(dāng)前的環(huán)境信息作為狀態(tài)輸入,通過知識(shí)集理解當(dāng)前狀態(tài),并修改自身的信念集和任務(wù)集,在此基礎(chǔ)上,結(jié)合行為規(guī)則集做出決策,輸出宏動(dòng)作;所述宏動(dòng)作是一系列原子動(dòng)作合成的更高層次動(dòng)作。

進(jìn)一步的,所述步驟S1中,采用基于BDI的GOAL編程語(yǔ)言構(gòu)建Agent的認(rèn)知行為模型,采用Prolog語(yǔ)言描述認(rèn)知行為模型的內(nèi)部狀態(tài),以知識(shí)集代表一般性的概念以及領(lǐng)域內(nèi)的知識(shí),并將知識(shí)集應(yīng)用于信念集和任務(wù)集,信念集和任務(wù)集分別代表認(rèn)知行為模型對(duì)當(dāng)前時(shí)刻環(huán)境的認(rèn)識(shí)和Agent最終要達(dá)到的目標(biāo);動(dòng)作空間中的動(dòng)作以STRIPS語(yǔ)言描述,Agent執(zhí)行動(dòng)作后,環(huán)境發(fā)生改變,認(rèn)知行為模型通過感知環(huán)境發(fā)生改變的事件,進(jìn)而修改信念集和任務(wù)集;行為規(guī)則集具有beliefs+goals=action的形式,利用if-then和forall語(yǔ)句實(shí)現(xiàn);行為選擇是基于知識(shí)集、信念集、任務(wù)集和當(dāng)前狀態(tài)的規(guī)則系統(tǒng)。

進(jìn)一步的,所述步驟S2中,所述基于認(rèn)知行為知識(shí)的分布式近端策略優(yōu)化算法是將認(rèn)知行為模型融入分布式近端策略優(yōu)化算法的目標(biāo)函數(shù),將認(rèn)知行為知識(shí)作為啟發(fā)信息,用于指導(dǎo)強(qiáng)化學(xué)習(xí)前期Agent的策略更新,隨著時(shí)間步長(zhǎng)的推進(jìn),逐漸擺脫對(duì)認(rèn)知行為模型的依賴,轉(zhuǎn)而完全依靠強(qiáng)化學(xué)習(xí)機(jī)制更新策略。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)人民解放軍國(guó)防科技大學(xué),未經(jīng)中國(guó)人民解放軍國(guó)防科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110249707.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖;

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 精品国产区| 午夜伦理片在线观看| 午夜电影一区| 日韩精品免费看| 午夜av男人的天堂| 亚洲精品久久久中文| 久久er精品视频| 午夜大片网| 亚洲高清国产精品| 99色精品视频| 中文字幕一区二区三区乱码| 久久密av| 亚洲精品乱码久久久久久按摩| 欧美资源一区| 性old老妇做受| 欧美精品久| 一区二区三区免费高清视频| 日韩精品999| 一区二区中文字幕在线| 日韩中文字幕在线一区二区| 国产免费一区二区三区四区| 国产丝袜在线精品丝袜91| 国产精品一区二区av日韩在线| 中文乱码在线视频| 久久久久亚洲国产精品| 九九久久国产精品| 一区二区三区香蕉视频| 年轻bbwbbw高潮| 狠狠色噜噜狠狠狠狠综合久| 午夜一区二区三区在线观看| 国产精彩视频一区二区| 亚洲欧美国产精品va在线观看| 亚洲第一天堂无码专区| 狠狠躁夜夜躁2020| 国产一区二区麻豆| 欧美日韩激情一区| 欧美一区二区三区白人| 小萝莉av| 6080日韩午夜伦伦午夜伦| 999偷拍精品视频| 国产精品99一区二区三区| 香蕉av一区| 国产一区二| 欧美激情精品一区| 视频一区欧美| 欧洲国产一区| 日韩亚洲精品在线| 狠狠色依依成人婷婷九月| 欧美三级午夜理伦三级老人| 亚洲国产精品91| 欧美一区免费| 国产99小视频| 欧美日韩一区二区在线播放| 欧美日韩激情一区| 国产伦精品一区二| 福利电影一区二区三区| 国产91热爆ts人妖系列| 91国产在线看| 强制中出し~大桥未久10在线播放| 一区二区三区在线观看国产| 8x8x国产一区二区三区精品推荐| 精品久久9999| 国产理论一区二区三区| 99re久久精品国产| 国产区一区| 精品国产一区二区三区免费| 午夜爽爽爽男女免费观看| 国产精品久久二区| 麻豆精品久久久| 国产精品久久久久久久久久久久久久久久久久| 四季av中文字幕一区| 精品国产一区二| 国产99久久九九精品| 处破大全欧美破苞二十三| 99久久免费毛片基地| 午夜影院色| 色噜噜狠狠色综合中文字幕| 国产日韩欧美亚洲| 911久久香蕉国产线看观看| 国产一级自拍| 亚洲国产精品第一区二区| 热久久一区二区| 久久午夜鲁丝片午夜精品| 精品国精品国产自在久不卡| 91亚洲国产在人线播放午夜| 中文字幕一区2区3区| 国产亚洲精品久久午夜玫瑰园| 久久综合激情网| 久久久精品欧美一区二区| 制服.丝袜.亚洲.另类.中文| 国产69精品久久久久app下载| 国产午夜精品免费一区二区三区视频| 精品在线观看一区二区| 国产精品高潮呻吟88av| 国产一区免费播放| 一级午夜影院| 久久99精| 国产一区二区电影在线观看| 国产欧美日韩一区二区三区四区| 日韩精品人成在线播放| 国产日韩欧美亚洲综合| 国产精品久久久久久久久久久新郎 | 亚洲第一区国产精品| 精品视频在线一区二区三区| 欧美日韩亚洲三区| 日本少妇高潮xxxxⅹ| 午夜电影一区| 日日夜夜精品免费看 | 国产精品麻豆99久久久久久| 国产精品九九九九九| 国91精品久久久久9999不卡| 狠狠色噜狠狠狠狠| 国精偷拍一区二区三区| 日本久久丰满的少妇三区| 国产中文字幕91| 91免费看国产| 色婷婷综合久久久久中文| 亚洲国产精品精品| 黄毛片免费| 午夜电影三级| 91麻豆精品国产综合久久久久久| 国产日韩欧美一区二区在线观看| freexxxx性| 黑人巨大精品欧美黑寡妇| 国产伦精品一区二区三区免费观看| 欧美高清性xxxxhd| 精品国产伦一区二区三区| 日韩中文字幕亚洲欧美| 欧美三级午夜理伦三级老人| 99国产精品九九视频免费看| 中文字幕亚洲欧美日韩在线不卡| 欧美日韩一卡二卡| 亚洲乱小说| 午夜影院h| 自拍偷在线精品自拍偷写真图片| 国产精品久久久久免费a∨大胸| 99国精视频一区一区一三| 日韩一区高清| 精品国产一区二区在线 | 国产91在| 狠狠色丁香久久综合频道日韩| 国产伦理久久精品久久久久| 国产伦精品一区二区三区四区| 国产高清无套内谢免费| 99re久久精品国产| 国产九九九精品视频| 九九国产精品视频| 狠狠色噜噜综合社区| 亚洲国产精品第一区二区| 欧美精品中文字幕在线观看| 日韩中文字幕亚洲欧美| 国产精品自拍不卡| 国产大片一区二区三区| 午夜毛片在线看| 国产精品9区| 精品国产一二三四区| 久久一级精品视频| 国产日韩欧美不卡| 欧美二区在线视频| 亚洲国产精品97久久无色| 午夜剧场伦理| 国产精品电影一区二区三区| 国内精品久久久久久久星辰影视| 日韩av不卡一区| 欧美一区二区三区四区夜夜大片 | 精品久久综合1区2区3区激情| 国产欧美日韩亚洲另类第一第二页| 国产高清精品一区二区| 欧美一区二三区人人喊爽| 一区二区三区欧美视频| 欧美日韩卡一卡二| 国产一区激情| 日韩av一区不卡| 在线精品国产一区二区三区| 91精品夜夜| 99re热精品视频国产免费| 国产99小视频| 日本精品一二三区| 欧美国产亚洲精品| 国产精品久久久久久久综合| 日韩国产不卡| 精品福利一区| 国产午夜精品理论片| 久久综合狠狠狠色97| 黄毛片在线观看| 美日韩一区| 91精品国产高清一区二区三区| 91久久香蕉| 综合色婷婷一区二区亚洲欧美国产 | 日韩美一区二区三区| 中文字幕一级二级三级| 国产香蕉97碰碰久久人人| 欧美一区二区色| 日韩精品少妇一区二区在线看| 爽妇色啪网| 中文字幕一二三四五区| 99久精品视频| 国产一区二区三区乱码| 午夜无人区免费网站| 精品久久不卡| 日本一区二区三区四区高清视频| 香港日本韩国三级少妇在线观看| 日韩精品免费播放| 亚洲欧洲一二三区| 国产午夜精品一区二区三区四区| 久久99精| 日韩中文字幕在线一区| 久久99精品国产一区二区三区| 男女无遮挡xx00动态图120秒| 亚洲欧美国产日韩综合| 欧美乱大交xxxxx| 国产亚洲久久| 亚洲欧美一区二区三区1000| 国产精品久久久久免费a∨大胸| 天摸夜夜添久久精品亚洲人成 | 欧美一区二区精品久久911| 日韩一级免费视频| 久久久一区二区精品| 午夜黄色大片| 亚洲乱码一区二区三区三上悠亚| 国产精品女人精品久久久天天| 国产69久久| 一区精品二区国产| 国产伦理精品一区二区三区观看体验| 男女午夜爽爽| 免费精品99久久国产综合精品应用| 免费高潮又黄又色又爽视频| 一色桃子av| 日韩精品久久一区二区| 日韩精品999| 欧美一区二区三区日本| 国产免费观看一区| 国产资源一区二区三区| 国产精一区二区| 精品一区二区三区影院| 91香蕉一区二区三区在线观看| 九色国产精品入口| 欧美日韩一区二区高清| 久久影院一区二区| 亚洲女人av久久天堂| 国产91视频一区| 高清人人天天夜夜曰狠狠狠狠| 国产婷婷一区二区三区久久| 亚洲一区二区福利视频| 亚洲第一天堂久久| 麻豆91在线|