日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種面向困難探索環(huán)境的記憶保持課程學習方法在審

專利信息
申請?zhí)枺?/td> 202011169070.1 申請日: 2020-10-28
公開(公告)號: CN112633466A 公開(公告)日: 2021-04-09
發(fā)明(設(shè)計)人: 曾政文;韋佳 申請(專利權(quán))人: 華南理工大學
主分類號: G06N3/04 分類號: G06N3/04;G06N3/08
代理公司: 廣州粵高專利商標代理有限公司 44102 代理人: 何淑珍;江裕強
地址: 510640 廣*** 國省代碼: 廣東;44
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 面向 困難 探索 環(huán)境 記憶 保持 課程 學習方法
【權(quán)利要求書】:

1.一種面向困難探索環(huán)境的記憶保持課程學習方法,其特征在于,所述方法包括以下步驟:

步驟S1、根據(jù)困難探索問題構(gòu)建一系列子任務,并將子任務進行排列組成智能體即將學習的課程;

步驟S2、構(gòu)造雙重記憶系統(tǒng),雙重記憶系統(tǒng)包括短期記憶智能體和長期記憶智能體;初始化各個智能體的策略參數(shù),并用深度神經(jīng)網(wǎng)絡(luò)來表示各個智能體的策略函數(shù);

步驟S3、短期記憶智能體根據(jù)步驟S1的課程進行序列訓練,持續(xù)從一系列子任務中學習新的知識;

步驟S4、當短期記憶智能體收斂到當前任務下的最優(yōu)策略時,收集與當前任務交互產(chǎn)生的經(jīng)驗片段,并將經(jīng)驗片段存儲到記憶緩存池中;

步驟S5、使用記憶緩存池中的數(shù)據(jù)來訓練長期記憶智能體,使用策略蒸餾將知識從短期記憶智能體遷移至長期記憶智能體,并采用KL散度作為策略蒸餾的損失函數(shù),同時,采用貝葉斯在線學習中參數(shù)后驗的拉普拉斯近似估計作為記憶保持的損失函數(shù),參數(shù)后驗視作舊任務的信息容器,以此約束與舊任務相關(guān)的參數(shù);

步驟S6、使用記憶緩存池中的數(shù)據(jù)訓練到迭代次數(shù)后,保存長期記憶智能體策略參數(shù),同時,將記憶緩存池中的樣本輸入到長期記憶智能體的策略網(wǎng)絡(luò)中,計算長期記憶智能體的各層網(wǎng)絡(luò)的前向輸入和反向梯度,再根據(jù)克羅內(nèi)克乘積計算當前參數(shù)下的費舍矩陣,保存網(wǎng)絡(luò)各層參數(shù)的克羅內(nèi)科因子,利用衰減因子來對各個任務的費舍矩陣進行更新合并;

步驟S7、重復步驟S3至步驟S7直到課程中的任務都訓練完畢,獲得最終的短期記憶智能體和長期記憶智能體。

2.根據(jù)權(quán)利要求1所述的一種面向困難探索環(huán)境的記憶保持課程學習方法,其特征在于:步驟S1的子任務構(gòu)建方法為修改環(huán)境參數(shù),或者簡化任務環(huán)境,但是環(huán)境狀態(tài)空間以及動作空間保持不變。

3.根據(jù)權(quán)利要求2所述的一種面向困難探索環(huán)境的記憶保持課程學習方法,其特征在于:步驟S1是根據(jù)啟發(fā)式的方法或者專家知識將子任務按照從易至難的順序進行排列。

4.根據(jù)權(quán)利要求3所述的一種面向困難探索環(huán)境的記憶保持課程學習方法,其特征在于:所述短期記憶智能體的深度神經(jīng)網(wǎng)絡(luò)包括表示層、動作層、狀態(tài)估值層;

長期記憶智能體的深度神經(jīng)網(wǎng)絡(luò)包括表示層和動作層;對于短期記憶智能體的深度神經(jīng)網(wǎng)絡(luò)和長期記憶智能體的深度神經(jīng)網(wǎng)絡(luò)中表示層的具體結(jié)果,根據(jù)實際問題組合卷積層和全連接層,而短期記憶智能體的深度神經(jīng)網(wǎng)絡(luò)和長期記憶智能體的深度神經(jīng)網(wǎng)絡(luò)中動作層和狀態(tài)估值層均用全連接網(wǎng)絡(luò)表示,動作層輸出動作概率分布,狀態(tài)估值層輸入當前狀態(tài)估值,長期記憶智能體和短期記憶智能體的網(wǎng)絡(luò)輸入均為當前環(huán)境狀態(tài)。

5.根據(jù)權(quán)利要求4所述的一種面向困難探索環(huán)境的記憶保持課程學習方法,其特征在于:所述長期記憶智能體的深度神經(jīng)網(wǎng)絡(luò)中的卷積層均使用零填充操作,以便對位置信息進行編碼。

6.根據(jù)權(quán)利要求5所述的一種面向困難探索環(huán)境的記憶保持課程學習方法,其特征在于:步驟S3中,課程中的每個任務建模為馬爾可夫決策過程,并且使用演員評論家算法來求解,課程中每個任務的最優(yōu)策略為

其中,i代表課程中的任務序號,表示智能體在任務Mi下的訓練參數(shù),而表示智能體在任務Mi下訓練的最優(yōu)參數(shù),θ0表示智能體在第一個任務上訓練時的隨機初始化參數(shù),表示在任務Mi下的期望累計收益,短期記憶智能體在面對下一個任務Mi+1時的起始策略是當前任務Mi的最優(yōu)策略,起始時隨機初始化策略,表示上一個任務Mi-1的的最優(yōu)策略。

7.根據(jù)權(quán)利要求6所述的一種面向困難探索環(huán)境的記憶保持課程學習方法,其特征在于:步驟S3的訓練過程是具體為從學習的課程中挑選出任務Mi,使短期記憶智能體與環(huán)境交互生成軌跡{τi},用演員評論家算法更新短期記憶智能體策略參數(shù)θS,交替進行環(huán)境交互和參數(shù)更新的過程,直到短期記憶智能體與環(huán)境的交互數(shù)達到最大訓練局數(shù)。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學,未經(jīng)華南理工大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011169070.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品不卡在线| 99久久婷婷国产亚洲终合精品| 久久亚洲精品国产一区最新章节| 中文字幕一区二区三区乱码| 欧美精品一区二区三区视频| 精品国产一区二区在线| 国产二区视频在线播放| free性欧美hd另类丰满| 国产乱子伦农村xxxx| 四虎久久精品国产亚洲av| 国产伦精品一区二区三区免费迷| 国产一区二区播放| 欧美一区二区三区四区夜夜大片| 国产精品天堂网| 99国产精品一区二区| 欧美一区二粉嫩精品国产一线天| 欧美一区二区三区爽大粗免费| 亚洲第一天堂久久| 偷拍自中文字av在线| 国产超碰人人模人人爽人人添| 欧美日韩偷拍一区| 欧美一级片一区| 在线视频国产一区二区 | 日韩av在线网址| 538在线一区二区精品国产| 国产欧美日韩va另类在线播放| 国产女人和拘做受视频免费| 亚洲精品老司机| 性欧美一区二区| 国产经典一区二区| 日韩a一级欧美一级在线播放| 欧美精品免费看| 久久国产欧美一区二区免费| 午夜老司机电影| 亚洲无人区码一码二码三码| xxxx18hd护士hd护士| 国产伦精品一区二区三区免费迷| 99久久久久久国产精品| 日本午夜一区二区| 久久一区二区精品视频| 男人的天堂一区二区| 国产精品欧美日韩在线| 中文字幕国内精品| 日韩久久电影| 99国产精品99久久久久久粉嫩| 91久久免费| 国产视频二区在线观看| 欧美一区二区三区久久精品视 | 国产一区2| 日韩av免费网站| 一区二区三区免费高清视频| 国产精品久久久久久亚洲美女高潮| 欧美日韩一区视频| 欧美精选一区二区三区| 国产精品电影一区| 久久久久久久久亚洲精品| 亚洲一二三在线| 国产精品久久久区三区天天噜| 日韩中文字幕一区二区在线视频 | 99精品国产99久久久久久97| 久久久精品a| 久久夜色精品国产噜噜麻豆| 欧美日韩一区二区在线播放| 国产色99| 亚洲欧美一区二区三区不卡| 亚洲欧美制服丝腿| 国产69精品久久久久男男系列| 欧美日韩国产区| 亚洲精品456| 午夜毛片在线| 鲁丝一区二区三区免费观看| 日韩av在线导航| 久久青草欧美一区二区三区| 亚日韩精品| 日本看片一区二区三区高清| 精品99免费视频| 国产一二区精品| 欧美一区二区性放荡片| 黄色av免费| 国产精品美女一区二区视频| 丰满岳乱妇在线观看中字| 久久一区欧美| 国产精品九九九九九九| 国产日韩欧美在线影视| 午夜裸体性播放免费观看| 久久99精品久久久大学生| 强行挺进女警紧窄湿润| 99国产精品9| 国产精品人人爽人人做av片| 91黄在线看 | 亚洲精品乱码久久久久久国产主播| bbbbb女女女女女bbbbb国产| 欧美精品国产精品| 夜夜躁日日躁狠狠久久av| 国产91高清| 4399午夜理伦免费播放大全| 欧美午夜精品一区二区三区| 亚洲精品91久久久久久| 午夜av网址| 韩国女主播一区二区| 一区二区在线视频免费观看| 亚洲第一天堂无码专区| 欧美日韩不卡视频| 久久久久久久久亚洲精品一牛| 欧洲精品一区二区三区久久| 亚洲欧美国产中文字幕| 欧美在线观看视频一区二区三区| 国产欧美精品一区二区在线播放| 国产乱码一区二区三区| 国产精品亚洲精品| 欧美freesex极品少妇| 蜜臀久久99精品久久久久久网站| 国产午夜精品一区二区三区在线观看| 欧美激情精品一区| 麻豆天堂网| 91精品丝袜国产高跟在线| 国产一级片大全| 亚洲精品国产久| 99久久婷婷国产精品综合| 国产全肉乱妇杂乱视频在线观看| 亚洲精品少妇久久久久| 91国偷自产一区二区介绍| 狠狠躁狠狠躁视频专区| 亚洲精品久久久久不卡激情文学| 国产69精品久久久久777糖心| 国产99久久久精品视频| 国产高清一区二区在线观看| 国产91福利视频| 理论片午午伦夜理片在线播放 | 久久密av| 91久久香蕉国产日韩欧美9色| 国产一卡二卡在线播放| 欧美精品一卡二卡| 911久久香蕉国产线看观看| 久久91久久久久麻豆精品| 欧美日韩中文字幕三区| 国模一区二区三区白浆| 久久精品一二三四| 欧美精品在线观看视频| 国产二区视频在线播放| 国产一区二三| 一区二区国产盗摄色噜噜| 国产欧美一区二区精品性| 超碰97国产精品人人cao| 狠狠躁夜夜av| 香蕉av一区| 欧美日韩中文字幕一区二区三区| 欧美一区二区三区艳史| 欧美日韩三区| 久久人做人爽一区二区三区小说 | 中文字幕欧美一区二区三区 | 91高清一区| 久久久精品免费看| 午夜电影网一区| 免费看性生活片| 91久久国产露脸精品| 99久久免费精品国产男女性高好| 欧美日韩激情一区二区| 91精品国产麻豆国产自产在线| 国产日韩欧美精品| 人人玩人人添人人澡97| 91精品系列| 狠狠色狠狠综合久久| 国产一区二区手机在线观看| 日韩av一区不卡| 国产乱一乱二乱三| 国产视频在线一区二区| 国产一级自拍| 国产乱了高清露脸对白| 野花社区不卡一卡二| 强行挺进女警紧窄湿润| 国产精品欧美久久| yy6080影院旧里番乳色吐息| 日韩精品中文字幕一区二区三区| 日韩av三区| 91丝袜国产在线播放| 日本福利一区二区| 国产一区二区三区午夜| 久久久久久久国产精品视频| 免费超级乱淫视频播放| 欧美日韩卡一卡二| 91麻豆产精品久久久| 在线观看v国产乱人精品一区二区 国产日韩欧美精品一区二区 | 欧美一区二区三区中文字幕| 日本边做饭边被躁bd在线看| 国产69精品久久久久按摩| 亚洲精品无吗| 久久福利视频网| 欧美亚洲视频二区| 97欧美精品| 精品一区在线观看视频| 狠狠色噜噜狠狠狠狠米奇7777| 国产精品免费不卡| 国产91一区| 国产一区二区视频播放| 欧美日韩国产一区二区三区在线观看| 人人要人人澡人人爽人人dvd| 欧美日韩九区| 中出乱码av亚洲精品久久天堂| 日韩av电影手机在线观看| 亚洲少妇一区二区三区| 一本色道久久综合亚洲精品图片| 国产精品刺激对白麻豆99| 91精品视频在线免费观看| 国产真实乱偷精品视频免| 中文无码热在线视频| 91影视一区二区三区| 日韩精品一区二区三区免费观看| 国产一区二区三级| 96精品国产| 午夜免费片| 右手影院av| 亚洲第一天堂无码专区| 玖玖爱国产精品| 久免费看少妇高潮a级特黄按摩| 欧美日韩激情一区| 午夜毛片影院| 理论片高清免费理伦片| 久久一区二区视频| 狠狠色噜噜综合社区| 亚洲精品卡一卡二| 国产一区二区三区小说| 精品久久综合1区2区3区激情| 天干天干天啪啪夜爽爽99| 国产一区网址| 欧美在线播放一区| 亚洲欧美另类综合| 国产视频二区| 99精品小视频| 国产乱码一区二区| 少妇高潮一区二区三区99小说| 国产不卡三区| 日韩精品免费看| 日本五十熟hd丰满| 日韩精品人成在线播放| 久久青草欧美一区二区三区| 亚洲精品一品区二品区三品区| 久精品国产| 国产99久久九九精品| 日韩精品中文字幕一区二区三区| 日韩一区二区三区福利视频| 97精品国产97久久久久久免费| 亚洲欧美另类综合| 国产va亚洲va在线va| 狠狠躁夜夜躁xxxxaaaa| 日韩欧美国产另类|