日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]動態(tài)優(yōu)勢函數(shù)建模方法、裝置、存儲介質(zhì)及電子設備在審

專利信息
申請?zhí)枺?/td> 202110564559.7 申請日: 2021-05-24
公開(公告)號: CN113392952A 公開(公告)日: 2021-09-14
發(fā)明(設計)人: 胡紀鋒;陳賀昌;孫智孝;樸海音;詹光;常毅 申請(專利權(quán))人: 吉林大學
主分類號: G06N3/00 分類號: G06N3/00;G06N20/00
代理公司: 北京恒博知識產(chǎn)權(quán)代理有限公司 11528 代理人: 張曉芳
地址: 130012 吉*** 國省代碼: 吉林;22
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 動態(tài) 優(yōu)勢 函數(shù) 建模 方法 裝置 存儲 介質(zhì) 電子設備
【說明書】:

本申請實施例公開了一種動態(tài)優(yōu)勢函數(shù)的建模方法,涉及深度強化學習領域。方法包括:針對靜態(tài)優(yōu)勢函數(shù)的演員?評論家模型中包括的靜態(tài)優(yōu)勢函數(shù)添加權(quán)重因子,得到第一動態(tài)優(yōu)勢函數(shù);基于長短期記憶網(wǎng)絡模型對所述演員?評論家模型中包括的原始策略網(wǎng)絡進行動作延遲跟隨和重構(gòu),得到第二動態(tài)優(yōu)勢函數(shù);基于所述第一動態(tài)優(yōu)勢函數(shù)和所述第二動態(tài)優(yōu)勢函數(shù)構(gòu)成所述動態(tài)優(yōu)勢函數(shù)。采用本申請實施例,可以解決現(xiàn)有的基于靜態(tài)優(yōu)勢函數(shù)的演員?評論家模型需要大量樣本數(shù)據(jù)支撐訓練,以及針對智能體的訓練初期效果不理想、模型學習效率低、魯棒性差的問題。

技術領域

本申請涉及深度強化學習領域,尤其涉及一種動態(tài)優(yōu)勢函數(shù)的建模方法、裝置、存儲介質(zhì)及電子設備。

背景技術

隨著科學技術的不斷發(fā)展,人工智能正在多個領域展現(xiàn)出強勁的發(fā)展勢頭,越來越多的智能體開始出現(xiàn)在人們的視野當中,比如虛擬客服、智能音箱、游戲AI等,這些智能體能夠適應環(huán)境并進行決策,而訓練這些智能體可以使用深度強化學習(ReinforcementLearning,RL)的方法達到。深度強化學習可以歸結(jié)為一個五元組表示的馬爾可夫決策過程(Markov Decision Processes,MDP),即(S,A,R,P,γ),分別代表環(huán)境狀態(tài)、動作、獎勵、狀態(tài)轉(zhuǎn)移矩陣、累積獎勵折扣因子。智能體從環(huán)境獲取環(huán)境狀態(tài),并基于當前狀態(tài)產(chǎn)生動作作用于環(huán)境以使環(huán)境產(chǎn)生下一步環(huán)境狀態(tài),同時接受環(huán)境反饋的收益。在與環(huán)境交互的過程中,智能體的目的是獲取的長期受益最大化。

基于靜態(tài)優(yōu)勢函數(shù)的演員-評論家模型是深度強化學習中被普遍采用來訓練智能體的一種模型,優(yōu)勢函數(shù)的含義可以理解為,在狀態(tài)si下,選擇某一優(yōu)勢動作ai,k獲得的收益相對于在狀態(tài)si下所有動作ai,j{j=1,…,k,k+1,..n}產(chǎn)生的平均收益的優(yōu)勢程度。換而言之,優(yōu)勢函數(shù)是得到某一個隨機變量相對這個隨機變量均值的偏差的函數(shù)。

然而基于現(xiàn)有的基于靜態(tài)優(yōu)勢函數(shù)的演員-評論家模型對智能體的訓練,需要大量的樣本數(shù)據(jù)支持,在某些情況下,智能體與環(huán)境交互會產(chǎn)生巨大的交互成本以及時間成本。例如,針對在汽車上實現(xiàn)自動駕駛功能的智能體,想要采集汽車與環(huán)境交互的樣本數(shù)據(jù)無疑是非常耗時耗力以及成本很高的。而少量的樣本數(shù)據(jù),不僅會使訓練后的智能體達不到預想效果,而且智能體的魯棒性也較差。

發(fā)明內(nèi)容

本申請實施例提供了一種動態(tài)優(yōu)勢函數(shù)建模方法、裝置、存儲介質(zhì)及電子設備,可以解決現(xiàn)有的基于靜態(tài)優(yōu)勢函數(shù)的演員-評論家模型需要大量樣本數(shù)據(jù)支撐訓練,以及針對智能體的訓練初期效果不理想、模型學習效率低、魯棒性差的問題,所述技術方案如下:

第一方面,本申請實施例提供了一種動態(tài)優(yōu)勢函數(shù)建模方法,所述方法包括:

針對靜態(tài)優(yōu)勢函數(shù)的演員-評論家模型中包括的靜態(tài)優(yōu)勢函數(shù)添加權(quán)重因子,得到第一動態(tài)優(yōu)勢函數(shù);

基于長短期記憶網(wǎng)絡模型對所述演員-評論家模型中包括的原始策略網(wǎng)絡進行動作延遲跟隨和重構(gòu),得到第二動態(tài)優(yōu)勢函數(shù);

基于所述第一動態(tài)優(yōu)勢函數(shù)和所述第二動態(tài)優(yōu)勢函數(shù)構(gòu)成所述動態(tài)優(yōu)勢函數(shù)。

第二方面,本申請實施例提供了一種動態(tài)優(yōu)勢函數(shù)的優(yōu)化裝置,所述裝置包括:

第一動態(tài)優(yōu)勢函數(shù)模塊,用于針對靜態(tài)優(yōu)勢函數(shù)的演員-評論家模型中包括的靜態(tài)優(yōu)勢函數(shù)添加權(quán)重因子,得到第一動態(tài)優(yōu)勢函數(shù);

第二動態(tài)優(yōu)勢函數(shù)模塊,用于基于長短期記憶網(wǎng)絡模型對所述演員-評論家模型中包括的原始策略網(wǎng)絡進行動作延遲跟隨和重構(gòu),得到第二動態(tài)優(yōu)勢函數(shù);

動態(tài)優(yōu)勢函數(shù)模塊,基于所述第一動態(tài)優(yōu)勢函數(shù)和所述第二動態(tài)優(yōu)勢函數(shù)構(gòu)成所述動態(tài)優(yōu)勢函數(shù)。

下載完整專利技術內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于吉林大學,未經(jīng)吉林大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110564559.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術的結(jié)構(gòu)示意圖流程工藝圖技術構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 午夜肉伦伦影院九七影网| 粉嫩久久99精品久久久久久夜| 欧美一区二区在线不卡| 鲁丝一区二区三区免费| 久久婷婷国产综合一区二区| 国产一区午夜| 国产91丝袜在线熟| 欧美日韩一区二区三区不卡| 欧美一区二区三区另类| 亚洲午夜精品一区二区三区| 鲁一鲁一鲁一鲁一鲁一av| 福利片91| 日本精品99| 91精品综合| 99国精视频一区一区一三| 一区二区免费播放| 狠狠色噜噜狠狠狠狠黑人| 亚洲午夜精品一区二区三区电影院 | 国产精品入口麻豆九色| 欧美极品少妇| 91黄在线看| 国产1区2| 亚洲精品一区中文字幕| 日本一区午夜艳熟免费| 国产精品麻豆一区二区三区| 69久久夜色精品国产69–| 狠狠躁夜夜躁xxxxaaaa| 一区二区在线国产| 国产69精品福利视频| 高清人人天天夜夜曰狠狠狠狠| 老太脱裤子让老头玩xxxxx| 6080日韩午夜伦伦午夜伦| 欧美日韩激情一区二区| 亚洲精品乱码久久久久久高潮| 久久96国产精品久久99软件| 久久69视频| 国产男女乱淫视频高清免费| 精品国产一区二区三| 久久婷婷国产综合一区二区| 国产性猛交| 99久久精品免费看国产免费粉嫩 | 精品国产一区二区三区免费| 一区二区三区国产精品视频| 国产午夜亚洲精品| 精品国产乱码久久久久久久久| 亚洲精品日韩色噜噜久久五月| 在线视频国产一区二区| 国产精品国产三级国产aⅴ下载| 日韩精品中文字| 国产真实乱偷精品视频免| 精品久久久久久亚洲综合网| 欧美在线一级va免费观看| 男女视频一区二区三区| 国产999在线观看| 亚洲精品久久久久中文第一暮| 91久久香蕉| 蜜臀久久99精品久久久| 国产精品视频一二区| 亚洲精品久久久久久动漫| 一区不卡av| 一区二区三区四区视频在线| 午夜天堂在线| 精品日韩久久久| 欧洲在线一区| 日韩精品免费一区二区夜夜嗨| 视频二区狠狠色视频| 亚洲国产精品一区在线| 久久久久久中文字幕| 国产一区免费播放| 日本三级韩国三级国产三级| av午夜剧场| 四虎久久精品国产亚洲av| 91精品丝袜国产高跟在线| 国产在线视频二区| 国产一区观看| 亚洲精品日韩精品| 狠狠躁夜夜躁2020| 亚洲欧美另类综合| av中文字幕一区二区| 久久国产欧美日韩精品| 欧美乱妇高清无乱码免费| 国产欧美精品va在线观看| 欧美精品免费视频| 久久一区二区三区欧美| 日韩午夜一区| 国产精品一区在线观看| 国产一区在线视频播放| 国产一区二区91| 亚洲三区二区一区| 欧美高清xxxxx| 欧美精品日韩| 午夜黄色大片| 国产一二三区免费| 精品一区中文字幕| 久久精品国产亚| 三级视频一区| 97久久精品一区二区三区观看| 鲁丝一区二区三区免费| 国产伦精品一区二| 欧美日韩一级二级| 国产亚洲精品久久久久秋霞| 午夜精品影视| 国产一二区精品| 国产精品视频二区不卡| 久久精品国产亚洲7777| 日韩一级视频在线| 国产精品天堂| 国产精品二区在线| 国产精品国产一区二区三区四区| 高清国产一区二区 | 亚洲神马久久| 国产日韩欧美色图| 一区二区久久精品66国产精品| 国产日韩欧美在线一区| 国产乱码一区二区| 国产精品天堂网| 日本一区二区三区免费播放| 国产精品一区在线观看你懂的 | 午夜天堂电影| 91精品第一页| 狠狠色狠狠色很很综合很久久| 欧美高清性xxxxhd| 久久久久久久国产| 国产精品自拍在线| 日韩av在线导航| 亚洲精品国产久| 久久综合伊人77777麻豆| 国产欧美日韩va另类在线播放 | 精品国产亚洲一区二区三区| 精品国产乱码久久久久久久| 久久国产精彩视频| 国产一区www| 日本一区二区三区免费在线| 国产精品1234区| 91高清一区| 91一区二区在线观看| 91超薄丝袜肉丝一区二区| 狠狠色狠狠色综合日日五| 欧美精品免费看| 国产女人好紧好爽| 丰满岳妇伦4在线观看| 国产69久久久欧美一级| 欧美极品少妇xx高潮| 色噜噜狠狠色综合中文字幕| 久草精品一区| 羞羞免费视频网站| 日本高清一二区| 国产69精品久久777的优势| 99国产精品欧美久久久久的广告| 精品国产一区二区三区麻豆免费观看完整版 | 欧美在线视频一二三区| 国产超碰人人模人人爽人人添| 久免费看少妇高潮a级特黄按摩 | 香蕉久久国产| www.日本一区| 久久精品99国产国产| 亚洲国产精品入口| 国产一区免费播放| 国产一二区在线| 日韩无遮挡免费视频| 中文字幕理伦片免费看| 亚洲va国产2019| 自拍偷在线精品自拍偷写真图片| 国产一区二区伦理片| 国产欧美一区二区在线| 日韩精品午夜视频| 亚洲美女在线一区| 久久天天躁狠狠躁亚洲综合公司| 久久久久国产亚洲| 久久久精品免费看| 91久久久久久亚洲精品禁果| 8x8x国产一区二区三区精品推荐 | 亚洲自偷精品视频自拍| 狠狠色噜噜狠狠狠四色米奇| 九九精品久久| 99久久精品国| 一区二区午夜| 国产午夜精品一区二区三区视频| 国产伦精品一区二区三区照片91| 国产性猛交| 欧洲国产一区| 亚洲欧洲精品一区二区三区不卡| 亚洲精品日本无v一区| 97午夜视频| 国产综合亚洲精品| 91免费国产视频| 91热国产| 毛片大全免费看| 国产麻豆91视频| 国产丝袜一区二区三区免费视频 | 国产精品久久久视频| 午夜肉伦伦影院九七影网| 国产毛片精品一区二区| 在线观看国产91| freexxxxxxx| 一区二区三区国产精品| 一级女性全黄久久生活片免费 | 日韩精品一区二区三区免费观看视频| 国产88av| 亚洲精品久久久久不卡激情文学| 欧美系列一区二区| 欧美精品在线不卡| 国产91综合一区在线观看| 国产精品美女一区二区视频| 亚洲区日韩| 国产超碰人人模人人爽人人添| 国产欧美日韩精品在线| 久久不卡精品| 国产一区影院| 国产人成看黄久久久久久久久| 亚洲精品国产一区二| 中文字幕av一区二区三区四区| 国产精品电影一区二区三区| 丝袜诱惑一区二区三区| 欧洲亚洲国产一区二区三区| 欧美日韩偷拍一区| 国产乱了高清露脸对白| 69久久夜色精品国产69–| 午夜影院试看五分钟| 国产精品久久久久久久综合| 在线观看黄色91| 国产伦精品一区二区三区免| 中文字幕一区二区在线播放| 国产一区二区三区久久久| 午夜影院毛片| 欧美亚洲视频一区二区| 亚洲欧美一卡| 中文字幕一区二区三区免费视频| 91视频国产一区| 最新国产精品久久精品| 99久久精品一区二区| 国产免费一区二区三区四区 | 色妞www精品视频| 日韩欧美国产第一页| 久免费看少妇高潮a级特黄按摩| 狠狠躁日日躁狂躁夜夜躁av| 老女人伦理hd| 中文字幕在线一二三区| 日韩一区二区中文字幕| 国产精品乱综合在线| 精品国精品国产自在久不卡| 91精品国模一区二区三区| 国产日本欧美一区二区三区| 国产一二区在线| 亚洲欧洲日本在线观看| 91精品久久久久久综合五月天 |