日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于狀態(tài)分布感知采樣的智能體深度價(jià)值函數(shù)學(xué)習(xí)方法有效

專利信息
申請(qǐng)?zhí)枺?/td> 201810459347.0 申請(qǐng)日: 2018-05-15
公開(公告)號(hào): CN108647789B 公開(公告)日: 2022-04-19
發(fā)明(設(shè)計(jì))人: 李璽;李偉超;皇福獻(xiàn) 申請(qǐng)(專利權(quán))人: 浙江大學(xué)
主分類號(hào): G06N20/00 分類號(hào): G06N20/00;G06K9/62
代理公司: 杭州求是專利事務(wù)所有限公司 33200 代理人: 傅朝棟;張法高
地址: 310058 浙江*** 國省代碼: 浙江;33
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 狀態(tài) 分布 感知 采樣 智能 深度 價(jià)值 函數(shù) 學(xué)習(xí)方法
【說明書】:

發(fā)明公開了一種基于狀態(tài)分布感知采樣的智能體深度價(jià)值函數(shù)學(xué)習(xí)方法,用于智能體在較少的樣本下較快地學(xué)習(xí)價(jià)值函數(shù)。具體包括如下步驟:1)獲取用于智能體學(xué)習(xí)價(jià)值函數(shù)的經(jīng)驗(yàn)數(shù)據(jù),并定義算法目標(biāo);2)使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)經(jīng)驗(yàn)數(shù)據(jù)進(jìn)行預(yù)處理,得到表達(dá)能力更強(qiáng)的特征集;3)在經(jīng)驗(yàn)數(shù)據(jù)集的特征空間中使用無監(jiān)督方法對(duì)經(jīng)驗(yàn)數(shù)據(jù)集進(jìn)行聚類;4)根據(jù)經(jīng)驗(yàn)數(shù)據(jù)集的狀態(tài)分布,采用基于均勻采樣和簇等概率采樣插值的樣本狀態(tài)分布感知采樣方法進(jìn)行采樣;5)智能體使用采樣得到的樣本進(jìn)行價(jià)值函數(shù)的學(xué)習(xí)。本發(fā)明適用于增強(qiáng)學(xué)習(xí)領(lǐng)域的游戲博弈問題,能夠在較少的樣本量的情況下較快地取得較好的效果。

技術(shù)領(lǐng)域

本發(fā)明屬于增強(qiáng)學(xué)習(xí)領(lǐng)域,是機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)分支,特別地涉及一種基于經(jīng)驗(yàn)數(shù)據(jù)狀態(tài)分布感知的樣本采樣的方法。

背景技術(shù)

樣本選擇是機(jī)器學(xué)習(xí)領(lǐng)域一個(gè)重要問題,選擇方式的不同直接影響到模型學(xué)習(xí)的質(zhì)量。在增強(qiáng)學(xué)習(xí)領(lǐng)域,從經(jīng)驗(yàn)數(shù)據(jù)集中進(jìn)行樣本采樣能夠幫助克服樣本相關(guān)性和遺忘早期樣本的問題。樣本采樣的目標(biāo)是要從樣本集中選出能夠加快模型收斂,并增強(qiáng)智能體對(duì)環(huán)境感知能力的樣本。傳統(tǒng)方法一般是采用隨機(jī)均勻采樣的方式從經(jīng)驗(yàn)數(shù)據(jù)集中采樣,這種方式容易造成樣本不平衡問題,使得智能體學(xué)習(xí)速度較慢。

現(xiàn)有的基于對(duì)樣本屬性感知的采樣方法主要根據(jù)某種度量方式,比如時(shí)間差分誤差,來對(duì)不同的樣本設(shè)定不同的采樣優(yōu)先級(jí)。而這種方式并沒有從根本上解決兩個(gè)問題:1.不同狀態(tài)的樣本重要程度接近,但是產(chǎn)生的數(shù)量卻相差較大,根據(jù)什么標(biāo)準(zhǔn)來從經(jīng)驗(yàn)數(shù)據(jù)集中采樣可以避免對(duì)冗余的樣本進(jìn)行過度采樣;2.由于樣本本身維度非常高、數(shù)目巨大且不斷產(chǎn)生,因此有效地對(duì)大量高維樣本進(jìn)行分析是一個(gè)關(guān)鍵因素,如何才能高效地從不斷產(chǎn)生的大量的樣本集中采樣。

發(fā)明內(nèi)容

為解決上述問題,本發(fā)明的目的在于提供一種基于狀態(tài)分布感知采樣的智能體深度價(jià)值函數(shù)學(xué)習(xí)方法。該方法基于深度神經(jīng)網(wǎng)絡(luò)對(duì)智能體所處環(huán)境有效的特征表達(dá),利用哈希的方法對(duì)樣本集的特征進(jìn)行高效地聚類分析,即對(duì)狀態(tài)空間的感知,并采用基于狀態(tài)感知的采樣方式,能夠更好地選擇經(jīng)驗(yàn)數(shù)據(jù)集中的樣本,提高智能體的學(xué)習(xí)速率和質(zhì)量。

為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案為:

一種基于狀態(tài)分布感知采樣的智能體深度價(jià)值函數(shù)學(xué)習(xí)方法,包括以下步驟:

S1、獲取用于智能體學(xué)習(xí)價(jià)值函數(shù)的經(jīng)驗(yàn)數(shù)據(jù),并定義算法目標(biāo);

S2、使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)經(jīng)驗(yàn)數(shù)據(jù)進(jìn)行預(yù)處理,增強(qiáng)經(jīng)驗(yàn)數(shù)據(jù)集的表達(dá)能力;

S3、在經(jīng)驗(yàn)數(shù)據(jù)集的特征空間中使用無監(jiān)督方法對(duì)經(jīng)驗(yàn)數(shù)據(jù)集進(jìn)行聚類;

S4、根據(jù)經(jīng)驗(yàn)數(shù)據(jù)集的狀態(tài)分布,采用基于均勻采樣和簇等概率采樣插值的樣本狀態(tài)分布感知采樣方法進(jìn)行樣本采樣;

S5、智能體使用采樣得到的樣本數(shù)據(jù)進(jìn)行價(jià)值函數(shù)的學(xué)習(xí)。

上述方案中,各步驟可采用如下優(yōu)選方式具體實(shí)現(xiàn)。

作為優(yōu)選,步驟S1中所述的用于智能體學(xué)習(xí)價(jià)值函數(shù)的經(jīng)驗(yàn)數(shù)據(jù)為四元組{s,a,r,s′},其中s表示智能體的狀態(tài),a表示智能體采取的動(dòng)作,r表示智能體獲得的獎(jiǎng)勵(lì),s′表示智能體的下一狀態(tài);所述的算法目標(biāo)為最大化智能體的累計(jì)獎(jiǎng)勵(lì),累計(jì)獎(jiǎng)勵(lì)計(jì)算如下:其中γ是折現(xiàn)系數(shù),且γ∈(0,1),t是智能體和環(huán)境的交互次數(shù),rt為智能體在t次交互獲得的獎(jiǎng)勵(lì)。

作為優(yōu)選,步驟S2中所述的預(yù)處理具體為:使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行處理以獲得表達(dá)性更強(qiáng)的狀態(tài)特征,具體計(jì)算如下:

其中fcnn()為卷積神經(jīng)網(wǎng)絡(luò),θcnn為卷積參數(shù),為提取到的si的深層卷積特征,si為經(jīng)驗(yàn)數(shù)據(jù)集中第i個(gè)樣本的原始狀態(tài)特征;i=1,2,…,n,n為經(jīng)驗(yàn)數(shù)據(jù)集中的樣本總數(shù)。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201810459347.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖技術(shù)構(gòu)造圖;

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 国产69精品久久久久9999不卡免费| 精品久久久久99| av午夜电影| 野花社区不卡一卡二| 久久国产欧美一区二区三区精品| 一区二区不卡在线| 欧美日韩国产免费观看| freexxxx性| 日韩中文字幕一区二区在线视频 | 国产v亚洲v日韩v欧美v片| 国产精品乱综合在线| 99久久国产综合精品麻豆| 久久99精品国产麻豆婷婷| 91狠狠操| 国产99久久九九精品| 国产精品国产亚洲精品看不卡15 | 99精品国产免费久久| 欧美69精品久久久久久不卡| 色一情一乱一乱一区99av白浆| 97人人澡人人爽人人模亚洲| 国产精品欧美一区乱破 | 国产精品一区二区在线观看| 亚洲欧美国产日韩色伦| 色综合久久精品| 人人要人人澡人人爽人人dvd| 日韩av在线播放网址| 亚洲精品suv精品一区二区| 中文乱码在线视频| 国产另类一区| 亚洲欧美中日精品高清一区二区| 日韩亚洲精品视频| 日韩欧美中文字幕精品| 国产精品免费专区| 日韩精品久久久久久久的张开腿让 | 狠狠色丁香久久综合频道日韩| 中文字幕一区2区3区| 国产不卡网站| 国产三级在线视频一区二区三区| 欧美精品日韩一区| 日本三级不卡视频| 久久国产精品久久久久久电车| 欧美中文字幕一区二区| 91国偷自产一区二区介绍| 国产精品免费观看国产网曝瓜| 国产全肉乱妇杂乱视频在线观看| 国产精品一级在线| 国产精品日韩电影| **毛片免费| 国产一区二区视频播放| 日本道欧美一区二区aaaa| 中文字幕一二三四五区| 精品久久久久久久免费看女人毛片| 欧美日韩一区二区三区69堂| 视频二区狠狠色视频| 亚洲欧美自拍一区| 国产在线精品一区二区| 香蕉视频一区二区三区| 亚洲影院久久| 欧美一区二区三区视频在线观看| 夜色av网站| 高清国产一区二区| 国产欧美日韩精品一区二区图片 | 538国产精品一区二区在线| 国产精品麻豆自拍| 91精品黄色| 国产午夜精品av一区二区麻豆| 国产视频精品久久| 在线观看v国产乱人精品一区二区| 99久久免费毛片基地| 午夜影院h| 久99久视频| 日本aⅴ精品一区二区三区日| **毛片在线| 国产精品偷乱一区二区三区| 久久婷婷国产香蕉| 日本一区二区三区中文字幕 | 99国产精品永久免费视频 | 精品国产乱码久久久久久虫虫| 日韩欧美高清一区| 91福利视频导航| 欧美乱码精品一区二区三| 亚洲精欧美一区二区精品| 亚洲精品一品区二品区三品区 | 亚洲精品久久久久玩吗| 欧美日韩一区二区三区四区五区 | 91精彩刺激对白露脸偷拍| 国产一区欧美一区| 97涩国一产精品久久久久久久| 中文字幕一区一区三区| 97精品久久人人爽人人爽| 艳妇荡乳欲伦2| 国产一区免费在线| 国产精品国产三级国产专区52| 日韩精品一区在线观看| 亚洲国产一区二| 激情久久综合| 国产午夜精品一区二区理论影院| 国产乱对白刺激视频在线观看| 欧美乱战大交xxxxx| 国产精品亚州| 久久精品一二三四| 色噜噜狠狠狠狠色综合久| 91精品色| 日韩欧美一区二区久久婷婷| 91视频一区二区三区| 免费看性生活片| 欧美日韩综合一区| 狠狠色噜噜狠狠狠狠777| 国产高清在线一区| 国产精品1234区| 国产日韩欧美另类| 日韩国产精品久久| 欧美日韩精品影院| 亚洲精品一区二区三区98年| 久久久久久亚洲精品| 亚洲国产一二区| 国产一区二区伦理| 九九热国产精品视频| 国产真实一区二区三区| 午夜国产一区二区| 欧美一区二区三区四区夜夜大片 | 国产精品999久久久| 麻豆精品国产入口| 国产欧美日韩中文字幕| 久久99中文字幕| 久久久久久综合网| 日韩精品中文字幕久久臀| 国产美女视频一区二区三区| 中文乱幕日产无线码1区| 国产男女乱淫视频高清免费| 欧美精品第1页| 国产亚洲久久| 久久乐国产精品| 999久久国精品免费观看网站| 97欧美精品| 91精品国产综合久久婷婷香| 色一情一乱一乱一区99av白浆| 999国产精品999久久久久久| 亚洲欧美日韩综合在线| 国产女人与拘做受免费视频| 亚洲国产精品网站| 一本久久精品一区二区| 欧美国产三区| 国产欧美视频一区二区| 色噜噜狠狠狠狠色综合久| 日本精品一区二区三区在线观看视频 | 国产精品久久亚洲7777| 国产日韩欧美精品一区二区| 国产精品剧情一区二区三区| 国产乱码一区二区| 欧美一区二区三区视频在线观看| 亚洲精品国产setv| 色天天综合久久久久综合片| 麻豆国产一区二区三区| 日本一二三四区视频| 国产精品久久久久久久新郎| 国内精品久久久久久久星辰影视 | 欧美一区二区三区爽大粗免费| 欧美日韩综合一区二区| 欧美亚洲精品一区二区三区| 91久久国产视频| 午夜影院啪啪| 处破大全欧美破苞二十三| 国产一级在线免费观看| 国产一级大片| 99久久国产综合| 亚州精品国产| 日本少妇一区二区三区| 福利片91| 国产欧美亚洲精品第一区软件| 亚洲网站久久| 亚洲四区在线观看| 日本精品一区视频| 亚洲欧美日韩在线看| 国产精品精品视频一区二区三区| 一区二区在线国产| 精品国产一二三四区| 国产欧美亚洲精品第一区软件| 99久久国产综合精品尤物酒店| 国产有码aaaae毛片视频| 天堂av色婷婷一区二区三区| 国产一区第一页| 91香蕉一区二区三区在线观看| 国产麻豆一区二区| 国产1区2区3区| 国产午夜精品一区二区三区在线观看 | 中文字幕精品一区二区三区在线| 国产欧美二区| 91精品国产九九九久久久亚洲| 欧美色图视频一区| 国产欧美一区二区三区四区| 国产69精品久久久久9999不卡免费 | 日韩精品中文字幕一区| 综合久久国产九一剧情麻豆| 亚洲欧美国产中文字幕| 色噜噜狠狠狠狠色综合久| 狠狠躁夜夜躁xxxxaaaa| 久久aⅴ国产欧美74aaa| 亚洲影院久久| 搡少妇在线视频中文字幕| 久久久久亚洲国产精品| 欧美在线视频一区二区三区| 欧美亚洲国产日韩| 国产精品刺激对白麻豆99| 丰满岳妇伦4在线观看| 国产日韩欧美视频| 国产高清一区在线观看| 亚洲欧美另类久久久精品2019| 久久久久国产亚洲| 日韩毛片一区| 欧美精品国产精品| 国产日韩欧美在线影视| 久久69视频| 久久国产精品免费视频| 欧美精品xxxxx| 国产精品视频一区二区三| 日韩精品一区二区中文字幕| 国产二区视频在线播放| 国产理论一区| 国产欧美视频一区二区| 欧美在线视频精品| 亚洲精品少妇一区二区| 日韩精品中文字幕一区二区三区| 欧美黄色一二三区| 日韩精品中文字幕在线播放| 91精品国产综合久久婷婷香| 国产伦理精品一区二区三区观看体验| 中文字幕一区二区三区乱码视频| 午夜理伦影院| 99久久精品免费看国产免费粉嫩| 免费毛片a| 日韩欧美一区二区久久婷婷| 欧美极品少妇xxxxⅹ| 欧美亚洲精品一区二区三区| 91麻豆精品国产自产欧美一级在线观看| 午夜激情电影在线播放| 国产一区二区在线91| 国产欧美一区二区三区不卡高清| 精品美女一区二区三区| 欧美国产一二三区| 国产欧美一区二区精品久久久| 国产精品亚洲二区| 亚洲精品久久在线| 97精品国产aⅴ7777| 久久不卡精品| 69xx国产|