日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于狀態(tài)分布感知采樣的智能體深度價值函數(shù)學(xué)習(xí)方法有效

專利信息
申請?zhí)枺?/td> 201810459347.0 申請日: 2018-05-15
公開(公告)號: CN108647789B 公開(公告)日: 2022-04-19
發(fā)明(設(shè)計)人: 李璽;李偉超;皇福獻 申請(專利權(quán))人: 浙江大學(xué)
主分類號: G06N20/00 分類號: G06N20/00;G06K9/62
代理公司: 杭州求是專利事務(wù)所有限公司 33200 代理人: 傅朝棟;張法高
地址: 310058 浙江*** 國省代碼: 浙江;33
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 狀態(tài) 分布 感知 采樣 智能 深度 價值 函數(shù) 學(xué)習(xí)方法
【權(quán)利要求書】:

1.一種基于狀態(tài)分布感知采樣的智能體深度價值函數(shù)學(xué)習(xí)方法,其特征在于包括以下步驟:

S1、獲取用于智能體學(xué)習(xí)價值函數(shù)的經(jīng)驗數(shù)據(jù),并定義算法目標(biāo);

S2、使用卷積神經(jīng)網(wǎng)絡(luò)對經(jīng)驗數(shù)據(jù)進行預(yù)處理,增強經(jīng)驗數(shù)據(jù)集的表達能力;

S3、在經(jīng)驗數(shù)據(jù)集的特征空間中使用無監(jiān)督方法對經(jīng)驗數(shù)據(jù)集進行聚類;

S4、根據(jù)經(jīng)驗數(shù)據(jù)集的狀態(tài)分布,采用基于均勻采樣和簇等概率采樣插值的樣本狀態(tài)分布感知采樣方法進行樣本采樣;

S5、智能體使用采樣得到的樣本數(shù)據(jù)進行價值函數(shù)的學(xué)習(xí);

步驟S1中所述的用于智能體學(xué)習(xí)價值函數(shù)的經(jīng)驗數(shù)據(jù)為四元組{s,a,r,s′},其中s表示智能體的狀態(tài),a表示智能體采取的動作,r表示智能體獲得的獎勵,s′表示智能體的下一狀態(tài);所述的算法目標(biāo)為最大化智能體的累計獎勵,累計獎勵計算如下:其中γ是折現(xiàn)系數(shù),且γ∈(0,1),t是智能體和環(huán)境的交互次數(shù),rt為智能體在t次交互獲得的獎勵;

步驟S2中所述的預(yù)處理具體為:使用卷積神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)進行處理以獲得表達性更強的狀態(tài)特征,具體計算如下:

其中fcnn()為卷積神經(jīng)網(wǎng)絡(luò),θcnn為卷積參數(shù),為提取到的si的深層卷積特征,si為經(jīng)驗數(shù)據(jù)集中第i個樣本的原始狀態(tài)特征;i=1,2,...,n,n為經(jīng)驗數(shù)據(jù)集中的樣本總數(shù);

所述步驟S3包括以下子步驟:

S31、使用靜態(tài)哈希的方法SimHash將高維的數(shù)據(jù)轉(zhuǎn)換為哈希碼進行分析聚類,即:

其中為的哈希碼;A是一個k×D的轉(zhuǎn)換矩陣,其元素從一個標(biāo)準(zhǔn)高斯分布N(0,1)中隨機采樣得到,k是哈希碼的長度,D是的維度;

S32、對n個哈希碼按照漢明距離進行不同類別的分類統(tǒng)計,得到m個不同的簇,第j個簇包含的樣本數(shù)量為numj,并且

步驟S4中樣本采樣方法具體為:在S3聚類分析得到的樣本狀態(tài)空間分布的基礎(chǔ)上,采用基于均勻采樣和簇等概率采樣插值的樣本狀態(tài)分布感知采樣方法進行樣本采樣,該采樣方法中采樣第i個樣本的概率為:

其中β是用來平衡均勻采樣和簇等概率采樣之間的超參數(shù),β∈(0,1);numi表示第i個樣本所在的簇包含的樣本數(shù)量;

得到每個樣本的概率后,根據(jù)不同樣本的概率從經(jīng)驗數(shù)據(jù)集中采集樣本;

步驟S5具體為:使用S4所述采樣方法從經(jīng)驗數(shù)據(jù)集中獲取樣本后,將其用于智能體學(xué)習(xí)價值函數(shù),根據(jù)如下方程迭代地更新價值函數(shù):

其中Q(s,a)為價值函數(shù),Q(s′,a′)下一時刻的價值函數(shù),α為學(xué)習(xí)率。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201810459347.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美日韩亚洲国产一区| 国产v亚洲v日韩v欧美v片| 国产经典一区二区| 三级电影中文| 久久中文一区| 国产精品久久久久精| 久久九九国产精品| 激情久久久| 国产精彩视频一区二区| 搡少妇在线视频中文字幕| 亚洲国产精品日韩av不卡在线| freexxxxxxx| 日本一区欧美| 国产精品9区| 欧美日韩精品在线播放| 国产品久久久久久噜噜噜狼狼| av午夜在线观看| 亚洲一卡二卡在线| 久久久一二区| 日本一区二区三区免费视频| 国产88在线观看入口| 鲁一鲁一鲁一鲁一鲁一av| 国产免费第一区| 国产69精品99久久久久久宅男| 欧美日韩激情在线| 日本一区二区三区在线看| 亚洲一区中文字幕| 欧美日本91精品久久久久| 久久久精品观看| 欧美日韩精品影院| 97人人揉人人捏人人添| 国产真裸无庶纶乱视频| а√天堂8资源中文在线| 国产欧美亚洲一区二区| 激情久久一区二区| 国产精品欧美久久| 欧美二区在线视频| 国模吧一区二区| 欧美一区二区三区黄| 欧美日韩一区免费| 欧美性猛交xxxxxⅹxx88| 久久精品综合| 国产在线播放一区二区| 免费看欧美中韩毛片影院| 色婷婷综合久久久久中文| 欧美一区二区三区在线视频观看| 亚洲午夜精品一区二区三区电影院 | 窝窝午夜精品一区二区| 国产一区二三| **毛片在线免费观看| 久久密av| 午夜av电影网| 91麻豆精品国产综合久久久久久| 日韩久久精品一区二区三区| 亚洲国产欧美一区| 狠狠色噜噜狠狠狠狠米奇777| 亚洲欧洲日韩av| 黄色av免费| 国产伦精品一区二区三区电影| 国产欧美日韩一级| 国产精品一区在线播放| 色天天综合久久久久综合片| 亚洲精品日本久久一区二区三区 | 欧美色图视频一区| 亚洲久色影视| 99国产精品一区| 亚洲va国产| 99久久精品国| 国产全肉乱妇杂乱视频在线观看 | 香蕉av一区| 午夜电影一区二区三区| 亚洲国产欧美一区二区丝袜黑人| 91理论片午午伦夜理片久久| 欧美一区二区三区艳史| 99精品一区| 国产香蕉97碰碰久久人人| 国产一区日韩一区| 亚洲精品主播| 艳妇荡乳欲伦2| 国产精品久久亚洲7777| 狠狠插狠狠爱| 国产农村妇女精品一区二区 | 欧美一级久久久| 2021天天干夜夜爽| 日韩欧美多p乱免费视频| 国产69精品福利视频| 午夜精品影视| 日本精品一区二区三区视频| 国产女人和拘做受视频免费| 99久久夜色精品国产网站| 人人玩人人添人人澡97| 国产在线精品一区| 亚洲一卡二卡在线| 91麻豆精品国产综合久久久久久| 狠狠色综合欧美激情| free×性护士vidos欧美| 日本高清二区| 偷拍久久精品视频| 高清国产一区二区 | 日日噜噜夜夜狠狠| 亚洲免费精品一区二区| 午夜精品一区二区三区在线播放| 午夜国产一区二区| 国产精品久久人人做人人爽| 国产精品久久久av久久久| 91高跟紫色丝袜呻吟在线观看| 午夜看片在线| 日韩精品中文字幕一区二区| 91婷婷精品国产综合久久| 高清欧美精品xxxxx| 久久亚洲精品国产一区最新章节| 99精品一区二区| 99国产精品9| 97久久超碰国产精品红杏| 中文字幕a一二三在线| 国产精品96久久久久久久| 国产999在线观看| 久久人人爽爽| 日韩美一区二区三区| 欧美一区二区三区白人| 午夜亚洲影院| 欧美高清一二三区| 午夜激情免费电影| 激情久久一区二区| 色婷婷精品久久二区二区我来| 国产精品18久久久久白浆| 欧美精品日韩一区| 日韩av在线影视| 久久精品国语| 亚洲少妇中文字幕| 亚洲一区二区国产精品| 日本一区二区免费电影| www.午夜av| 狠狠色狠狠色88综合日日91| 综合久久色| 狠狠色噜噜狠狠狠狠| 欧美国产一区二区在线| 国产一区欧美一区| 91夜夜夜| 亚洲一区二区三区加勒比| 国产一区二区视频免费在线观看 | 91精品国产九九九久久久亚洲| 亚洲精品日韩在线| xxxxhd欧美| 国产日本欧美一区二区三区| 国产在线一区不卡| 亚洲欧美一区二区三区不卡| 美日韩一区| 精品国产91久久久| 女人被爽到高潮呻吟免费看| 日韩区欧美久久久无人区| 国产亚洲精品久久久久动| 国产97在线播放| 久久精品国产亚洲一区二区| 午夜码电影| 国产精品99一区二区三区| 午夜看片网站| 四虎国产精品永久在线| 久久99精品国产麻豆婷婷| 亚洲欧美国产中文字幕| 狠狠色噜噜狠狠狠合久| 亚洲国产偷| 国产精品久久亚洲7777| 狠狠色噜噜狠狠狠色综合| 在线精品国产一区二区三区88| 性色av色香蕉一区二区| 国产午夜精品一区| 国产麻豆精品久久| 国产一级片子| 夜色av网| 国产欧美日韩一级| 欧美日韩一卡二卡| 一级女性全黄久久生活片免费| 91看片app| 国产91九色在线播放| 国产aⅴ一区二区| 日本丰满岳妇伦3在线观看| 91精品黄色| 国产欧美一区二区三区免费| 国产精品欧美日韩在线| 少妇厨房与子伦在线观看| 国产三级在线视频一区二区三区| 国内自拍偷拍一区| 国产精品美女久久久免费| 久久综合二区| 亚洲精品国产91| 久久国产麻豆| 免费午夜片| 大伊人av| 午夜欧美影院| xxxx在线视频| 91制服诱惑| 国产一区激情| 精品欧美一区二区在线观看| 日本高清h色视频在线观看| 欧美日韩国产影院| 91精品视频在线观看免费| 国产一区二区电影| 午夜免费网址| 国产精品人人爽人人做av片| 国产精品免费一区二区区| 国产精品亚州| 国产欧美视频一区二区| 欧美乱战大交xxxxx| 亚洲午夜精品一区二区三区| 电影91久久久| 国产精品视频一二区| 国产性生交xxxxx免费| 日本精品视频一区二区三区| 国产精品一区二区中文字幕| 欧美一区二区三区久久| 欧美日韩一区电影| 国产一级不卡视频| 91高清一区| 亚洲精品一区在线| www.午夜av| 99爱国产精品| 国产在线欧美在线| 日韩精品免费一区二区三区| 91狠狠操| 亚洲精品久久久久中文字幕欢迎你| 国产一区二区电影| 99re国产精品视频| 国偷自产中文字幕亚洲手机在线 | 久久精品国产99| 狠狠躁天天躁又黄又爽| 日本午夜一区二区| 欧美日韩一区不卡| 午夜欧美影院| 国产床戏无遮挡免费观看网站 | 婷婷午夜影院| 国产午夜亚洲精品午夜鲁丝片| 又黄又爽又刺激久久久久亚洲精品 | 狠狠色噜噜狠狠狠狠| 日韩国产欧美中文字幕| 亚洲欧美一区二| 色婷婷久久一区二区三区麻豆 | 99re6国产露脸精品视频网站| 亚洲精品一区在线| 国产一区二区伦理| 99国精视频一区一区一三| 国产精品奇米一区二区三区小说| 国产一区二区在线精品| 69久久夜色精品国产69–| av中文字幕一区二区| 国偷自产一区二区三区在线观看|