日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種強(qiáng)化學(xué)習(xí)的目標(biāo)規(guī)劃方法有效

專利信息
申請(qǐng)?zhí)枺?/td> 202011192071.8 申請(qǐng)日: 2020-10-30
公開(公告)號(hào): CN112257872B 公開(公告)日: 2022-09-13
發(fā)明(設(shè)計(jì))人: 周世海 申請(qǐng)(專利權(quán))人: 周世海
主分類號(hào): G06N20/00 分類號(hào): G06N20/00
代理公司: 暫無信息 代理人: 暫無信息
地址: 315722 浙江*** 國(guó)省代碼: 浙江;33
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 強(qiáng)化 學(xué)習(xí) 目標(biāo) 規(guī)劃 方法
【說明書】:

發(fā)明通過將強(qiáng)化學(xué)習(xí)中的動(dòng)作,通過詞向量嵌入的方式,轉(zhuǎn)化為具有內(nèi)在聯(lián)系的向量表示,以此作為預(yù)測(cè)器,并結(jié)合給定目標(biāo)的環(huán)境特征,計(jì)算其到達(dá)目標(biāo)狀態(tài)的規(guī)劃路徑,從而將稀疏環(huán)境獎(jiǎng)勵(lì)轉(zhuǎn)化為密集獎(jiǎng)勵(lì)的形式。同時(shí),通過采用規(guī)劃器和執(zhí)行器對(duì)抗訓(xùn)練的方式,一定程度上解決了局部最優(yōu)問題。

技術(shù)領(lǐng)域

本發(fā)明涉及人工智能技術(shù)領(lǐng)域,尤其是涉及一種強(qiáng)化學(xué)習(xí)的目標(biāo)規(guī)劃方法。

背景技術(shù)

在強(qiáng)化學(xué)習(xí)中,涉及一個(gè)局部最優(yōu)問題,即當(dāng)狀態(tài)空間過大時(shí),智能體容易停留在當(dāng)前探索到的策略中價(jià)值最高的一種策略,但該策略并不是最優(yōu)策略,使得智能體無法很好的完成指定任務(wù)。

另外,在強(qiáng)化學(xué)習(xí)中還存在稀疏獎(jiǎng)勵(lì)問題,即在智能體執(zhí)行任務(wù)探索環(huán)境時(shí),給定的獎(jiǎng)勵(lì)很稀少,如只在達(dá)到最終目標(biāo)時(shí)才給定獎(jiǎng)勵(lì),在未達(dá)到目標(biāo)時(shí)沒有任何獎(jiǎng)勵(lì)。這容易導(dǎo)致智能體在初始訓(xùn)練時(shí)難以掌握給定的任務(wù)目標(biāo),同時(shí)也進(jìn)一步加大了局部最優(yōu)問題帶來的干擾。

發(fā)明內(nèi)容

本發(fā)明所要解決的技術(shù)問題是提供一種能一定程度上克服局部最優(yōu)問題、能夠?qū)⑾∈瑾?jiǎng)勵(lì)轉(zhuǎn)在智能體內(nèi)部轉(zhuǎn)換為密集獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí)的目標(biāo)規(guī)劃方法。

本發(fā)明所采用的技術(shù)方案是,一種強(qiáng)化學(xué)習(xí)的目標(biāo)規(guī)劃方法,包括:

S1、收集若干個(gè)已收斂的具有相同動(dòng)作空間的智能體,根據(jù)其動(dòng)作序列,計(jì)算其執(zhí)行任務(wù)時(shí),得到的動(dòng)作序列中每個(gè)動(dòng)作的向量表示,整合為一個(gè)動(dòng)作-向量對(duì)應(yīng)的動(dòng)作向量字典,然后在目標(biāo)訓(xùn)練環(huán)境中放入要訓(xùn)練的具有相同動(dòng)作空間的執(zhí)行器;

S2、通過特征提取器,提取與動(dòng)作相關(guān)的環(huán)境特征向量,作為執(zhí)行器的外部輸入;

S3、將當(dāng)前周期,S2中提取的環(huán)境特征向量以及執(zhí)行器輸出執(zhí)行的動(dòng)作的向量表示合并為一個(gè)向量,作為下一周期環(huán)境特征預(yù)測(cè)器的輸入,通過環(huán)境特征預(yù)測(cè)器計(jì)算得到下一周期的環(huán)境特征向量;

S4、給定一個(gè)任務(wù)最終狀態(tài)目標(biāo)環(huán)境,通過特征提取器得到目標(biāo)環(huán)境特征向量;

S5、根據(jù)當(dāng)前環(huán)境特征向量以及目標(biāo)環(huán)境特征向量之間的距離,以縮短距離以及減少迭代次數(shù)為目標(biāo),迭代計(jì)算得到一組迭代得到的環(huán)境特征向量與動(dòng)作一一對(duì)應(yīng)的規(guī)劃序列;

S6、將規(guī)劃序列作為訓(xùn)練集,對(duì)執(zhí)行器進(jìn)行規(guī)劃訓(xùn)練。

本發(fā)明的有益效果是:

(1)將動(dòng)作序列中的每一個(gè)動(dòng)作表示為向量的形式,這將為每個(gè)動(dòng)作都賦予其基礎(chǔ)內(nèi)涵,并且動(dòng)作與動(dòng)作之間也賦予了相似關(guān)系,每一個(gè)動(dòng)作不再是獨(dú)立存在,智能體在進(jìn)行目標(biāo)規(guī)劃時(shí)可以直接獲取動(dòng)作之間的聯(lián)系,而不是重新通過大量探索來認(rèn)知?jiǎng)幼髦g的聯(lián)系,這有利于多個(gè)智能體多目標(biāo)的學(xué)習(xí),并且動(dòng)作向量的獲取只需要在實(shí)現(xiàn)簡(jiǎn)單基礎(chǔ)任務(wù)下的動(dòng)作序列獲得,不需要考慮復(fù)雜的狀態(tài)空間中的最優(yōu)策略問題,在相同動(dòng)作空間背景下,可以一直沿用。

(2)利用特征提取器提取與動(dòng)作相關(guān)的環(huán)境特征,這將使得輸入的環(huán)境與動(dòng)作之間也存在聯(lián)系,動(dòng)作的向量中每一個(gè)元素的位置,都能視為對(duì)環(huán)境的某一特征的影響因素。在這個(gè)基礎(chǔ)上,使用環(huán)境特征預(yù)測(cè)器擬合動(dòng)作向量與環(huán)境特征向量之間的關(guān)系,使得環(huán)境特征預(yù)測(cè)器內(nèi)部能夠?qū)W習(xí)到動(dòng)作向量中,每一個(gè)元素對(duì)環(huán)境特征的貢獻(xiàn),能夠更精準(zhǔn)的實(shí)現(xiàn)對(duì)下一周期環(huán)境特征的預(yù)測(cè),若直接使用原有的動(dòng)作指令作為輸入,則預(yù)測(cè)器還需要進(jìn)一步分解動(dòng)作指令,預(yù)測(cè)器無法很好的學(xué)習(xí)到動(dòng)作和環(huán)境之間的影響關(guān)系。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于周世海,未經(jīng)周世海許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011192071.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 国产欧美综合一区| 欧美精品乱码视频一二专区| 狠狠色噜噜狠狠狠狠| 搡少妇在线视频中文字幕| 欧美精品日韩| 日本午夜久久| 日韩亚洲精品在线观看| 99国产精品永久免费视频| 国产88av| 亚洲国产精品一区在线| 国产精品日本一区二区不卡视频| 欧美日韩偷拍一区| 日韩国产精品一区二区| 欧美一区二区三区不卡视频| 99爱精品视频| 91区国产| 国产欧美一区二区精品性| 亚洲欧美一区二区三区不卡| 色噜噜狠狠色综合中文字幕| 久久国产精品二区| 年轻bbwbbw高潮| 午夜av片| 99精品一级欧美片免费播放| 国产欧美日韩精品一区二区三区| 国产精品一级片在线观看| 国产真实一区二区三区| 国产经典一区二区| 999久久久国产精品| 99re久久精品国产| 99精品在免费线偷拍| 色综合欧美亚洲国产| 欧美精品一区免费| 精品国产九九九| 国产盗摄91精品一区二区三区| 国产区精品区| 亚洲国产精品麻豆| 精品国产一区二区三区免费| 日韩精品久久久久久久电影99爱| 久久青草欧美一区二区三区| 午夜激情电影在线播放| 国产一区网址| 精品少妇一区二区三区| 亚洲国产另类久久久精品性| 午夜国内精品a一区二区桃色| 91人人爽人人爽人人精88v| 亚洲福利视频二区| 中文字幕+乱码+中文字幕一区| 亚洲四区在线| 国产大学生呻吟对白精彩在线| 久久精品入口九色| 国产一级片子| 欧美日韩中文字幕一区| 日韩电影在线一区二区三区| 国产伦精品一区二区三| 满春阁精品av在线导航 | 性色av香蕉一区二区| 中文字幕区一区二| 一区二区三区国产精品视频| 亚洲欧美国产日韩综合| 欧美一区二区三区四区五区六区| 999偷拍精品视频| 99国产精品一区| 国产一区二区视频免费观看| 国产一区免费播放| 日韩一级片免费观看| 99久久免费精品视频| 日韩精品一二区| 天天射欧美| 亚洲一区中文字幕| 特级免费黄色片| 午夜爽爽爽男女免费观看| 午夜伦全在线观看| 日韩国产欧美中文字幕| 欧美日韩偷拍一区| 午夜激情电影院| 精品国产一区二区三区免费| 一区二区在线不卡| 日韩av三区| 99久久婷婷国产精品综合| 国产91丝袜在线播放动漫| 国产三级精品在线观看| 午夜av资源| 午夜电影一区二区| 国产69久久久欧美一级| 久久久久久久国产精品视频| 国产性生交xxxxx免费| 日韩午夜毛片| 性欧美1819sex性高播放| 狠狠色噜噜狠狠狠狠米奇777| 午夜影院h| 午夜叫声理论片人人影院| 色天天综合久久久久综合片| 久久久久久亚洲精品| 国产精品乱码一区| 亚洲少妇一区二区三区| 高清国产一区二区| 亚洲精品久久久久中文第一暮| 国产福利一区在线观看| 狠狠色成色综合网| 精品国产乱码久久久久久老虎| 国产suv精品一区二区4| 亚洲国产精品一区二区久久,亚洲午夜| 午夜天堂在线| 免费看欧美中韩毛片影院| 国产一区亚洲一区| 久久精品99国产精品亚洲最刺激| 日韩av在线高清| 国产91清纯白嫩初高中在线观看| 久久一级精品视频| 午夜影院h| 久久不卡一区| 99精品一级欧美片免费播放| 亲子乱子伦xxxx| 午夜av影视| 国产老妇av| 午夜影院黄色片| 午夜特级片| 久久久人成影片免费观看| 国产欧美一区二区三区精品观看| 亚洲国产欧美国产综合一区| 欧美高清xxxxx| 亚洲va国产2019| 91麻豆精品国产91久久| 日韩av一二三四区| 午夜电影一区二区三区| 国产视频精品一区二区三区| 欧美日韩中文不卡| 亚洲精品日韩色噜噜久久五月| 99视频一区| 午夜剧场a级免费| 亚洲精品人| 狠狠色噜噜狠狠狠狠米奇777| 99久久精品一区字幕狠狠婷婷| 日韩午夜毛片| 欧美激情在线免费| 色综合久久精品| 久久一区二区视频| 国产精品一区在线观看你懂的| 日韩中文字幕亚洲欧美| 国产一区日韩一区| 精品国产二区三区| 国产精彩视频一区二区| 91精品国产高清一二三四区| 91av一区二区三区| 躁躁躁日日躁网站| 狠狠色丁香久久婷婷综合丁香| 91麻豆国产自产在线观看hd| 国产精品综合一区二区| 亚洲精品久久久中文| 午夜黄色一级电影| 91精品国产九九九久久久亚洲| 欧美国产一区二区在线| 一区二区三区日韩精品| 窝窝午夜精品一区二区| 国产69精品久久久久777糖心| 久久99精品国产麻豆宅宅| 中文字幕日韩有码| 日本大码bbw肉感高潮| 欧美一区二区三区久久久精品| 国产videosfree性另类| 福利片午夜| 日韩精品一区二区三区不卡| 蜜臀久久精品久久久用户群体| 国产午夜精品一区理论片飘花| 农村妇女毛片精品久久| 国产一区二区免费在线| 国偷自产中文字幕亚洲手机在线| 中文字幕欧美一区二区三区| 欧美日韩国产在线一区二区三区| 香港三日三级少妇三级99| 欧美日韩一区在线视频| 欧美一级日韩一级| 国产69久久久欧美一级| 国产精品乱综合在线| 国产麻豆一区二区三区在线观看| 蜜臀久久99静品久久久久久 | 草逼视频网站| 国产精品久久久久久久久久久新郎| 色一情一乱一乱一区免费网站| 久久影视一区二区| 国产欧美精品一区二区三区-老狼| 狠狠色狠狠色综合系列| 国产一二区精品| 日韩一区高清| 挺进警察美妇后菊| 国产欧美一区二区三区沐欲| 亚洲午夜久久久久久久久电影院| **毛片免费| 蜜臀久久99精品久久一区二区| 欧美在线视频一二三区| 性色av香蕉一区二区| 久久久久久中文字幕| 色综合欧美亚洲国产| 国产精品久久人人做人人爽| 国产一区二| 91热精品| 鲁丝一区二区三区免费| 麻豆国产一区二区三区| 欧美乱大交xxxxx| www.日本一区| 国产一级二级在线| 99久久国产综合| 日本午夜一区二区| 欧美日本一二三区| 久久国产麻豆| **毛片在线免费观看| 欧美乱大交xxxxx| 欧美精品久久一区| 黄色香港三级三级三级| 国产一区二区精华| 久久一区二区三区视频| 国产资源一区二区| 精品国产一区二区三区久久久久久| 国产另类一区| 中文字幕理伦片免费看| 日韩中文字幕亚洲精品欧美| 国产女性无套免费看网站| 精品国产一区在线| 国产日韩欧美精品一区 | 97久久超碰国产精品| 国产午夜三级一二三区| 精品国产亚洲一区二区三区| 国产一卡在线| 欧美日韩国产精品综合| 一级久久久| 北条麻妃久久99精品| 欧美一区二区三区免费观看视频| 在线精品视频一区| 欧美日韩国产色综合视频| 国产偷亚洲偷欧美偷精品| 天堂av一区二区三区| 国产乱子伦农村xxxx| 欧美日韩九区| 免费a级毛片18以上观看精品 | 国产精品刺激对白麻豆99| 欧美乱码精品一区二区| 中文字幕一区一区三区| 久久伊人色综合| 欧美日韩国产欧美| 国产乱对白刺激视频在线观看| 欧美精品综合视频| 日本美女视频一区二区| 色综合久久网| 日本aⅴ精品一区二区三区日| 九九久久国产精品| 欧美日韩中文不卡|