日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種強化學習的目標規劃方法有效

專利信息
申請號: 202011192071.8 申請日: 2020-10-30
公開(公告)號: CN112257872B 公開(公告)日: 2022-09-13
發明(設計)人: 周世海 申請(專利權)人: 周世海
主分類號: G06N20/00 分類號: G06N20/00
代理公司: 暫無信息 代理人: 暫無信息
地址: 315722 浙江*** 國省代碼: 浙江;33
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 強化 學習 目標 規劃 方法
【權利要求書】:

1.一種強化學習的目標規劃方法,其特征在于,包括:

S1、收集若干個已收斂的具有相同動作空間的智能體,根據其動作序列,計算其執行任務時,得到的動作序列中每個動作的向量表示,整合為一個動作-向量對應的動作向量字典,然后在目標訓練環境中放入要訓練的具有相同動作空間的執行器;

S2、通過特征提取器,提取與動作相關的環境特征向量,作為執行器的外部輸入;

S3、將當前周期,S2中提取的環境特征向量以及執行器輸出執行的動作的向量表示合并為一個向量,作為下一周期環境特征預測器的輸入,通過環境特征預測器計算得到下一周期的環境特征向量;

S4、給定一個任務最終狀態目標環境,通過特征提取器得到目標環境特征向量;

S5、根據當前環境特征向量以及目標環境特征向量之間的距離,以縮短距離以及減少迭代次數為目標,迭代計算得到一組迭代得到的環境特征向量與動作一一對應的規劃序列;

S6、將規劃序列作為訓練集,對執行器進行規劃訓練;

其中,所述S6包括:

S61、所述執行器為包括策略器和價值器可環境探索與自我訓練的強化學習智能體,判斷當前執行器是否開始探索環境與自我訓練,若否,以執行器投入訓練環境時的初始狀態和給定的目標得到一組初始規劃序列,對執行器的策略器進行訓練,然后開始進入探索環境狀態;若是,則不使用規劃序列對執行器的策略器進行訓練,并轉入S62;

S62、判斷當前執行器的策略器是否收斂,若不收斂,則執行器繼續進行環境探索與自我訓練;若收斂,根據當前環境特征向量和目標環境特征向量,計算得到一組規劃序列,轉入S63;

S63、根據執行器的任務目標評判規劃序列與執行器策略的價值高低,若規劃序列價值高,則使用規劃序列作為訓練集,對執行器的策略器進行訓練;若執行器策略價值高于或等于規劃序列,則重新迭代計算,優化規劃序列,重復比較價值高低,所述重復次數為N,若重復次數大于等于N,轉入S64;

S64、采集執行器的環境特征向量與對應動作,作為訓練集對規劃器的策略器進行訓練,然后轉回S61。

2.根據權利要求1所述的一種強化學習的目標規劃方法,其特征在于,所述S1中動作向量表示,通過將動作序列視為文本序列,利用nlp中的詞向量嵌入原理得到。

3.根據權利要求1所述的一種強化學習的目標規劃方法,其特征在于,所述S2中的特征提取方法,包括一個特征提取器以及一個執行器動作預測器,將特征提取器當前周期輸出的環境特征向量以及下一周期輸出的環境特征向量合并為一個向量作為執行器動作預測器的輸出,利用當前周期執行器輸出的動作與執行器動作預測器輸出的動作的差異,作為特征提取器以及執行器動作預測器的損失函數。

4.根據權利要求1所述的一種強化學習的目標規劃方法,其特征在于,所述S5包括:

S51、將環境特征預測器作為環境函數,將一個基于強化學習的智能體作為規劃器,所述規劃器包括策略器和價值器,構建環境與智能體之間的數據循環;

S52、將當前環境特征向量作為規劃器的策略器的輸入,得到規劃器的策略器的動作輸出;

S53、根據動作向量字典將規劃器的策略器的動作轉化為向量表示,然后與當前環境特征向量合并輸入到環境特征預測器中,預測獲得以規劃為目的的下一周期環境特征向量,并將該以規劃為目的的下一周期環境特征向量作為規劃器的策略器的新輸入,依次迭代,獲得一組規劃序列;

S54、使用規劃器的價值器評判規劃序列價值,更新優化規劃序列的組合策略,直至收斂。

5.根據權利要求1所述的一種強化學習的目標規劃方法,其特征在于,所述動作的向量表示和環境特征向量具有相同的維度。

6.根據權利要求3所述的一種強化學習的目標規劃方法,其特征在于,在合并得到環境特征預測器的輸入前,分別對動作的向量表示和環境特征向量進行歸一化處理。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于周世海,未經周世海許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011192071.8/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 韩漫无遮韩漫免费网址肉| 国产精品suv一区二区6| 欧美hdfree性xxxx| 欧美日韩国产一二| 欧美在线一区二区视频| 欧美精品在线视频观看| 欧美一区二三区| 99国产精品| 久久国产精彩视频| 欧美日韩国产三区| 国产精品久久久久久久久久久久久久久久久久 | 91人人精品| 国产人成看黄久久久久久久久| 午夜av资源| 日本一区二区三区电影免费观看| 国产呻吟高潮| 国产欧美一区二区在线观看| 国产一区二区精品在线| 国产午夜三级一区二区三 | 91精品视频在线免费观看| 欧美高清xxxxx| 日韩国产精品一区二区 | 国产一区二区麻豆| 欧美人妖一区二区三区| 精品国产免费久久| 美国一级片免费观看| 午夜影院试看五分钟| 亚洲欧美一卡二卡| 久久一区欧美| 精品久久久久久亚洲综合网| 精品少妇的一区二区三区四区| 欧美精品一区二区久久| 91免费国产视频| 国产精品国外精品| 免费看农村bbwbbw高潮| 精品国产乱码久久久久久久| 国产在线干| 国产男女乱淫视频高清免费| 欧美三区二区一区| 91久久精品在线| 亚洲精品色婷婷| 久久国产精品欧美| 久久精品国产综合| 国产精品久久久区三区天天噜| 国产1区在线观看| av午夜电影| 午夜影院啪啪| 又黄又爽又刺激久久久久亚洲精品| 日本精品一区视频| 国产69精品久久久久777糖心| xxxx在线视频| 久久激情图片| 91麻豆精品一区二区三区 | 久久国产精品首页| 96国产精品视频| 国产精品色在线网站| 日本五十熟hd丰满| 中文字幕在线一二三区| 日韩av在线电影网| 午夜wwwww| 国产一区二区四区| 99久久久国产精品免费调教网站| 天啦噜国产精品亚洲精品| 一级久久精品| 久久国产精品欧美| 91精品免费观看| 国产精品白浆视频| 一区二区中文字幕在线| 国产精品一区二区日韩新区 | 国v精品久久久网| 午夜国产一区| 国产理论片午午午伦夜理片2021| 国产床戏无遮挡免费观看网站| 午夜看片在线| 午夜叫声理论片人人影院| 国产一区二区综合| 国产免费一区二区三区四区五区| 午夜影院毛片| 91精品国产高清一区二区三区| 99国产精品九九视频免费看| 国产91高清| 国产真实乱偷精品视频免| 亚洲国产精品激情综合图片| 国产精品二十区| 国产精品视频久久久久久| 国产毛片精品一区二区| 国产一区在线视频播放| 国产精品剧情一区二区三区| 日本一码二码三码视频| 日韩精品久久久久久久的张开腿让 | 国产一区网址| 丰满岳乱妇在线观看中字 | 欧美激情在线观看一区| 96国产精品视频| 国产在线精品二区| 国产日产精品一区二区| 制服丝袜二区| 97人人澡人人爽人人模亚洲| 午夜毛片影院| 中文无码热在线视频| 三级视频一区| 久久99视频免费| 久久综合二区| 精品欧美一区二区精品久久小说 | 精品国产乱码久久久久久a丨| 亚洲乱在线| 国产原创一区二区| 亚洲神马久久| 亚洲国产精品日韩av不卡在线| 丰满少妇在线播放bd日韩电影| 久久一级精品视频| _97夜夜澡人人爽人人| 国产精品99久久久久久宅男| 婷婷嫩草国产精品一区二区三区| 国产精品一区二| 亚洲国产欧洲综合997久久,| 免费91麻豆精品国产自产在线观看| 日韩亚洲欧美一区二区 | 日韩精品免费看| 91九色精品| 日韩av中文字幕第一页| 玖玖爱国产精品| aaaaa国产欧美一区二区| 美女张开腿黄网站免费| 国产一区网址| 中文字幕在线播放一区| 国产午夜精品一区二区三区最新电影| 狠狠色噜狠狠狠狠| 国产精彩视频一区二区| 国产免费第一区| 日韩av在线导航| 久久中文一区二区| 99re国产精品视频| 精品综合久久久久| 免费看农村bbwbbw高潮| 黄毛片在线观看| 国产精品二区一区| 国产精品一区二区av日韩在线| 午夜影院一级片| 国产性猛交| 欧美精品粉嫩高潮一区二区| 国产女人和拘做受在线视频| 2021天天干夜夜爽| 日韩欧美激情| 一区二区三区毛片| 欧美髙清性xxxxhdvid| 日本少妇一区二区三区| 精品久久久久久中文字幕| 97精品久久久午夜一区二区三区| 视频二区狠狠色视频| 色乱码一区二区三在线看| 99riav3国产精品视频| 男人的天堂一区二区| 午夜无遮挡| 欧美精品一区二区三区视频| 欧美系列一区二区| 中文字幕欧美久久日高清| 国产欧美日韩中文字幕| 久久国产欧美一区二区免费| 国产一区二区免费电影| 国产一区二区三区色噜噜小说| 国产区一区| 国模精品免费看久久久| 欧美一区二区三区免费视频| 欧美三区视频| 亚洲四区在线| 丝袜脚交一区二区| 欧美一区久久| 午夜电影一区二区| 亚洲欧美日韩另类精品一区二区三区| 欧美日韩久久一区| 国产极品一区二区三区| 亚洲一区欧美| 国产欧美综合一区| 九九精品久久| 538国产精品| www.久久精品视频| 国产精品美女久久久免费| 久久精品国产99| 色婷婷噜噜久久国产精品12p| 男女午夜影院| 日韩av在线免费电影| 国产乱色国产精品播放视频| 久久精品国产精品亚洲红杏| 91嫩草入口| 少妇太爽了在线观看免费| 男女视频一区二区三区| 大bbw大bbw巨大bbw看看| 久久精品国产99| 国产精品免费自拍| 91麻豆精品国产91久久久无限制版| 国内久久久| 国产女性无套免费看网站| 99久久免费毛片基地| 99精品欧美一区二区三区美图| 国产理论片午午午伦夜理片2021| 午夜电影网一区| 亚洲精品乱码久久久久久按摩| 99国产精品9| 国产一区观看| 91精品一二区| 久久精品视频3| 日本午夜无人区毛片私人影院| 久久99久国产精品黄毛片入口| 国产精品视频二区不卡| 欧美大片一区二区三区| 99久久精品一区字幕狠狠婷婷| 精品少妇一区二区三区 | 欧美一区二区三区白人| 99国产精品免费观看视频re| 狠狠色很很在鲁视频| 国产69精品久久久久9999不卡免费| 精品国产一区二区三区国产馆杂枝| 午夜国产一区| 欧美在线一级va免费观看| 国产日韩欧美91| 9999国产精品| 99久久精品国| 日韩国产精品一区二区| freexxxxxxx| 久久不卡精品| 夜夜嗨av一区二区三区中文字幕| 亚洲精品国产主播一区| 午夜av男人的天堂| 国产精品自产拍在线观看蜜| 国产99久久久国产精品免费看| 一二三区欧美| sb少妇高潮二区久久久久| 国产精品区一区二区三| 色综合久久久| 国产丝袜在线精品丝袜91| 91区国产| 96国产精品视频| 亚洲国产精品激情综合图片| 99精品偷拍视频一区二区三区| 91精品啪在线观看国产| 国产精一区二区| 国产91电影在线观看| 国产欧美一区二区三区沐欲| 国产乱一区二区三区视频| 日韩精品一区在线观看| 欧美日韩一区二区三区在线观看视频| 97人人添人人爽一区二区三区| 久久婷婷国产香蕉| 护士xxxx18一19| 国产精品中文字幕一区|