日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]時序邏輯約束下基于強化學習的任務規(guī)劃方法及相關裝置在審

專利信息
申請?zhí)枺?/td> 202111155540.3 申請日: 2021-09-29
公開(公告)號: CN114265674A 公開(公告)日: 2022-04-01
發(fā)明(設計)人: 田戴熒;丁玉隆;蔣卓;崔金強;商成思;尉越 申請(專利權)人: 鵬城實驗室
主分類號: G06F9/48 分類號: G06F9/48
代理公司: 深圳市君勝知識產(chǎn)權代理事務所(普通合伙) 44268 代理人: 溫宏梅
地址: 518000 廣*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 時序 邏輯 約束 基于 強化 學習 任務 規(guī)劃 方法 相關 裝置
【權利要求書】:

1.一種時序邏輯約束下基于強化學習的任務規(guī)劃方法,其特征在于,所述方法包括:

將待規(guī)劃任務轉換為確定性有限自動機;

基于所述確定性有限自動機以及所述待規(guī)劃任務對應的初始策略確定所述待規(guī)劃任務對應的狀態(tài)動作軌跡,其中,所述動態(tài)動作軌跡中的每個狀態(tài)動作對均對應有外部獎勵;

將所述狀態(tài)動作軌跡以及各狀態(tài)動作對各自對應的外部獎勵輸入預設的前饋神經(jīng)網(wǎng)絡,通過所述前饋神經(jīng)網(wǎng)絡輸出各狀態(tài)動作對各自對應的內(nèi)部獎勵,其中,所述前饋神經(jīng)網(wǎng)絡配置有自注意力機制;

基于各外部獎勵以及各內(nèi)部獎勵,確定所述初始策略對應的第一目標函數(shù)以及第一返回值,并基于所述第一目標函數(shù)以及第一返回值更新所述初始策略的策略參數(shù);

繼續(xù)執(zhí)行基于所述確定性有限自動機以及所述待規(guī)劃任務對應的初始策略確定所述待規(guī)劃任務對應的狀態(tài)動作軌跡的步驟,直至得到待規(guī)劃任務對應的目標策略。

2.根據(jù)權利要求1所述時序邏輯約束下基于強化學習的任務規(guī)劃方法,其特征在于,所述基于所述確定性有限自動機以及所述待規(guī)劃任務對應的初始策略確定所述待規(guī)劃任務對應的狀態(tài)動作軌跡具體包括:

獲取待規(guī)劃任務中的執(zhí)行端所處環(huán)境中的當前狀態(tài);

基于所述當前狀態(tài)以及所述待規(guī)劃任務對應的初始策略進行動作采樣以得到動作;

控制執(zhí)行端執(zhí)行所述動作以得到下一狀態(tài),并檢查所述下一狀態(tài)在確定性有限自動機中的轉換狀態(tài);

若所述轉換狀態(tài)滿足第一預設條件,則為狀態(tài)動作對配置相應的外部獎勵并結束狀態(tài)動作對以得到狀態(tài)動作軌跡,其中,所述狀態(tài)動作對包括狀態(tài)和動作;

若所述轉換狀態(tài)滿足第二預設條件,則為所述狀態(tài)動作對配置預設外部獎勵;

將所述下一狀態(tài)作為當前狀態(tài),并繼續(xù)執(zhí)行基于所述當前狀態(tài)以及所述待規(guī)劃任務對應的初始策略進行動作采樣以得到動作的步驟,直至所述轉換狀態(tài)違反時序邏輯或者屬于可接受狀態(tài)集合或者狀態(tài)動作軌跡的軌跡長度達到預設長度閾值。

3.根據(jù)權利要求2所述時序邏輯約束下基于強化學習的任務規(guī)劃方法,其特征在于,所述第一預設條件為所述轉換狀態(tài)違反時序邏輯或者屬于可接受狀態(tài)集合;所述第二預設條件為所述轉換狀態(tài)未違反時序邏輯且不屬于可接受狀態(tài)集合,或者未檢查所述下一狀態(tài)在確定性有限自動機中的轉換狀態(tài)。

4.根據(jù)權利要求2所述時序邏輯約束下基于強化學習的任務規(guī)劃方法,其特征在于,所述若所述轉換狀態(tài)未違反時序邏輯且不屬于可接受狀態(tài)集合,則為所述當前狀態(tài)和動作構成的狀態(tài)動作對配置預設外部獎勵之后,所述方法還包括:

將所述確定性有限自動機的狀態(tài)重置為確定性有限自動機的初始狀態(tài)。

5.根據(jù)權利要求1所述時序邏輯約束下基于強化學習的任務規(guī)劃方法,其特征在于,所述前饋神經(jīng)網(wǎng)絡包括自注意力模塊以及全連接模塊;所述將所述狀態(tài)動作軌跡以及各狀態(tài)動作對各自對應的外部獎勵輸入預設的前饋神經(jīng)網(wǎng)絡,通過所述前饋神經(jīng)網(wǎng)絡輸出各狀態(tài)動作對各自對應的內(nèi)部獎勵具體包括:

將所述將所述狀態(tài)動作軌跡以及各狀態(tài)動作對各自對應的外部獎勵輸入輸入所述自注意力模塊,通過所述自注意力模塊輸出各狀態(tài)動作對各自對應的時序特性向量;

將各狀態(tài)動作對各自對應的時序特性向量輸入所述全連接模塊,通過所述全連接模塊輸入各動作狀態(tài)各自對應的內(nèi)部獎勵。

6.根據(jù)權利要求5所述時序邏輯約束下基于強化學習的任務規(guī)劃方法,其特征在于,所述動作狀態(tài)對應的時隙特性向量為:

y=ωv+x

其中,v表示值向量,x表示時間序列特征向量,q表示查詢向量,k表示鍵向量,softmax表示softmax函數(shù),dimv表示值向量v的空間維度。

下載完整專利技術內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鵬城實驗室,未經(jīng)鵬城實驗室許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202111155540.3/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美在线精品一区| 精品久久二区| 综合久久一区| 国产精品亚洲第一区| 一区二区三区香蕉视频| 欧美大成色www永久网站婷| 久久久久偷看国产亚洲87| 久久99久久99精品免观看软件| 国产精品一区二区久久乐夜夜嗨| 三级视频一区| 综合欧美一区二区三区| 17c国产精品一区二区| 久久影院国产精品| 日本三级香港三级| 欧美色图视频一区| 91精品国模一区二区三区| 欧美日韩国产精品一区二区三区| 精品视频在线一区二区三区| 亚洲乱码一区二区三区三上悠亚| 日本精品三区| 国产男女乱淫视频高清免费| 久久国产麻豆| 国产欧美日韩精品一区二区图片| 欧美日韩国产精品综合| 日本三级韩国三级国产三级| 一区二区三区国产精品视频| 综合国产一区| 九一国产精品| 欧美日韩一区二区三区四区五区六区| 亚洲精品456在线播放| 国产高清在线精品一区二区三区| 国语对白一区二区| 99爱精品在线| 久久久久亚洲最大xxxx| 中文字幕理伦片免费看| 日本不卡精品| 亚洲精品乱码久久久久久按摩| 国产欧美一区二区精品性色超碰| 午夜片在线| 一区二区免费播放| 国产va亚洲va在线va| 欧美一级不卡| 久久免费福利视频| 国产午夜精品一区二区三区视频| 国产欧美性| 91精品一区在线观看| 人人要人人澡人人爽人人dvd| 少妇在线看www| 国产精品乱码一区| 久久久久国产精品视频| 国产精品不卡一区二区三区| 欧美一区久久| 精品国产一区二区三| 久久99国产精品久久99| 欧美日韩一区二区三区不卡| 国产午夜精品一区二区三区四区| 国产中文字幕一区二区三区| 99爱精品在线| 欧美xxxxhdvideos| 手机看片国产一区| 国产亚洲精品久久久久久网站| 午夜666| 538在线一区二区精品国产| 久草精品一区| 亚洲一卡二卡在线| 国产人澡人澡澡澡人碰视 | 国产精品乱码一区| 国产精品国精产品一二三区| 99久久精品国产系列| 国产精品一区二区在线看| 91久久国语露脸精品国产高跟 | 亚洲自拍偷拍中文字幕| 麻豆精品国产入口| 一区二区久久精品66国产精品| 日韩av中文字幕在线| 国产一区二区三区在线电影| 欧美日韩国产一区在线| 久久久中精品2020中文| 国产91免费在线| 亚洲第一区国产精品| 91一区二区三区视频| 日韩中文字幕在线一区| 亚洲第一区国产精品| 曰韩av在线| 日韩av三区| **毛片免费| 香港三日本8a三级少妇三级99| 最新国产精品久久精品| 99久久国产综合精品尤物酒店| 国产精品第157页| 国产91福利视频| 首页亚洲欧美制服丝腿 | 日韩av免费网站| 97精品国产aⅴ7777| 综合欧美一区二区三区| 午夜剧场a级免费| 国产69精品久久久久久| 少妇高潮一区二区三区99小说| 精品在线观看一区二区| 欧美一区二区三区免费播放视频了| 少妇性色午夜淫片aaa播放5| 一级黄色片免费网站| 99国产精品久久久久| 69久久夜色精品国产7777| 亚洲欧美一卡二卡| 国产精品视频久久| 日韩精品一区二区三区不卡| 久久不卡一区| 国产精品亚洲二区| 国产伦理精品一区二区三区观看体验 | 国产69精品久久久| 国产精品美女一区二区视频| 亚洲精品乱码久久久久久蜜糖图片| 久久国产精品免费视频| 91精品一二区| 一区二区欧美精品| 国产精品一区二区久久乐夜夜嗨| 中文字幕av一区二区三区高| 99热一区二区| 国产精品19乱码一区二区三区| 日韩午夜三级| 久久国产视屏| 欧美国产精品久久| 国产视频在线一区二区| 亚洲国产精品日韩av不卡在线| 男女无遮挡xx00动态图120秒| 九色国产精品入口| 国产精品久久久久久久新郎| 亚洲国产精品入口| 91精品美女| 色噜噜日韩精品欧美一区二区 | 久久精品亚洲一区二区三区画质| 国产一区二区三区色噜噜小说| 国产精品视频十区| 欧美大成色www永久网站婷| 久久精品手机视频| 国产精品美女久久久免费| 欧美日韩偷拍一区| 国产91九色视频| 香蕉av一区| 国产精品1区2区| 国产69精品久久99不卡免费版| 日韩欧美一区二区在线视频| 国产一区日韩在线| 精品国产乱码一区二区三区在线| 欧洲国产一区| 少妇高潮大叫喷水| 亚洲国产视频一区二区三区| 狠狠躁夜夜躁2020| 国产欧美一区二区三区在线播放| 天天干狠狠插| 一区二区中文字幕在线观看| 亚洲乱亚洲乱妇28p| 国产aⅴ精品久久久久久| xx性欧美hd| 久久综合二区| 国产精品一二二区| 亚洲欧洲一二三区| 午夜一区二区三区在线观看| 久久久久国产亚洲日本| 国产一区二区三区久久久| 欧美三区二区一区| 性欧美精品动漫| 91婷婷精品国产综合久久| 国产精品尤物麻豆一区二区三区| 免费a级毛片18以上观看精品 | 国产精品19乱码一区二区三区| 2023国产精品自产拍在线观看| 一区二区91| 午夜影院伦理片| 欧美一区二区久久| 久久激情影院| 中文字幕一区一区三区| 国产精品中文字幕一区二区三区| 福利电影一区二区三区| 国产亚洲精品久久久久秋霞| 激情欧美日韩| 国产伦理久久精品久久久久| 538国产精品| 国产1区2区3区| 欧美一区二区三区激情视频| 午夜影院激情| 96国产精品视频| 久久综合伊人77777麻豆最新章节 一区二区久久精品66国产精品 | 一区二区三区电影在线观看| 亚洲精品国产91| 91精品啪在线观看国产手机 | 精品一区二区在线视频| 中日韩欧美一级毛片| 狠狠色狠狠色综合久久第一次| 国产区精品区| 国产精品视频二区三区| 性欧美一区二区| 国产色午夜婷婷一区二区三区| 欧美日韩一级二级三级| 99riav3国产精品视频| 国产精品suv一区二区6| 一色桃子av大全在线播放| 国产一区激情| 91精品色| 黄色91在线观看| 国产一区二区三区四区五区七| 亚洲精品性| 久草精品一区| 日韩中文字幕久久久97都市激情| 久久99精品久久久大学生| 久久国产欧美一区二区三区精品| 国产91清纯白嫩初高中在线观看| av狠狠干| 日韩精品一区在线观看| 国产激情二区| 国产真裸无庶纶乱视频| 国产精品色婷婷99久久精品| 少妇高潮一区二区三区99小说| 久久精品国产一区二区三区不卡| 国产在线拍偷自揄拍视频| 国产日韩欧美三级| 国产精品视频一区二区二| 激情久久久| 国产伦精品一区二区三| bbbbb女女女女女bbbbb国产| 欧美一区二区三区激情视频| 国产欧美一区二区精品久久久| 色综合久久88| 精品一区二区超碰久久久| 强行挺进女警紧窄湿润| 一区二区免费在线观看| 国产精品19乱码一区二区三区| 天干天干天啪啪夜爽爽99| 综合久久一区二区三区| 日韩中文字幕区一区有砖一区| 强制中出し~大桥未久10| 久久久国产精品一区| 精品国产一级| 亚洲精品无吗| 精品久久香蕉国产线看观看gif| 日本护士hd高潮护士| 91久久香蕉国产日韩欧美9色| 亚洲欧美日韩在线| 天堂av一区二区三区| 欧美日韩卡一卡二| 香蕉免费一区二区三区在线观看| 久久精品麻豆| 亚洲精品www久久久久久广东 | 国产偷久久一区精品69| 一区二区三区国产欧美|