日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種價值驅動的跨域策略泛化方法及系統在審

專利信息
申請號: 202310246276.7 申請日: 2023-03-14
公開(公告)號: CN116360257A 公開(公告)日: 2023-06-30
發明(設計)人: 李學龍;白辰甲;徐康;趙斌;王震 申請(專利權)人: 上海人工智能創新中心
主分類號: G05B13/04 分類號: G05B13/04;G06N20/00
代理公司: 上海智晟知識產權代理事務所(特殊普通合伙) 31313 代理人: 李鏑的
地址: 200232 上海市*** 國省代碼: 上海;31
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 價值 驅動 策略 泛化 方法 系統
【說明書】:

發明總的來說涉及強化學習技術領域,提出一種價值驅動的跨域策略泛化方法及系統。該方法包括:提供源域訓練數據以及目標域訓練數據;基于價值驅動篩選源域訓練數據;以及將篩選出的源域訓練數據以及目標域訓練數據輸入智能體中進行訓練。本發明在源域自身不需要改變的同時,算法不再專注數據的動力學一致性,而是從價值的跨域一致性對源域數據進行篩選,能夠有效提高強化學習中策略的泛化能力,進而可以有效節約運算資源。

技術領域

本發明總的來說涉及強化學習技術領域。具體而言,本發明涉及一種價值驅動的跨域策略泛化方法及系統。

背景技術

現有的主動智能算法能夠利用大量數據解決現實生活中的復雜任務,然而智能體局限于特定環境,存在缺乏針對變化環境的跨域泛化能力的問題。雖然人類能夠基于其他任務或者其他智能體的先驗知識加速自身學習,但現階段的強化學習算法往往難以實現高差別任務之間的泛化,因此如何提高策略的泛化能力是現階段強化學習發展中的一個重要問題。

在強化學習領域中,現有算法通常是針對一個固定的任務訓練對應的最優控制策略,而當任務所在的環境或任務本身發生變化時,原有的控制策略往往無法直接適用。例如,使用強化學習算法針對四足機器人訓練行走控制策略時,當機器人自身電壓發生浮動或者外界環境發生演變時,舊策略往往無法在環境改變時實現機器人的控制。

針對強化學習策略的跨域自適應問題,需要智能體在給定較不受限的源域數據和有限的目標域數據的情況下訓練出對應目標域的高水平策略,其中需要算法針對源域與目標域之間的動力學差異提出一定的解決手段,現有的方法包括:

基于可參數化仿真器的動力學自適應方法,當智能體所在的源域是參數化或者動力學可調時,該方法基于源域與目標域的數據來顯式地調整源域仿真器的動力學參數,使其足夠接近目標域動力學規則,最后在調整后的源域下訓練出的策略便能夠直接部署至目標域。然而該方法需要依賴參數化的仿真器,而許多復雜任務對應的仿真器中的物理屬性是不可調節的。當對應的目標域為現實世界時,目標域相對于源域的動力學差異可能是來自于多樣的原因(例如機器人外界環境的變化),此時若源域的仿真器無法模擬相應的變化,該方法將無法使源域的動力學接近目標域動力學,從而無法訓練出可泛化策略。

基于動作轉換的動力學自適應方法,該方法基于源域和目標域的數據擬合對應的逆動力學模型與動力學模型。在智能體與源域交互并訓練時,基于所訓練的動力學模型來矯正策略執行的動作,從而使得矯正后動作在目標域以及原動作在源域保持動力學一致性,最終實現策略的跨域自適應。然而該方法需要擬合復雜的動力學模型,但對于復雜機器人系統而言,動力學方程非常復雜,神經網絡需要大量樣本進行訓練才能擬合動力學方程,并且需要與環境交互獲得大量的樣本。在有限環境交互的限制下,往往無法獲得充足的樣本來擬合動力學模型。

基于獎勵補償的動力學自適應方法,該方法通過訓練域分類器來對源域收集數據的獎勵數值進行動力學補償。具體來說,當相應的數據接近目標域下的動力學規則時算法為智能體提供額外的正獎勵,當數據不符合目標域的動力學規則時算法為智能體提供負獎勵作為懲罰,其中相應的獎勵補償的數值由域分類器的似然估計決定。然而該方法需要假設存在至少一個目標域高水平策略且該策略在源域同樣有著較好表現,當源域和目標域不滿足上述假設時,該方法會基于域分類器對所有源域數據進行懲罰,從而阻礙策略對目標域的探索,導致算法無法收斂到高水平策略。

發明內容

為至少部分解決現有技術中的上述問題,本發明提出一種價值驅動的跨域策略泛化方法,包括下列步驟:

提供源域訓練數據以及目標域訓練數據:

篩選源域訓練數據,其中包括:

提供狀態動作數據對(s,a),確定源域下一時刻狀態s′src,并且通過目標域動力學模型確定目標域下一時刻狀態集合

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海人工智能創新中心,未經上海人工智能創新中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202310246276.7/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 免费xxxx18美国| 一区二区三区四区国产| 国产1区2区视频| 久久人人97超碰婷婷开心情五月| 国产精品18久久久久久白浆动漫| 国产精品二十区| 国产精品日韩一区二区三区| 国产精品久久久久久久龚玥菲| 波多野结衣巨乳女教师| 国产午夜精品一区二区三区最新电影| 久久久久亚洲国产精品| 在线视频国产一区二区| 四虎影视亚洲精品国产原创优播| 欧美福利三区| 日本高清二区| 欧美综合在线一区| 狠狠搞av| 91精品第一页| 亚洲欧美一卡| 农村妇女毛片精品久久| 狠狠色狠狠色综合日日五| 精品午夜电影| 99热久久精品免费精品| 国产伦精品一区二区三区无广告| 久久一区二区三区欧美| 国产精品一区二区久久乐夜夜嗨| 欧美视频1区| 欧美久久一区二区三区| 香蕉视频在线观看一区二区| 亚洲一区欧美| 国产性猛交xx乱| 999偷拍精品视频| 亚洲精品欧美精品日韩精品| 久久精品国产亚洲7777| 亚洲高清毛片一区二区| 肥大bbwbbwbbw高潮| 亚洲精品一区二区另类图片| 免费91麻豆精品国产自产在线观看| 日韩精品一区二区三区免费观看视频| www.午夜av| 国产精品1区二区| 国产日韩精品一区二区| 午夜a电影| 狠狠色噜噜狠狠狠狠色吗综合 | 亚洲乱玛2021| 高清人人天天夜夜曰狠狠狠狠| 欧美一区二三区人人喊爽| 亚洲欧美一区二区三区1000 | 狠狠色狠狠色综合久久一| 狠狠色噜噜狠狠狠狠视频| 久久夜靖品2区| 国产日韩欧美另类| 亚洲午夜精品一区二区三区| 亚洲欧美日韩一级| 日韩一区二区福利视频| 躁躁躁日日躁网站| 国产理论一区| 一区二区久久精品| 91精品久| 人人玩人人添人人澡97| 99精品久久久久久久婷婷| 日本美女视频一区二区| 日本护士hd高潮护士| 亚洲欧美一卡二卡| 91免费看国产| 99久热精品| 欧美日韩一级二级| 亚日韩精品| 久久婷婷国产麻豆91天堂徐州| 日韩av免费电影| 日韩精品午夜视频| 日韩国产精品一区二区| 日韩精品中文字幕久久臀| 亚洲欧美自拍一区| 国产色一区二区| 国产大学生呻吟对白精彩在线| 国产69精品久久777的优势| 狠狠色噜噜狠狠狠狠| 性欧美一区二区三区| 99精品国产99久久久久久97| 日本护士hd高潮护士| 日韩欧美一区精品| 国产一区二区伦理| 免费精品一区二区三区视频日产| 精品久久久久久中文字幕大豆网| 日韩av中文字幕一区二区| 国产精品9区| 一区二区午夜| 一区二区三区欧美精品| 欧美系列一区| 国产日产欧美一区| 国产69精品福利视频| 欧美髙清性xxxxhdvid| 狠狠色综合欧美激情| 93久久精品日日躁夜夜躁欧美| 日韩av在线免费电影| av午夜在线| 综合国产一区| 狠狠色狠狠色综合婷婷tag| 亚洲精品一品区二品区三品区| 麻豆91在线| 九九国产精品视频| 性欧美精品动漫| 97精品久久人人爽人人爽| 精品日韩久久久| 最新国产精品自拍| 欧美日韩亚洲另类| 中文字幕日韩一区二区| 精品久久久久久亚洲综合网| 91亚洲欧美日韩精品久久奇米色| 国产午夜一级一片免费播放| 久久精品国产亚洲7777 | 久久96国产精品久久99软件| 二区三区免费视频| 性生交片免费看片| 国产精品6699| 欧美激情在线免费| 97久久精品人人做人人爽50路| 国产日韩欧美精品| 欧美日韩国产一区二区三区在线观看| 久久免费视频一区| 一本色道久久综合亚洲精品图片| 国产亚洲精品久久久456| 国模一区二区三区白浆| 日韩久久精品一区二区| 视频一区二区中文字幕| 夜夜嗨av禁果av粉嫩av懂色av| 午夜国内精品a一区二区桃色| 26uuu亚洲电影在线观看| 一区二区在线精品| 欧美日韩国产区| 免费精品99久久国产综合精品应用| 欧美hdxxxx| 欧洲在线一区| 午夜黄色大片| 91av中文字幕| 一区二区在线国产| 久久久久亚洲| 右手影院av| 国产精品国外精品| 国产精品一区不卡| 国产在线精品一区| 99精品视频免费看| 亚洲精品一区,精品二区| 国产一区二区片| 97久久国产亚洲精品超碰热| 久久国产欧美一区二区三区免费| 99久久精品国产系列| 精品欧美一区二区在线观看| free性欧美hd另类丰满| 国产精品一区二区av麻豆| 久久午夜鲁丝片| 国产真裸无庶纶乱视频 | 国产一区二区综合| 欧美激情视频一区二区三区| 99国产精品永久免费视频| 精品国产九九| 亚洲精华国产欧美| 欧美日韩国产一二| 国产理论一区| 午夜看片网站| 日韩精品免费一区二区三区| 91精品国产一区二区三区| 精品日韩久久久| 夜夜躁狠狠躁日日躁2024| 国产主播啪啪| 国产精品网站一区| 国产精品精品视频一区二区三区 | 日韩av在线电影网| 国产欧美视频一区二区| 亚洲国产欧美一区二区丝袜黑人| 一本久久精品一区二区| 91理论片午午伦夜理片久久| 一二三区欧美| 午夜激情影院| 伊人av综合网| 999久久久国产| 日韩久久精品一区二区三区| 狠狠色噜噜狠狠狠狠2018| 狠狠色丁香久久综合频道日韩| 久久精品一二三四| 日韩精品一区二区三区免费观看视频| 亚洲神马久久| 欧美精品综合视频| 精品久久久久久久免费看女人毛片| 国产一区二区麻豆| 午夜爽爽爽男女免费观看| 日韩一区国产| 欧美乱妇高清无乱码免费| 国产精品亚洲精品一区二区三区| 亚洲精品日本无v一区| 在线视频不卡一区| 狠狠插影院| 99久久精品国产系列| 国产精品一二三区视频出来一| 欧美日韩国产午夜| av中文字幕一区二区| 97精品超碰一区二区三区| 少妇高潮在线观看| 性刺激久久久久久久久九色| 国产精品日韩高清伦字幕搜索| 午夜影院h| 91黄在线看| 国产精品日产欧美久久久久| 精品国产乱码久久久久久图片| 狠狠色丁香久久婷婷综合_中| 首页亚洲欧美制服丝腿| 国产乱老一区视频| 国产人伦精品一区二区三区| 久久久精品a| 国产丝袜一区二区三区免费视频 | 日韩夜精品精品免费观看| 日韩一区二区三区福利视频| 日韩av三区| 国内精品久久久久影院日本| 国产一区二区三区小说| 特级免费黄色片| 黄色国产一区二区| 国产伦精品一区二区三区四区| 国产女人和拘做受在线视频| 久久99久久99精品蜜柚传媒| 亚洲乱码av一区二区三区中文在线: | 亚洲精品一品区二品区三品区 | 97人人澡人人爽91综合色| 国产91福利视频| 麻豆国产一区二区| 日本精品99| 国产日韩欧美二区| 国产精品日韩在线观看| 久久久久久国产一区二区三区| 国产在线拍揄自揄拍| 国产一区亚洲一区| 国产三级在线视频一区二区三区| 国产精品日韩电影| 国产精品久久久久久久久久久久久久不卡| 51区亚洲精品一区二区三区| 国产精品亚洲精品| 欧洲在线一区| 国产午夜亚洲精品| 精品国产一区二区三区免费| 国产精品日韩一区二区| 波多野结衣巨乳女教师| 午夜免费av电影| 国产亚洲精品精品国产亚洲综合| 国产亚洲精品久久久久动| 欧美精品一区二区三区在线四季|