日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于GP與PPO實現連續性動作決策的智能決策方法和系統有效

專利信息
申請號: 202210404484.0 申請日: 2022-04-18
公開(公告)號: CN114647986B 公開(公告)日: 2023-08-08
發明(設計)人: 方文其;吳冠霖;葛品;平洋;欒紹童;戴迎楓;繆正元;沈源源;金新竹 申請(專利權)人: 南湖實驗室
主分類號: G06F30/27 分類號: G06F30/27;G06N5/01;G06N20/00
代理公司: 浙江永鼎律師事務所 33233 代理人: 張曉英
地址: 314000 浙江省*** 國省代碼: 浙江;33
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 gp ppo 實現 連續性 動作 決策 智能 方法 系統
【說明書】:

本發明公開了一種基于GP與PPO實現連續性動作決策的智能決策方法和系統,包括世界模型、策略模型和經驗池,由世界模型生成的模擬經驗被存入所述的經驗池,所述的世界模型為基于GP的世界模型,所述的策略模型包括PPO算法,且PPO算法利用經驗池中的模擬經驗進行強化學習。提出了基于GP的Dyna?PPO方法,將Dyna?Q框架中的DQN算法替換為優化后的PPO算法,改進后的框架具有無模型DRL、基于模型DRL兩種方案優勢的同時能夠被用于解決連續性動作的決策問題,從而實現基于Dyna?框架的連續性動作決策。

技術領域

本發明屬于智能決策領域,尤其是涉及一種基于GP與PPO實現連續性動作決策的智能決策方法和系統。

背景技術

決策問題場景復雜、多變,不但存在像手勢指令這樣的離散型動作問題,同樣存在像飛機車輛控制決策等連續性動作問題。但是目前更多的研究都局限于離散動作空間的情形,本申請人此前的研究(已申請專利:CN113392956B、CN112989017B、CN112989016B)闡述了基于GP的Dyna-Q方法,同樣更多地局限于離散動作空間的情形,雖然動作空間也可以進行離散化處理,但是,一旦增大離散空間的維數,很容易遇到收斂困難的問題,而這將顯著破壞決策方法的訓練優勢和性能優勢。

自動駕駛是連續性決策的典型應用場景,基于規則和基于學習的方法是完成自動駕駛任務的兩種主要方法。基于規則的方法通常是手動設計的,可以快速實現其功能,但該方法對未知情況的泛化能力很差,無法應付高可變性場景。基于學習的方法主要是基于DRL(深度強化學習)的方法,該方法使用深度神經網絡將感知狀態映射到車輛動作中,在過去關于自動駕駛的DRL研究中,主要有基于無模型方法的DRL方法和基于模型的DRL方法,但是,無模型?DRL方法通常需要花費大量時間在訓練上,通過反復試錯學得經驗,學習效率很低;基于模型的?DRL方法如果無法從數據中學習到足夠準確的模型,就很難達到需要的效果,而算法與未知環境交互過程中所記錄的數據往往存在大量無用信息,選擇合適的經驗很困難,此外,創建驗證動態模型也依賴于專業知識。

Dyna-Q框架結合了上述兩種方法的優點,是一個很好的可行性方法,但是,Dyna-Q框架本身無法很好地處理連續性動作問題,而且Dyna-Q?框架僅限于在數據級別集成學習和規劃。此外,由于經驗池中的低質量數據,大量的規劃步長會在充分訓練后對學習造成損害,盡管能夠通過設計判別模塊來避免這種情況,但在效率和準確性方面仍然不能令人滿意。

基于Dyna-Q框架結合了上述兩種方法優點的背景基礎,本方案試圖在Dyna-Q框架基礎上發展能夠處理連續性動作問題的方法。

發明內容

本發明的目的是針對上述問題,提供一種基于GP與PPO實現連續性動作決策的智能決策方法和系統。

為達到上述目的,本發明采用了下列技術方案:

一種用于實現連續性動作決策的智能決策系統,包括世界模型、策略模型和經驗池,由世界模型生成的模擬經驗被存入所述的經驗池,所述的世界模型為基于GP的世界模型,所述的策略模型包括PPO算法,且PPO算法利用經驗池中的模擬經驗進行強化學習。

在上述用于實現連續性動作決策的智能決策系統中,所述的策略模型包括策略損失函數,以及值函數損失函數和/或熵損失函數。

在上述用于實現連續性動作決策的智能決策系統中,所述策略模型的損失函數為:

???(1)

其中,為策略損失函數,表示值函數損失函數,為高斯分布的熵損失函數,是權重值。

在上述用于實現連續性動作決策的智能決策系統中,策略損失函數包括:

??(2)

表示求平均值,表示取小的值,表示新舊策略變化比例,表示PPO算法的優勢函數,表示截斷函數,是截斷系數。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南湖實驗室,未經南湖實驗室許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202210404484.0/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91性高湖久久久久久久久_久久99| 国产乱xxxxx国语对白| 国产乱人乱精一区二视频国产精品| 欧美色综合天天久久| 国产欧美亚洲精品| 日韩偷拍精品| 日韩精品中文字幕一区| 99精品久久99久久久久| 国产91九色视频| 欧美一区二区久久| 亚洲国产精品第一区二区| 久久一区二区三区欧美| 亚洲午夜天堂吃瓜在线| 中文字幕一区二区三区日韩精品| 久久影院一区二区| 午夜精品影视| 91波多野结衣| 日本一区二区在线电影| 国产69精品久久| 国产欧美一区二区精品性| 国产91在| 午夜天堂电影| 日本一二三不卡| 国产一区二区在线观| 欧美在线视频三区| 91精品久久久久久| 国产欧美亚洲精品| 国产精品自拍在线观看| 国产精品自产拍在线观看蜜| 狠狠色综合欧美激情| 日日夜夜精品免费看| 日韩精品一区在线观看| 久久一区欧美| 免费视频拗女稀缺一区二区| 亚洲精品国产一区二区三区| 欧美人妖一区二区三区| 久久精品色欧美aⅴ一区二区| 99国产精品99久久久久| 日韩精品一区二区三区在线| 福利视频亚洲一区| 国产精品自产拍在线观看桃花| 欧美精品八区| 亚洲欧美一卡二卡| 午夜特级片| 欧美精品国产一区二区| 久久久久久久久久国产精品| 国产在线播放一区二区| 91精品夜夜| 岛国精品一区二区| 国产1区2| 欧美一区二区三区激情视频| 日韩精品久久久久久中文字幕8| 亚洲乱码av一区二区三区中文在线: | 99国产精品免费| 国产麻豆精品一区二区| 日韩av不卡一区| 日韩欧美精品一区二区| 久久综合国产精品| 精品国产一二三四区| 99精品偷拍视频一区二区三区| 午夜wwww| 欧洲在线一区| 国产专区一区二区| 久久久精品99久久精品36亚| 日本一区二区三区四区高清视频| 年轻bbwbbw高潮| 性old老妇做受| 97人人澡人人爽人人模亚洲| 九九视频69精品视频秋欲浓| 鲁一鲁一鲁一鲁一鲁一av| 国产精品久久久久久久久久久久冷| 亚洲乱小说| 亚洲欧美国产精品久久| 亚洲精品乱码久久久久久写真| 91久久久爱一区二区三区| 最新av中文字幕| 激情久久影院| 亚洲日韩欧美综合| 国产一区免费在线| 欧美日韩激情在线| 99er热精品视频国产| 国产极品美女高潮无套久久久| 亚洲精品日本久久一区二区三区 | 欧美日韩综合一区| 91国内精品白嫩初高生| 欧美一区二区色| 国产一区二区三区中文字幕| 欧美精品久| 亚洲一区二区国产精品| 国产韩国精品一区二区三区| 午夜精品99| 午夜影院啊啊啊| 国产一区=区| 国产乱xxxxx国语对白| 国产精品久久久久四虎| _97夜夜澡人人爽人人| 日韩av不卡一区二区| 欧美日韩一区二区三区四区五区| 久久国产麻豆| 久久一区二区三区欧美| 国产欧美一区二区三区免费| 99热久久这里只精品国产www| 精品一区二区三区自拍图片区| 99久久精品免费看国产免费粉嫩| 美女被羞羞网站视频软件| 国产精品麻豆一区二区三区| 欧美xxxxhdvideos| 日韩精品一区二区中文字幕| 国内久久久| 欧美久久一区二区三区| 欧美乱码精品一区二区| 国产综合亚洲精品| 欧美髙清性xxxxhdvid| 亚洲精品国产久| 欧美乱妇高清无乱码| 日韩精品久久久久久久酒店| 久久免费视频99| 午夜一级电影| 男女视频一区二区三区| 日韩av中文字幕一区二区| 国产又色又爽无遮挡免费动态图| 三上悠亚亚洲精品一区二区| 97人人揉人人捏人人添| 国产精品欧美一区二区三区奶水| 91精品啪在线观看国产线免费| 国产的欧美一区二区三区 | 精品久久久久久久免费看女人毛片| 26uuu色噜噜精品一区二区| 国产91一区二区在线观看| 99re6国产露脸精品视频网站| 亚洲精品日韩激情欧美| 91精品国产高清一区二区三区| 国产伦理久久精品久久久久| 亚洲精品www久久久| 激情久久综合| 满春阁精品av在线导航| 欧美激情视频一区二区三区| 亚洲高清乱码午夜电影网| 国产视频一区二区在线播放| 91福利视频导航| 国产高清无套内谢免费| 久久精品色欧美aⅴ一区二区| 欧美极品少妇videossex| 狠狠躁夜夜躁人人爽天天天天97 | 国产毛片精品一区二区| 91avpro| 午夜伦理片在线观看| 欧美视屏一区| 在线国产91| 亚洲一区二区福利视频| 国产精品偷乱一区二区三区| 狠狠躁日日躁狂躁夜夜躁av| 亚洲欧洲一区| 中文字幕视频一区二区| 亚洲色欲色欲www| 夜夜精品视频一区二区| 毛片免费看看| 91精品一区在线观看| 狠狠色综合久久丁香婷婷| 91精品色| 国产高潮国产高潮久久久91| 日本一区二区在线观看视频| 2023国产精品自产拍在线观看| 国产精品69av| 久久综合国产精品| 护士xxxx18一19| 国产免费观看一区| 亚洲精品久久久久久久久久久久久久| 久久久久久久国产精品视频| 中文字幕亚洲欧美日韩在线不卡| 国产伦精品一区二区三区四区| 国产丝袜一区二区三区免费视频| 狠狠色狠狠色综合系列| 国产一区不卡视频| 国产精品99999999| 欧洲激情一区二区| 97精品国产aⅴ7777| 李采潭无删减版大尺度| 性视频一区二区三区| 欧美日韩偷拍一区| 91精品视频在线免费观看| 午夜一区二区视频| 午夜特片网| 免费看大黄毛片全集免费| 欧美一区二区三区白人| 日本一二三区电影| 91亚洲欧美强伦三区麻豆| 97一区二区国产好的精华液| 欧美日韩激情一区二区| 97久久精品人人澡人人爽| 国产大片一区二区三区| 日韩精品一区二区三区在线| 久久久久亚洲精品视频| 91午夜在线观看| 夜夜躁人人爽天天天天大学生 | 欧美一区二区三区片| 国产九九九精品视频| 97精品超碰一区二区三区| 国产激情视频一区二区| 国产1区2区3区中文字幕| 天天干狠狠插| 午夜色影院| 国产精品视频tv| 午夜爽爽爽男女免费观看 | 欧美精品粉嫩高潮一区二区| 日韩精品一区二区三区在线 | 91一区二区三区视频| 欧美一区二区色| 99视频国产在线| 国产清纯白嫩初高生在线播放性色| 综合色婷婷一区二区亚洲欧美国产 | 一区二区中文字幕在线| 综合国产一区| 日本一二三四区视频| 国产精品乱战久久久| 一区二区免费播放| 一区二区在线不卡| 日韩欧美国产高清91| 国产一卡二卡在线播放| 一区二区三区国产精品视频| 欧美精品九九| 国产1区2区3区| 午夜少妇性影院免费观看| 久久久一二区| 日本大码bbw肉感高潮| 国产一区二区在| 日本一区二区三区在线看| 狠狠色噜噜狠狠狠狠色综合久老司机| 国产乱人伦精品一区二区三区| 免费观看xxxx9999片| 国产精品一区二区日韩新区| 中文字幕一区二区三区乱码视频 | 欧美精品一区二区久久久| 国内精品久久久久影院日本| 99re国产精品视频| 国产一区二区资源| 97久久国产精品| 日韩欧美一区精品| 国产一区在线免费| 国产天堂一区二区三区| 午夜色影院| 久久天天躁狠狠躁亚洲综合公司| 香港日本韩国三级少妇在线观看| 97欧美精品| 国产精品亚发布| 一区精品二区国产|