日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于強(qiáng)化學(xué)習(xí)的環(huán)境建模方法在審

專利信息
申請(qǐng)?zhí)枺?/td> 202310366576.9 申請(qǐng)日: 2023-04-07
公開(公告)號(hào): CN116579231A 公開(公告)日: 2023-08-11
發(fā)明(設(shè)計(jì))人: 蔣新成;高陽;霍靜;李文斌;楊光;解宇;韓東 申請(qǐng)(專利權(quán))人: 南京大學(xué)深圳研究院;江蘇萬維艾斯網(wǎng)絡(luò)智能產(chǎn)業(yè)創(chuàng)新中心有限公司
主分類號(hào): G06F30/27 分類號(hào): G06F30/27;G06N3/092
代理公司: 南京泰普專利代理事務(wù)所(普通合伙) 32360 代理人: 柯興宇
地址: 518000 廣東省深圳市南山*** 國省代碼: 廣東;44
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 強(qiáng)化 學(xué)習(xí) 環(huán)境 建模 方法
【權(quán)利要求書】:

1.一種基于強(qiáng)化學(xué)習(xí)的環(huán)境建模方法,其特征在于,包括如下步驟:

步驟1,仿真場(chǎng)景選擇功能,根據(jù)目標(biāo)任務(wù)的類型選擇仿真環(huán)境,包括應(yīng)急管理、金融期貨和交通控制;

步驟2,仿真環(huán)境建模功能,根據(jù)所述目標(biāo)任務(wù)的類型判斷是否存在專家先驗(yàn)認(rèn)知,將所述目標(biāo)任務(wù)劃分到人工輔助模式或智能模式進(jìn)行處理,經(jīng)過處理最后均得到環(huán)境文件或環(huán)境模型產(chǎn)出;

步驟3,環(huán)境模型存儲(chǔ)功能,環(huán)境模型存儲(chǔ)庫存儲(chǔ)所有產(chǎn)出的環(huán)境模型文件,并有選擇的供后續(xù)多智能體強(qiáng)化學(xué)習(xí)任務(wù)調(diào)用學(xué)習(xí),以提升多智能體強(qiáng)化學(xué)習(xí)算法的高效學(xué)習(xí)。

2.根據(jù)權(quán)利要求1所述的一種基于強(qiáng)化學(xué)習(xí)的環(huán)境建模方法,其特征在于,所述步驟1中仿真環(huán)境的選擇具體為:

S1.1預(yù)設(shè)置的應(yīng)急管理環(huán)境,包括無人機(jī)設(shè)備在緊急事件發(fā)生前的預(yù)警,發(fā)生后的應(yīng)急處理;

S1.2預(yù)設(shè)置的金融期貨環(huán)境,包括金融市場(chǎng)環(huán)境建模,資產(chǎn)配置環(huán)境建模,設(shè)計(jì)期貨合約的多空交易;

S1.3預(yù)設(shè)置的交通控制環(huán)境,包括路口交通燈信號(hào)控制環(huán)境建模,對(duì)車輛行駛軌跡優(yōu)化,設(shè)計(jì)不同環(huán)境下的智能交通決策。

3.根據(jù)權(quán)利要求1所述的一種基于強(qiáng)化學(xué)習(xí)的環(huán)境建模方法,其特征在于,所述步驟2中劃分不同模式的具體步驟為:

S2.1判斷所述目標(biāo)任務(wù)的類型是否存在專家先驗(yàn)認(rèn)知;

S2.2若存在專家先驗(yàn)認(rèn)知,則通過人工輔助模式進(jìn)行環(huán)境建模,人為構(gòu)建多智能體目標(biāo)任務(wù),通過課程學(xué)習(xí)創(chuàng)建難度逐漸增加的源任務(wù)環(huán)境文件;

S2.3若目標(biāo)任務(wù)不存在專家先驗(yàn)認(rèn)知,則通過智能模式進(jìn)行環(huán)境建模,借助仿真環(huán)境建模模塊內(nèi)置算法庫來隱式約簡多智能體目標(biāo)任務(wù)或是學(xué)習(xí)環(huán)境模型。

4.根據(jù)權(quán)利要求1所述的一種基于強(qiáng)化學(xué)習(xí)的環(huán)境建模方法,其特征在于,所述步驟3具體為:

S3.1環(huán)境模型存儲(chǔ)庫存儲(chǔ)了包括人工輔助模式中的可執(zhí)行的任務(wù)文件,智能模式中的交互檢測(cè)模型學(xué)習(xí)模塊與環(huán)境動(dòng)力學(xué)模型學(xué)習(xí)模塊;

S3.2環(huán)境模型存儲(chǔ)庫中的模型文件將被后續(xù)多智能體強(qiáng)化學(xué)習(xí)任務(wù)調(diào)用,提升多智能體強(qiáng)化學(xué)習(xí)算法的高效學(xué)習(xí)。

5.根據(jù)權(quán)利要求3所述的一種基于強(qiáng)化學(xué)習(xí)的環(huán)境建模方法,其特征在于,所述步驟2中人工輔助模式下的執(zhí)行步驟為:

S2.1.1用戶根據(jù)環(huán)境父類文件編寫源任務(wù)環(huán)境文件,通過仿真環(huán)境可行性驗(yàn)證功能確定環(huán)境文件的可行性;

S2.1.2若可行,則在仿真環(huán)境生成頁面上傳到系統(tǒng)中;

S2.1.3若不可行,則需要重新修改并再次提交驗(yàn)證。

6.根據(jù)權(quán)利要求5所述的一種基于強(qiáng)化學(xué)習(xí)的環(huán)境建模方法,其特征在于,所述步驟2中人工輔助模式下創(chuàng)建源任務(wù)環(huán)境文件的步驟如下:

S2.2.1根據(jù)需求定義源任務(wù);

S2.2.2設(shè)計(jì)任務(wù)集合,所述任務(wù)集合為若干與所述源任務(wù)相似但難度遞增的任務(wù);

S2.2.3使用基于仿真的方法來生成模擬數(shù)據(jù),需要記錄所述每個(gè)任務(wù)的難度級(jí)別和參數(shù);

S2.2.4構(gòu)建所述每個(gè)任務(wù)的環(huán)境文件,需要根據(jù)所述每個(gè)任務(wù)的難度級(jí)別逐步調(diào)整任務(wù)參數(shù)來逐步增加難度。

7.根據(jù)權(quán)利要求3所述的一種基于強(qiáng)化學(xué)習(xí)的環(huán)境建模方法,其特征在于,所述步驟2中智能模式下的執(zhí)行步驟為:

S2.3.1調(diào)用仿真環(huán)境建模模塊的算法庫開展學(xué)習(xí),用戶選擇是否進(jìn)行信息交互檢測(cè);

S2.3.2選擇是,進(jìn)入交互檢測(cè)模型學(xué)習(xí)模塊,模塊內(nèi)置算法將與目標(biāo)任務(wù)場(chǎng)景交互適當(dāng)回合數(shù),開展多智能體間博弈結(jié)構(gòu)學(xué)習(xí);學(xué)習(xí)完成后,該模型自動(dòng)保存到系統(tǒng)中;

S2.3.3選擇否,進(jìn)入環(huán)境動(dòng)力學(xué)模型學(xué)習(xí)模塊,模塊內(nèi)置算法將與目標(biāo)任務(wù)場(chǎng)景交互適當(dāng)回合數(shù),開展環(huán)境智能模型學(xué)習(xí);學(xué)習(xí)完成后,該模型自動(dòng)保存到系統(tǒng)中。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京大學(xué)深圳研究院;江蘇萬維艾斯網(wǎng)絡(luò)智能產(chǎn)業(yè)創(chuàng)新中心有限公司,未經(jīng)南京大學(xué)深圳研究院;江蘇萬維艾斯網(wǎng)絡(luò)智能產(chǎn)業(yè)創(chuàng)新中心有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202310366576.9/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 欧美精品五区| 91一区二区在线观看| 日韩av中文字幕第一页| 午夜特级片| 欧美一区免费| 91麻豆产精品久久久| 欧美一区二区三区免费观看视频| 国产免费一区二区三区四区五区| 国产精品一区二区人人爽| 国产精品一区一区三区| 亲子乱子伦xxxx| 韩日av一区二区| 国产69精品久久久久按摩| 午夜剧场一区| 欧美综合在线一区| 精品午夜电影| 国产精品高潮呻吟三区四区| 亚洲国产精品女主播| 狠狠色丁香久久综合频道 | 国产精品一二三区视频出来一| 久久久久国产精品一区二区三区| 久久精品国产一区二区三区不卡| 亚洲国产精品97久久无色| 亚洲国产精品二区| 日本大码bbw肉感高潮| 97人人澡人人爽人人模亚洲 | 欧美日韩国产一级| 久久免费视频一区二区| 精品国产1区2区3区| 偷拍久久精品视频| 国产偷国产偷亚洲清高| 欧美日韩激情在线| 国产一区二区三区乱码| 国产欧美一区二区三区在线看| 日韩av一区不卡| 97人人澡人人爽91综合色| 国产69精品久久久久孕妇不能看 | 国产1区2区3区| 91偷拍网站| 亚洲一区欧美| 国产一区二区高潮| 玖玖国产精品视频| 国产精欧美一区二区三区久久| 中文无码热在线视频| 国产精品一区二区av日韩在线| 国产jizz18女人高潮| 久久99久久99精品免观看软件| 国产精品伦一区二区三区视频| 亚洲精品一区二区另类图片| xx性欧美hd| 国产精品理人伦一区二区三区 | 激情久久一区| 国产乱码精品一区二区三区介绍| 99久久精品免费视频| 国产99久久九九精品| 又黄又爽又刺激久久久久亚洲精品| 99国产午夜精品一区二区天美| 99精品黄色| 日韩精品中文字幕在线| 欧美精品在线观看一区二区| 国产精品一区二区在线观看 | 日本午夜久久| 亚洲欧美一卡二卡| 浪潮av色| 日韩av不卡一区| 国产亚洲精品久久网站| 91精品免费观看| 91超碰caoporm国产香蕉| 国产精品网站一区| 538国产精品一区二区免费视频| 男女午夜影院| 亚洲精品乱码久久久久久麻豆不卡| 日本美女视频一区二区| 精品久久久久一区二区| 精品国产九九| 午夜剧场一区| 国产精品久久久久久久岛一牛影视| 99精品一级欧美片免费播放| 国产精品久久久久久久岛一牛影视| 日韩欧美国产另类| 日本午夜精品一区二区三区| 亚洲欧美日韩精品在线观看|