日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種智能體的強化學(xué)習(xí)模型訓(xùn)練方法及系統(tǒng)在審

專利信息
申請?zhí)枺?/td> 202111326221.4 申請日: 2021-11-10
公開(公告)號: CN114117752A 公開(公告)日: 2022-03-01
發(fā)明(設(shè)計)人: 王正偉 申請(專利權(quán))人: 杭州海康威視數(shù)字技術(shù)股份有限公司
主分類號: G06F30/20 分類號: G06F30/20;G06N20/00
代理公司: 北京柏杉松知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11413 代理人: 項京;高鶯然
地址: 310051 浙*** 國省代碼: 浙江;33
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 智能 強化 學(xué)習(xí) 模型 訓(xùn)練 方法 系統(tǒng)
【權(quán)利要求書】:

1.一種智能體的強化學(xué)習(xí)模型訓(xùn)練方法,其特征在于,應(yīng)用于強化學(xué)習(xí)模型訓(xùn)練系統(tǒng)中的中心訓(xùn)練服務(wù)器,所述系統(tǒng)還包括至少一個環(huán)境服務(wù)器,每個所述環(huán)境服務(wù)器運行至少一個仿真環(huán)境,每個仿真環(huán)境包括至少一個智能體,智能體的總數(shù)大于1,所述方法包括:

接收所述環(huán)境服務(wù)器發(fā)送的任意一個仿真環(huán)境包括的各個智能體的經(jīng)驗數(shù)據(jù);其中,每個智能體的經(jīng)驗數(shù)據(jù)包括:該智能體的狀態(tài)信息、所述環(huán)境服務(wù)器基于該智能體的狀態(tài)信息所確定的獎勵信息和該智能體所在的仿真環(huán)境的運行策略;

在所述經(jīng)驗數(shù)據(jù)的數(shù)據(jù)量不小于第一預(yù)設(shè)數(shù)據(jù)量的情況下,將相關(guān)聯(lián)的智能體的經(jīng)驗數(shù)據(jù)進行混合,并將混合后的經(jīng)驗數(shù)據(jù)存儲于預(yù)設(shè)經(jīng)驗池中;

在所述預(yù)設(shè)經(jīng)驗池中的數(shù)據(jù)量達到第二預(yù)設(shè)數(shù)據(jù)量的情況下,從所述預(yù)設(shè)經(jīng)驗池獲取混合后的經(jīng)驗數(shù)據(jù)作為樣本數(shù)據(jù),并基于所述樣本數(shù)據(jù)觸發(fā)待訓(xùn)練強化學(xué)習(xí)模型的訓(xùn)練,得到輸出的預(yù)測運行策略信息;其中,所述預(yù)測運行策略信息包括所述環(huán)境服務(wù)器中對應(yīng)的仿真環(huán)境的預(yù)測運行策略;

將所述預(yù)測運行策略信息發(fā)送至所述環(huán)境服務(wù)器,以使:所述環(huán)境服務(wù)器中對應(yīng)的仿真環(huán)境執(zhí)行對應(yīng)的預(yù)測運行策略,并在執(zhí)行完所述預(yù)測運行策略向所述中心訓(xùn)練服務(wù)器發(fā)送各個仿真環(huán)境的狀態(tài)信息;

接收所述環(huán)境服務(wù)器發(fā)送的各個仿真環(huán)境的狀態(tài)信息,并基于所述各個仿真環(huán)境的狀態(tài)信息,確定是否達到預(yù)設(shè)的模型訓(xùn)練結(jié)束條件;

如果達到預(yù)設(shè)的模型訓(xùn)練結(jié)束條件,將當(dāng)前的待訓(xùn)練強化學(xué)習(xí)模型確定為訓(xùn)練得到的目標(biāo)強化學(xué)習(xí)模型訓(xùn)練;

如果未達到預(yù)設(shè)的模型訓(xùn)練結(jié)束條件,返回所述接收所述環(huán)境服務(wù)器發(fā)送的任意一個仿真環(huán)境包括的各個智能體的經(jīng)驗數(shù)據(jù)的步驟。

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述各個仿真環(huán)境的狀態(tài)信息,確定是否達到預(yù)設(shè)的模型訓(xùn)練結(jié)束條件,包括:

基于所述各個仿真環(huán)境的狀態(tài)信息,確定所述環(huán)境服務(wù)器中各個仿真環(huán)境的是否均運行完成預(yù)設(shè)次數(shù);

如果所述環(huán)境服務(wù)器中各個仿真環(huán)境均運行完成預(yù)設(shè)次數(shù),確定達到預(yù)設(shè)的模型訓(xùn)練結(jié)束條件。

3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述在所述經(jīng)驗數(shù)據(jù)的數(shù)據(jù)量不小于第一預(yù)設(shè)數(shù)據(jù)量的情況下,將相關(guān)聯(lián)的智能體的經(jīng)驗數(shù)據(jù)進行混合,并將混合后的經(jīng)驗數(shù)據(jù)存儲于預(yù)設(shè)經(jīng)驗池中,包括:

從所述環(huán)境服務(wù)器獲取各個智能體之間的關(guān)聯(lián)關(guān)系;

在所述經(jīng)驗數(shù)據(jù)的數(shù)據(jù)量不小于第一預(yù)設(shè)數(shù)據(jù)量的情況下,針對每個智能體,根據(jù)所述關(guān)聯(lián)關(guān)系,將與該智能體相關(guān)聯(lián)的智能體的經(jīng)驗數(shù)據(jù)和該智能體的經(jīng)驗數(shù)據(jù)進行混合,得到混合經(jīng)驗數(shù)據(jù),并存儲于該智能體對應(yīng)的預(yù)設(shè)經(jīng)驗池中。

4.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述接收所述環(huán)境服務(wù)器發(fā)送的任意一個仿真環(huán)境包括的各個智能體的經(jīng)驗數(shù)據(jù)之前,還包括:

獲取各個所述環(huán)境服務(wù)器的配置信息;

基于所述配置信息選取待配置環(huán)境服務(wù)器;

基于該待配置環(huán)境服務(wù)器的配置信息,創(chuàng)建所述中心訓(xùn)練服務(wù)器與該待配置環(huán)境服務(wù)器之間的SSH連接;

通過SSH連接向該待配置環(huán)境服務(wù)器發(fā)送仿真環(huán)境啟動指令,以使該待配置環(huán)境服務(wù)器執(zhí)行根據(jù)所述環(huán)境啟動指令啟動一個仿真環(huán)境,并在該仿真環(huán)境啟動后所述中心訓(xùn)練服務(wù)器返回該仿真環(huán)境對應(yīng)的傳輸端口信息的步驟;

基于所述傳輸端口信息,創(chuàng)建所述中心訓(xùn)練服務(wù)器與該仿真環(huán)境之間的信息傳輸通道,并更新該待配置環(huán)境服務(wù)器中運行的仿真環(huán)境的數(shù)量;

如果該待配置環(huán)境服務(wù)器中運行的仿真環(huán)境的數(shù)量未達到該待配置環(huán)境服務(wù)器對應(yīng)的限制環(huán)境數(shù)量,返回執(zhí)行所述通過SSH連接向該待配置環(huán)境服務(wù)器發(fā)送仿真環(huán)境啟動指令的步驟;否則,停止針對該待配置環(huán)境服務(wù)器創(chuàng)建仿真環(huán)境,并針對剩余的環(huán)境服務(wù)器返回執(zhí)行所述基于所述配置信息選取待配置環(huán)境服務(wù)器的步驟,直至每個環(huán)境服務(wù)器中運行的仿真環(huán)境的數(shù)量均達到該環(huán)境服務(wù)器對應(yīng)的限制環(huán)境數(shù)量。

5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述接收所述環(huán)境服務(wù)器發(fā)送的任意一個仿真環(huán)境包括的各個智能體的經(jīng)驗數(shù)據(jù),包括:

通過所述環(huán)境服務(wù)器中各個仿真環(huán)境與所述中心訓(xùn)練服務(wù)器之間的信息傳輸通道,接收所述環(huán)境服務(wù)器發(fā)送的任意一個仿真環(huán)境包括的各個智能體的經(jīng)驗數(shù)據(jù)。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州海康威視數(shù)字技術(shù)股份有限公司,未經(jīng)杭州海康威視數(shù)字技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202111326221.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日韩精品久久久久久久酒店| 99久久婷婷国产精品综合| 5g影院天天爽入口入口| 538国产精品一区二区| 国产伦精品一区二区三区无广告| 国产精品中文字幕一区二区三区| 99国产精品久久久久老师| 国产欧美日韩va另类在线播放| 国产一区二区三区黄| 中文字幕制服狠久久日韩二区 | 午夜叫声理论片人人影院| 99日韩精品视频| 午夜一区二区视频| 正在播放国产一区二区| 亚洲伊人久久影院| 亚洲天堂国产精品| 99久久夜色精品国产网站| 欧美性受xxxx狂喷水| 最新国产精品自拍| 国产一区二区资源| 国产一区二区伦理| 午夜亚洲国产理论片一二三四| 青苹果av| 欧美在线视频一二三区| 国产大片黄在线观看私人影院| 国产69精品久久久久999小说| 狠狠色依依成人婷婷九月| 国产精品久久人人做人人爽| 亚洲精品乱码久久久久久蜜糖图片| 在线国产91| 欧美一区二区三区免费观看视频| 亚洲精欧美一区二区精品| 亚洲福利视频二区| 91高清一区| 国产精品日韩精品欧美精品| 三级视频一区| 欧美一区二区性放荡片| 91久久精品在线| 久久综合久久自在自线精品自| 日韩av中文字幕一区二区| 久久久久久久久亚洲精品| 好吊妞国产欧美日韩免费观看网站| 欧美一区二区三区久久精品视 | 日本三级不卡视频| 日韩中文字幕一区二区在线视频 | 日韩av在线高清| 鲁丝一区二区三区免费| 国产69精品久久久久久久久久| 欧美日韩九区| 91精品国产九九九久久久亚洲 | 精品久久香蕉国产线看观看gif| 亚洲欧美国产中文字幕| 91精品国产综合久久福利软件| 国产1区2区3区| xxxxhd欧美| 久久精品com| 日韩欧美中文字幕一区| 国产欧美一区二区在线观看| 日韩av在线免费电影| 亚洲精品日日夜夜| 素人av在线| 国产综合久久精品| 欧美精品一区二区三区在线四季| 午夜影院试看五分钟| 国产精品日韩一区二区| 黄色av免费| 欧美在线一级va免费观看| 亚洲精品www久久久久久广东| 久久久99精品国产一区二区三区| 国产精品国产三级国产播12软件| 国产一区日韩一区| 99久久www免费| 欧美日韩激情一区| 欧美乱妇高清无乱码免费| 国产精品视频久久久久久| 狠狠色狠狠色综合婷婷tag| 国产性生交xxxxx免费| 国产欧美亚洲精品第一区软件| 国产欧美一区二区精品久久| 国产高清精品一区| 国产午夜精品一区| 欧美一区二区三区片| 国产69精品久久久| 亚洲精品日本久久一区二区三区 | 91麻豆精品一区二区三区| 国产aⅴ一区二区| 国产亚洲精品久久久久久久久动漫| 丰满岳乱妇在线观看中字| 波多野结衣女教师30分钟| 精品国产一区二| 国产婷婷一区二区三区久久| 国产日韩欧美精品一区二区| 久精品国产| 538国产精品| 久久精品色欧美aⅴ一区二区| 久久99精品国产麻豆婷婷洗澡 | 91精品视频一区二区三区| 国产精品欧美久久久久一区二区| 国产一区二区资源| 国产精品99久久久久久宅男| 欧美一区二区三区在线视频观看| 国产一二区视频| 国产精品99一区二区三区| 国产影院一区二区| 国产免费一区二区三区四区五区| 午夜激情电影院| 日韩不卡毛片| 99日韩精品视频| 久久精品亚洲一区二区三区画质| 精品国产一区二| 亚洲欧美日韩国产综合精品二区| 天啦噜国产精品亚洲精品| 欧美一区二区激情三区| 三上悠亚亚洲精品一区二区| 国产天堂第一区| 久久久久久亚洲精品| 国产69精品久久| 一区二区三区欧美日韩| 国产精品6699| 日韩精品一区二区免费| 欧美亚洲视频二区| 亚洲欧洲日本在线观看| 少妇bbwbbwbbw高潮| 国产一区二区三区在线电影| 亚洲精品无吗| 欧美综合国产精品久久丁香| 亚洲欧美色一区二区三区| aaaaa国产欧美一区二区| 国产一区二区三区精品在线| 国产91久| 国产欧美日韩综合精品一| 国产欧美一区二区精品婷| 国产亚洲精品久久网站| 国产精品一区二| 国内久久久| 亚洲欧美国产中文字幕| 欧美日韩久久一区二区| 狠狠色成色综合网| 国产理论一区二区三区| 91麻豆精品国产91久久久更新资源速度超快| 国产aⅴ精品久久久久久| 欧美国产一区二区在线| 亚洲精品日韩色噜噜久久五月| 羞羞视频网站免费| 99久久国产综合精品麻豆| 国产电影精品一区| 中文在线√天堂| 国产一区日韩欧美| 欧美一级久久精品| 国产乱xxxxx国语对白| 国产精品电影一区二区三区| 国产在线不卡一| 国产一区2| 99久久免费精品国产男女性高好| 97久久精品一区二区三区观看| 亚洲精品一区二区三区98年| 91一区二区三区在线| 国产精品人人爽人人做av片| 91超薄丝袜肉丝一区二区| 欧美日韩久久一区二区| 日本一二三区视频在线| 国产伦精品一区二区三区免费下载| 午夜电影一区二区| 国产91综合一区在线观看| 欧美一区二区性放荡片| 狠狠色噜噜综合社区| 艳妇荡乳欲伦2| 国产床戏无遮挡免费观看网站| 午夜码电影| 国产精品视频一区二区在线观看 | 亚洲五码在线| 欧美中文字幕一区二区三区| 午夜黄色一级电影| 国产韩国精品一区二区三区| 欧美日韩九区| 国产色午夜婷婷一区二区三区 | 国产精品午夜一区二区| 国产欧美视频一区二区三区| 在线观看黄色91| 狠狠躁日日躁狂躁夜夜躁| 国产精品麻豆一区二区| 久久久久国产一区二区三区不卡| 一级黄色片免费网站| 午夜毛片在线看| 91精品一区二区中文字幕| 亚洲精品丝袜| 国产一区二区三区精品在线| 欧美日韩亚洲三区| 亚洲欧美国产中文字幕| 国产人成看黄久久久久久久久| 日韩精品中文字幕一区二区三区 | 日韩精品一区二区av| 91精品美女| 免费午夜片| 国产精品美女久久久免费| 国产乱对白刺激视频在线观看| 午夜毛片在线| 激情欧美日韩| 狠狠色狠狠色88综合日日91| 91精品国产综合久久国产大片 | 人人要人人澡人人爽人人dvd| 国产精品久久久久久一区二区三区| 97久久超碰国产精品红杏| 91国产一区二区| 午夜少妇性影院免费观看| 色一情一乱一乱一区免费网站| 久久国产免费视频| 欧美一区二区久久| 国产真实乱偷精品视频免| 一区二区三区欧美精品| 91av一区二区三区| 国产另类一区| 国产精品香蕉在线的人| 国产欧美二区| 97国产婷婷综合在线视频,| 久久一二区| 免费看性生活片| 91国产一区二区| 91精品美女| 午夜肉伦伦影院九七影网| 91丝袜国产在线播放| 国产一区二区影院| 国产www亚洲а∨天堂| 久久国产精品波多野结衣| 日韩午夜三级| 国产精品一区在线观看| 国产一区正在播放| 国产精品欧美一区乱破| 91福利视频免费观看| 色噜噜狠狠色综合中文字幕 | 亚洲欧美一区二区三区不卡| 欧美精品免费看| 国产欧美亚洲精品| 国内自拍偷拍一区| 991本久久精品久久久久| 亚洲国产精品91| 国产91在线播放| 亚洲一区欧美| 国产二区三区视频| 三级视频一区| 日本一区二区三区在线视频| 国产欧美一区二区三区免费视频| 在线国产精品一区二区| 私人影院av| 欧美一区二区三区在线免费观看 | 韩日av一区二区三区|