日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種智能體的強化學習模型訓練方法及系統在審

專利信息
申請號: 202111326221.4 申請日: 2021-11-10
公開(公告)號: CN114117752A 公開(公告)日: 2022-03-01
發明(設計)人: 王正偉 申請(專利權)人: 杭州海康威視數字技術股份有限公司
主分類號: G06F30/20 分類號: G06F30/20;G06N20/00
代理公司: 北京柏杉松知識產權代理事務所(普通合伙) 11413 代理人: 項京;高鶯然
地址: 310051 浙*** 國省代碼: 浙江;33
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 智能 強化 學習 模型 訓練 方法 系統
【說明書】:

發明實施例提供了一種智能體的強化學習模型訓練方法及系統,上述方法包括:接收所述環境服務器發送的任意一個仿真環境包括的各個智能體的經驗數據;將相關聯的智能體的經驗數據進行混合并存儲于預設經驗池中;獲取混合后的經驗數據作為樣本數據,并基于所述樣本數據觸發待訓練強化學習模型的訓練,得到輸出的預測運行策略信息;將所述預測運行策略信息發送至所述環境服務器,以使所述環境服務器中對應的仿真環境執行對應的預測運行策略;如果達到預設的模型訓練結束條件,將當前的待訓練強化學習模型確定為訓練得到的目標強化學習模型訓練。即本發明實施例提出了一種新的支持多智能體、多仿真環境的高效的強化學習模型訓練框架。

技術領域

本發明涉及機器學習技術領域,特別是涉及一種智能體的強化學習模型訓練方法及系統。

背景技術

強化學習是機器學習的范式和方法論之一,可以用于描述和解決智能體在與環境的交互過程中如何通過學習策略達成回報最大化或實現特定目標的問題。其中,智能體是指具有自治性、社會性、反應性和預動性等基本特性的軟件程序或者一個實體(如人、車輛或機器人等)。智能體可以被嵌入到環境中,通過傳感器感知環境,然后通過效應器自治地作用于環境。

傳統的強化學習模型訓練方法為:單個智能體通過多組分布式采樣機采集仿真環境實例數據庫中的多組環境案例,基于采集的多組環境案例與服務端之間進行信息交互,輸出對應環境案例的軌跡數據。然后服務端再通過強化學習算法模塊初始化該智能體。

然而,傳統的強化學習模型訓練方法僅能實現單智能體的強化學習模型訓練,其并未給出任何支持多個智能體的訓練方法。

發明內容

本發明實施例的目的在于提供一種智能體的強化學習模型訓練方法及系統,以實現多個智能體的強化學習模型訓練。

第一方面,本發明實施例提供了一種智能體的強化學習模型訓練方法,應用于強化學習模型訓練系統中的中心訓練服務器,所述系統還包括至少一個環境服務器,每個所述環境服務器運行至少一個仿真環境,每個仿真環境包括至少一個智能體,智能體的總數大于1,所述方法包括:

接收所述環境服務器發送的任意一個仿真環境包括的各個智能體的經驗數據;其中,每個智能體的經驗數據包括:該智能體的狀態信息、所述環境服務器基于該智能體的狀態信息所確定的獎勵信息和該智能體所在的仿真環境的運行策略;

在所述經驗數據的數據量不小于第一預設數據量的情況下,將相關聯的智能體的經驗數據進行混合,并將混合后的經驗數據存儲于預設經驗池中;

在所述預設經驗池中的數據量達到第二預設數據量的情況下,從所述預設經驗池獲取混合后的經驗數據作為樣本數據,并基于所述樣本數據觸發待訓練強化學習模型的訓練,得到輸出的預測運行策略信息;其中,所述預測運行策略信息包括所述環境服務器中對應的仿真環境的預測運行策略;

將所述預測運行策略信息發送至所述環境服務器,以使:所述環境服務器中對應的仿真環境執行對應的預測運行策略,并在執行完所述預測運行策略向所述中心訓練服務器發送各個仿真環境的狀態信息;

接收所述環境服務器發送的各個仿真環境的狀態信息,并基于所述各個仿真環境的狀態信息,確定是否達到預設的模型訓練結束條件;

如果達到預設的模型訓練結束條件,將當前的待訓練強化學習模型確定為訓練得到的目標強化學習模型訓練;

如果未達到預設的模型訓練結束條件,返回所述接收所述環境服務器發送的任意一個仿真環境包括的各個智能體的經驗數據的步驟。

可選的,所述基于所述各個仿真環境的狀態信息,確定是否達到預設的模型訓練結束條件,包括:

基于所述各個仿真環境的狀態信息,確定所述環境服務器中各個仿真環境的是否均運行完成預設次數;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州海康威視數字技術股份有限公司,未經杭州海康威視數字技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202111326221.4/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美一区二区三区久久精品视| 欧美中文字幕一区二区| 亚洲区日韩| 国产精品三级久久久久久电影| 久久精品国产亚洲7777| 狠狠色噜噜狠狠狠狠2021免费 | 国产二区不卡| 国产一卡在线| 亚洲无人区码一码二码三码| 色婷婷综合久久久中文一区二区| 国语对白老女人一级hd| 99国产伦精品一区二区三区| 国产精品亚洲第一区| 中文丰满岳乱妇在线观看| 欧美综合在线一区| 欧美日韩一区不卡| 欧美片一区二区| 国产精品欧美一区二区视频| 国产麻豆一区二区三区在线观看| 久久97国产| 亚洲自偷精品视频自拍| 国产资源一区二区| 亚洲精品国产一区| 日韩中文字幕在线一区| 片毛片免费看| 国产精品1区2区| 色妞妞www精品视频| 日韩精品一区二区中文字幕| 午夜一区二区视频| 狠狠色很很在鲁视频| 国产午夜亚洲精品午夜鲁丝片| 狠狠色噜噜狠狠狠狠综合久| 精品久久久久久亚洲综合网 | 97人人澡人人爽91综合色| 91午夜在线观看| 国产91在线播放| 国产精品视频1区| 欧美人妖一区二区三区| 午夜黄色大片| 狠狠色噜噜狠狠狠888奇米| 国产福利精品一区| 国产精品中文字幕一区二区三区 | 视频国产一区二区| 日韩av在线播放网址| 欧美精品日韩精品| 国产一区二区三区黄| 99久久婷婷国产综合精品草原| 国产一区二区综合| 亚洲欧美日韩精品suv| 99国产伦精品一区二区三区| 日韩av在线一区| 国产欧美一区二区三区在线看| 国产日韩欧美亚洲| 午夜影院一区二区| 免费精品一区二区三区第35| xxxx18日本护士高清hd| 色噜噜日韩精品欧美一区二区 | 色婷婷精品久久二区二区6| 亚洲高清久久久| 国产一区亚洲一区| 97精品超碰一区二区三区| 久久久久久久亚洲视频| 欧美黑人巨大久久久精品一区| 国产视频一区二区视频| 91精品黄色| 国产精品久久久久久久岛一牛影视| 国产一区第一页| 中文字幕日本一区二区| 午夜影院试看五分钟| 欧美日韩中文不卡| 一区二区三区精品国产| 欧美3p激情一区二区三区猛视频 | 午夜影院h| 99久久精品免费视频| 精品国产精品亚洲一本大道| 黄毛片免费| 伊人久久婷婷色综合98网| 国产精品欧美一区二区三区| 欧美一区二区性放荡片| 小萝莉av| 性欧美一区二区| 国产精品入口麻豆九色| 91麻豆精品国产自产欧美一级在线观看| 精品国产一区二区三| 91精品国产高清一区二区三区| 亚洲精品国产一区二| 国产九九九精品视频| 日韩欧美高清一区| 国产精品视频久久| 4399午夜理伦免费播放大全| 性生交大片免费看潘金莲| 香港三日本8a三级少妇三级99| 日本一区二区三区免费视频| 99精品国产99久久久久久97| 国产日韩欧美精品| 性视频一区二区三区| 日韩中文字幕区一区有砖一区| 午夜黄色大片| 国产美女视频一区二区三区| 国产精品天堂网| 色噜噜狠狠色综合久| 国产呻吟久久久久久久92| 精品国产一区二区三区高潮视 | 国产日韩欧美91| 亚洲日韩欧美综合| 国产精品无码专区在线观看| 久久国产精品网站| 国产999久久久| 亚洲乱子伦| xxxx在线视频| 强制中出し~大桥未久10| 久久国产这里只有精品| 欧美一区二区久久久| 午夜看片网| 少妇性色午夜淫片aaa播放5| 日本一区二区电影在线观看| 91丝袜国产在线播放| 久久久久亚洲| 久久aⅴ国产欧美74aaa| 少妇高潮在线观看| 日韩精品中文字| 国产午夜伦理片| 久久精品国产亚| 久久婷婷国产麻豆91天堂徐州| 久久一区二区三区视频| 一区二区三区欧美日韩| 高清欧美xxxx| 日韩精品一区二区免费| 国产高清一区在线观看| 国产精品18久久久久久白浆动漫| **毛片免费| 精品国产一区在线| 国产午夜精品免费一区二区三区视频 | 欧美一区二区三区激情视频| 在线视频不卡一区| 色狠狠色狠狠综合| 国产乱码精品一区二区三区中文| 99精品国产一区二区三区麻豆 | 国产亚洲精品久久久久久久久动漫| 夜夜嗨av一区二区三区中文字幕 | 午夜无遮挡| 亚洲日韩aⅴ在线视频| 亚洲va久久久噜噜噜久久0| 日本一区二区在线电影| 性国产videofree极品| 国产麻豆一区二区三区精品| 国产www亚洲а∨天堂| xxxx在线视频| 亚洲三区在线| 国产91精品一区二区麻豆亚洲| 国产伦精品一区二区三区免| 夜夜躁日日躁狠狠久久av| 狠狠色狠狠色综合久久第一次| 偷拍久久精品视频| 亚洲欧美一二三| 国产高潮国产高潮久久久91| 激情久久一区二区| 亚洲欧美色图在线| 狠狠色狠狠色合久久伊人| 国产伦精品一区二区三区电影 | 午夜裸体性播放免费观看| 亚洲制服丝袜中文字幕| 欧美精品日韩| 日本精品三区| 日本五十熟hd丰满| 国产精品色在线网站 | 美国三级日本三级久久99| 中文字幕天天躁日日躁狠狠躁免费| 国产天堂一区二区三区| 色婷婷久久一区二区三区麻豆 | 国产97免费视频| 欧美国产一区二区在线| 日韩精品久久久久久久的张开腿让| 国产精品久久久久久久久久久新郎 | 亚洲国产欧美一区| 午夜精品一二三区| 久久精品入口九色| 国产一级片一区| 国产69精品99久久久久久宅男| 国产一级片大全| 一级午夜影院| 国产亚洲综合一区二区| 日韩av在线资源| 肥大bbwbbwbbw高潮| 男女午夜影院| 欧美日韩国产123| 又黄又爽又刺激久久久久亚洲精品| 亚洲国产精品肉丝袜久久| 欧美视屏一区| av午夜影院| 国产91一区| 亚洲国产精品二区| 日韩精品一二区| 国产中文字幕一区二区三区| 国产99视频精品免视看芒果| 91久久香蕉国产日韩欧美9色| 91麻豆精品国产91久久久久推荐资源| 国产69精品久久久久app下载| 日韩一区高清| 精品少妇一区二区三区| 狠狠插狠狠插| 国产乱人伦精品一区二区三区| 国产品久精国精产拍| 日韩精品午夜视频| 亚日韩精品| 国产亚洲综合一区二区| 亚洲国产欧洲综合997久久,| 国产一二区在线| 亚洲乱视频| 国语精品一区| 欧美在线一区二区视频| 国产精品视频久久久久久久| 99久久免费精品国产免费高清| 爱看av在线入口| 91久久精品国产91久久性色tv| 国内久久久| 色婷婷精品久久二区二区蜜臂av| 亚洲欧洲一区二区| 国产在线视频二区| 欧美在线观看视频一区二区| 高清欧美xxxx| 午夜影院黄色片| 国产精品影音先锋| av午夜电影| 精品国产仑片一区二区三区| 亚洲精品日韩色噜噜久久五月| 中文字幕欧美另类精品亚洲| 国产91丝袜在线熟| 国产欧美一区二区在线| 中文字幕在线一二三区| xxxx在线视频| 国产一级片子| 正在播放国产一区二区| 素人av在线| 久久一级精品视频| 国产在线精品一区二区在线播放| 欧美亚洲另类小说| 午夜av电影网| 国产一区二区午夜| 一色桃子av| 国产欧美日韩精品在线| 国产精品偷伦一区二区| 狠狠躁夜夜躁| 午夜免费网址| 性色av色香蕉一区二区三区| 欧美精品一卡二卡|