日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]用于強(qiáng)化學(xué)習(xí)過程的動作輸出方法、網(wǎng)絡(luò)訓(xùn)練方法及裝置在審

專利信息
申請?zhí)枺?/td> 202110376318.X 申請日: 2021-04-07
公開(公告)號: CN113112016A 公開(公告)日: 2021-07-13
發(fā)明(設(shè)計)人: 余昊男;徐偉;張海超 申請(專利權(quán))人: 北京地平線機(jī)器人技術(shù)研發(fā)有限公司
主分類號: G06N3/08 分類號: G06N3/08;G06N3/04
代理公司: 北京思源智匯知識產(chǎn)權(quán)代理有限公司 11657 代理人: 毛麗琴
地址: 100094 北京市海淀*** 國省代碼: 北京;11
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 用于 強(qiáng)化 學(xué)習(xí) 過程 動作 輸出 方法 網(wǎng)絡(luò) 訓(xùn)練 裝置
【說明書】:

公開了一種用于強(qiáng)化學(xué)習(xí)過程的動作輸出方法、網(wǎng)絡(luò)訓(xùn)練方法及裝置。該用于強(qiáng)化學(xué)習(xí)過程的動作輸出方法,包括:確定當(dāng)前時間點(diǎn)智能體所處環(huán)境的第一狀態(tài);基于第一狀態(tài)和上一時間點(diǎn)智能體輸出至環(huán)境的第一歷史動作,確定當(dāng)前時間點(diǎn)針對智能體的第一候選動作;從第一候選動作和第一歷史動作中,選擇一個目標(biāo)動作;控制智能體在當(dāng)前時間點(diǎn)輸出目標(biāo)動作。本公開的實(shí)施例中,同一個動作可以被二元切換決策重復(fù)多次,以達(dá)到該動作跨越多個時間點(diǎn)的效果,從而縮短任務(wù)時間線,進(jìn)而使獎勵分配問題得到簡化,這樣有助于保證深度強(qiáng)化學(xué)習(xí)賦能的智能體在實(shí)際應(yīng)用場景中的落地使用。

技術(shù)領(lǐng)域

本公開涉及強(qiáng)化學(xué)習(xí)技術(shù)領(lǐng)域,尤其涉及一種用于強(qiáng)化學(xué)習(xí)過程的動作輸出方法、網(wǎng)絡(luò)訓(xùn)練方法及裝置。

背景技術(shù)

目前,強(qiáng)化學(xué)習(xí)的使用越來越普遍,在使用強(qiáng)化學(xué)習(xí)方法時,面對一個新的控制任務(wù),機(jī)器人等智能體可能需要大量的試錯,花費(fèi)大量的時間,在此過程中冒著硬件損壞的危險,才能通過獎勵信號學(xué)會任務(wù)。需要說明的是,強(qiáng)化學(xué)習(xí)方法需要解決獎勵分配問題(credit assignment problem),通常情況下,任務(wù)的時間線越長,獎勵分配問題越難解決,這樣會影響到深度強(qiáng)化學(xué)習(xí)賦能的智能體在實(shí)際應(yīng)用場景中的落地使用。

發(fā)明內(nèi)容

為了解決上述技術(shù)問題,提出了本公開。本公開的實(shí)施例提供了一種用于強(qiáng)化學(xué)習(xí)過程的動作輸出方法、網(wǎng)絡(luò)訓(xùn)練方法及裝置。

根據(jù)本公開實(shí)施例的一個方面,提供了一種用于強(qiáng)化學(xué)習(xí)過程的動作輸出方法,包括:

確定當(dāng)前時間點(diǎn)智能體所處環(huán)境的第一狀態(tài);

基于所述第一狀態(tài)和上一時間點(diǎn)所述智能體輸出至所述環(huán)境的第一歷史動作,確定當(dāng)前時間點(diǎn)針對所述智能體的第一候選動作;

從所述第一候選動作和所述第一歷史動作中,選擇一個目標(biāo)動作;

控制所述智能體在當(dāng)前時間點(diǎn)輸出所述目標(biāo)動作。

根據(jù)本公開實(shí)施例的另一個方面,提供了一種網(wǎng)絡(luò)訓(xùn)練方法,包括:

獲取歷史數(shù)據(jù),所獲取的歷史數(shù)據(jù)中記載有第一時間點(diǎn)智能體所處環(huán)境的第二狀態(tài)和第二時間點(diǎn)所述智能體輸出至所述環(huán)境的第二歷史動作,所述第一時間點(diǎn)為所述第二時間點(diǎn)的下一時間點(diǎn);

基于所述第二狀態(tài)和所述第二歷史動作,經(jīng)由第二網(wǎng)絡(luò)確定所述第一時間點(diǎn)針對所述智能體的第二候選動作;

基于所述第二狀態(tài)、所述第二歷史動作和所述第二候選動作,確定所述第二候選動作的被選中概率;

基于所述第二狀態(tài)、所述第二歷史動作、所述第二候選動作和所述被選中概率,確定所述第二網(wǎng)絡(luò)的參數(shù)梯度;

基于所述參數(shù)梯度,對所述第二網(wǎng)絡(luò)進(jìn)行訓(xùn)練。

根據(jù)本公開實(shí)施例的再一個方面,提供了一種用于強(qiáng)化學(xué)習(xí)過程的動作輸出裝置,包括:

第一確定模塊,用于確定當(dāng)前時間點(diǎn)智能體所處環(huán)境的第一狀態(tài);

第二確定模塊,用于基于所述第一確定模塊確定的所述第一狀態(tài)和上一時間點(diǎn)所述智能體輸出至所述環(huán)境的第一歷史動作,確定當(dāng)前時間點(diǎn)針對所述智能體的第一候選動作;

選擇模塊,用于從所述第二確定模塊確定的所述第一候選動作和所述第一歷史動作中,選擇一個目標(biāo)動作;

輸出模塊,用于控制所述智能體在當(dāng)前時間點(diǎn)輸出所述選擇模塊選擇的所述目標(biāo)動作。

根據(jù)本公開實(shí)施例的又一個方面,提供了一種網(wǎng)絡(luò)訓(xùn)練裝置,包括:

第二獲取模塊,用于獲取歷史數(shù)據(jù),所獲取的歷史數(shù)據(jù)中記載有第一時間點(diǎn)智能體所處環(huán)境的第二狀態(tài)和第二時間點(diǎn)所述智能體輸出至所述環(huán)境的第二歷史動作,所述第一時間點(diǎn)為所述第二時間點(diǎn)的下一時間點(diǎn);

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京地平線機(jī)器人技術(shù)研發(fā)有限公司,未經(jīng)北京地平線機(jī)器人技術(shù)研發(fā)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110376318.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91麻豆精品国产91久久久更新时间| 国精偷拍一区二区三区| 欧美日韩一区不卡| 色偷偷一区二区三区| 99精品偷拍视频一区二区三区| 狠狠色狠狠色88综合日日91| 国产精品白浆视频| 91精品久久久久久| 亚洲国产精品精品| 国产99久久九九精品免费| 欧美乱妇在线观看| 精品国产一区二区三区免费| 97精品国产aⅴ7777| 亚洲精品乱码久久久久久国产主播| 日韩欧美激情| 欧美国产一区二区三区激情无套 | bbbbb女女女女女bbbbb国产| 国产99久久久久久免费看| 久久午夜鲁丝片| 日日噜噜夜夜狠狠| 久久久99精品国产一区二区三区| 国产一区二区片| 男女视频一区二区三区| 国产国产精品久久久久| 激情久久影院| 夜夜嗨av一区二区三区中文字幕| 欧美一级免费在线视频| 国产精品久久99| 欧美精品国产一区| 蜜臀久久99精品久久一区二区| 欧美hdfree性xxxx| 综合久久一区| 亚洲一区中文字幕| av午夜影院| 国产一区二区中文字幕| 国模一区二区三区白浆| 久精品国产| 日韩欧美国产精品一区| 久久不卡一区| 国产日韩欧美一区二区在线观看| 国产精品免费一区二区区| 日韩亚洲欧美一区| 欧美激情在线一区二区三区| 91精品久久天干天天天按摩| 91久久香蕉国产日韩欧美9色| 亚洲欧美制服丝腿| 久久精品国语| 日韩精品乱码久久久久久| 午夜爽爽视频| 国内揄拍国产精品| 少妇厨房与子伦在线观看| 久久精品入口九色| 欧美精品在线一区二区| 91偷自产一区二区三区精品| 国产乱码精品一区二区三区介绍| 69久久夜色精品国产69–| 91国产一区二区| 中文字幕av一区二区三区四区| 欧美激情午夜| 亚洲一区二区国产精品| 日韩精品一区二区不卡| 91午夜精品一区二区三区| 日本一区二区三区免费播放| 国产欧美精品一区二区三区-老狼| 亚洲精品色婷婷| 亚洲1区在线观看| 久久久久国产精品嫩草影院| 国产免费一区二区三区四区五区| 精品一区二区三区视频?| 国产日韩欧美二区| 国产精品视频久久久久久久| 精品久久久久久亚洲综合网| 国产精品视频久久| 日日噜噜夜夜狠狠| 久久国产欧美一区二区三区精品| 一二三区欧美| 日韩欧美中文字幕一区| 日韩女女同一区二区三区| 亚洲少妇中文字幕| 色午夜影院| 久久国产精品精品国产| 91精品免费观看| 扒丝袜网www午夜一区二区三区| 国产69精品久久| 国产91麻豆视频| 欧美一区二区三区片| 久久久久久中文字幕 | 在线播放国产一区| 欧美日韩一级二级三级| 欧美精品日韩| 亚洲美女在线一区| 国产一区欧美一区| 欧美一区二区色| 国产区一区| 亚洲国产精品入口| 91一区二区三区视频| 国产一区日韩欧美| 精品中文久久| 国产婷婷色一区二区三区在线| 国产电影一区二区三区下载| 日韩精品一区二区三区中文字幕| 久久99国产精品久久99| 91精品视频免费在线观看| 欧美高清xxxxx| 日韩精品福利片午夜免费观看| 欧美日韩一区电影| 久久99亚洲精品久久99果| 狠狠色噜噜狠狠狠888奇米| 久久69视频| 国产v亚洲v日韩v欧美v片| 夜夜躁日日躁狠狠躁| 精品国产乱码久久久久久软件影片| 日韩精品一区二区三区四区在线观看 | 91精品久久久久久综合五月天 | 国产极品美女高潮无套久久久| 好吊妞国产欧美日韩软件大全| 97久久精品一区二区三区观看| 小萝莉av| 国产毛片精品一区二区| 国产精品亚洲а∨天堂123bt| 欧美在线观看视频一区二区| 丰满岳乱妇bd在线观看k8| 销魂美女一区二区| 久久精品手机视频| 国产日产欧美一区| 午夜影院一区二区| 午夜黄色一级电影| 国产精品一区二区人人爽| 国产美女三级无套内谢| 国产69精品久久| 国产精品伦一区二区三区在线观看 | 亚欧精品在线观看| 欧美一区二区三区爽大粗免费 | 日韩av在线免费电影| 欧美一区二区三区久久| 国产男女乱淫真高清视频免费| 欧美二区在线视频| 亚洲精品乱码久久久久久麻豆不卡| 91精品国产影片一区二区三区| 亚洲精品国产一区二区三区| 91亚洲欧美强伦三区麻豆| 亚洲精品久久久中文| 欧美在线观看视频一区二区三区| 亚洲va国产| 欧美日韩一级在线观看| 欧美一区二区色| 亚洲欧洲一区| 亚洲精品乱码久久久久久麻豆不卡| 蜜臀久久99精品久久久| 国产精品一区在线播放| 久久二区视频| 国产一区二区中文字幕| 欧美一级片一区| 欧美福利三区| 欧美日韩一级二级三级| 国产一区二区在线免费| 国产精品亚洲第一区| 丝袜美腿诱惑一区二区| 久久国产精品精品国产| 97午夜视频| 亚洲午夜精品一区二区三区电影院| 中文字幕一区二区三区又粗| 国产一区不卡视频| 欧美日韩精品中文字幕| 狠狠色狠狠色综合系列| 国产一级一片免费播放| 91精品国产综合久久国产大片 | 欧美一区二区三区免费观看视频| 欧美在线视频一区二区三区| 午夜毛片在线观看| 国产欧美精品一区二区在线播放| 久久99精品国产麻豆婷婷| 波多野结衣女教师30分钟| 7777久久久国产精品| 国产日韩欧美网站| 久久99久久99精品免观看软件| 91人人爽人人爽人人精88v| 国产vsv精品一区二区62| 国产91丝袜在线| 国产日产高清欧美一区二区三区| 欧美精品二区三区| 精品国产亚洲一区二区三区| 日韩一级在线视频| 免费欧美一级视频| 偷拍区另类欧美激情日韩91| 免费的午夜毛片| 国产一级二级在线| 91久久一区二区| 国产一区二区国产| 国产黄色一区二区三区| 国产精品一区一区三区| ass美女的沟沟pics| 国内精品久久久久影院日本| 一区二区欧美在线| 精品国产伦一区二区三区免费| 91麻豆精品国产91久久久资源速度| 国产精品对白刺激在线观看| 亚洲一区精品视频| 97久久精品人人澡人人爽| 精品久久不卡| 欧美性xxxxx极品少妇| 国产精品欧美一区二区三区| 中文字幕1区2区3区| 蜜臀久久99精品久久久| 99久久国产综合精品女不卡| 欧美精品一卡二卡| 国产高清在线精品一区二区三区| 亚洲二区在线播放视频| 91久久一区二区| 国产精品对白刺激久久久| 日韩av免费电影| 国产剧情在线观看一区二区| 久久国产精品首页| 亚洲一二三四区| 欧美亚洲视频二区| 国产日韩麻豆| 99精品偷拍视频一区二区三区| 少妇在线看www| 国产欧美一区二区精品婷| 一区二区三区毛片| 精品国产乱码久久久久久老虎| 中文字幕日韩有码| 强行挺进女警紧窄湿润| 日本精品99| 91偷拍网站| 精品国产一区二区三区久久久久久 | 亚洲精品人| 99久久精品免费看国产交换| 欧美一区二粉嫩精品国产一线天| 国产精品久久久综合久尹人久久9| 91麻豆精品国产综合久久久久久| 国产精品久久久不卡| 91秒拍国产福利一区| 少妇av一区二区三区| 欧美一区二区三区激情视频| 国产1区2区3区| 国产精品九九九九九九九| 91精品国产高清一二三四区| 国产精品高潮在线| 国产精品自拍在线观看| 国产在线精品一区| 日韩精品中文字幕在线| 狠狠躁日日躁狂躁夜夜躁| 性色av色香蕉一区二区| 国产精品理人伦一区二区三区| 国产二区精品视频|