日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]智能體強(qiáng)化學(xué)習(xí)方法、裝置、設(shè)備及介質(zhì)有效

專利信息
申請(qǐng)?zhí)枺?/td> 201810849877.6 申請(qǐng)日: 2018-07-28
公開(公告)號(hào): CN109190720B 公開(公告)日: 2021-08-06
發(fā)明(設(shè)計(jì))人: 劉春曉;薛洋;張偉;林倞 申請(qǐng)(專利權(quán))人: 深圳市商湯科技有限公司
主分類號(hào): G06K9/66 分類號(hào): G06K9/66;G06K9/00;G06N3/04
代理公司: 北京思源智匯知識(shí)產(chǎn)權(quán)代理有限公司 11657 代理人: 毛麗琴
地址: 518000 廣東省深圳市*** 國(guó)省代碼: 廣東;44
權(quán)利要求書: 查看更多 說(shuō)明書: 查看更多
摘要:
搜索關(guān)鍵詞: 智能 強(qiáng)化 學(xué)習(xí)方法 裝置 設(shè)備 介質(zhì)
【說(shuō)明書】:

本申請(qǐng)的實(shí)施方式公開了一種智能體強(qiáng)化學(xué)習(xí)方法、裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及計(jì)算機(jī)程序,其中的方法包括:獲取智能體針對(duì)當(dāng)前環(huán)境圖像進(jìn)行決策所依據(jù)的關(guān)鍵視覺(jué)信息;獲取所述當(dāng)前環(huán)境圖像的實(shí)際關(guān)鍵視覺(jué)信息;根據(jù)所述所依據(jù)的關(guān)鍵視覺(jué)信息以及所述實(shí)際關(guān)鍵視覺(jué)信息,確定注意力變化回報(bào)信息;根據(jù)所述注意力變化回報(bào)信息調(diào)整智能體強(qiáng)化學(xué)習(xí)的回報(bào)反饋。

技術(shù)領(lǐng)域

本申請(qǐng)涉及計(jì)算機(jī)視覺(jué)技術(shù),尤其是涉及一種智能體強(qiáng)化學(xué)習(xí)方法、智能體強(qiáng)化學(xué)習(xí)裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及計(jì)算機(jī)程序。

背景技術(shù)

在游戲以及機(jī)器人等諸多技術(shù)領(lǐng)域,通常會(huì)使用到智能體,例如,游戲中的接檔下落小球的移動(dòng)板或者機(jī)器臂等。智能體在強(qiáng)化學(xué)習(xí)過(guò)程中,通常是利用在環(huán)境中試錯(cuò)得到的獎(jiǎng)賞信息,來(lái)指導(dǎo)學(xué)習(xí)的。

如何提高強(qiáng)化學(xué)習(xí)后的智能體的行為安全性,是強(qiáng)化學(xué)習(xí)中的一個(gè)重要的技術(shù)問(wèn)題。

發(fā)明內(nèi)容

本申請(qǐng)實(shí)施方式提供一種智能體強(qiáng)化學(xué)習(xí)的技術(shù)方案。

根據(jù)本申請(qǐng)實(shí)施方式其中一方面,提供一種智能體強(qiáng)化學(xué)習(xí)方法,所述方法包括:獲取智能體針對(duì)當(dāng)前環(huán)境圖像進(jìn)行決策所依據(jù)的關(guān)鍵視覺(jué)信息;獲取所述當(dāng)前環(huán)境圖像的實(shí)際關(guān)鍵視覺(jué)信息;根據(jù)所述所依據(jù)的關(guān)鍵視覺(jué)信息以及所述實(shí)際關(guān)鍵視覺(jué)信息,確定注意力變化回報(bào)信息;根據(jù)所述注意力變化回報(bào)信息調(diào)整智能體強(qiáng)化學(xué)習(xí)的回報(bào)反饋。

在本申請(qǐng)一實(shí)施方式中,所述所依據(jù)的關(guān)鍵視覺(jué)信息包括:智能體在做出決策時(shí),針對(duì)當(dāng)前環(huán)境圖像的注意力區(qū)域。

在本申請(qǐng)又一實(shí)施方式中,所述獲取智能體針對(duì)當(dāng)前環(huán)境圖像進(jìn)行決策所依據(jù)的關(guān)鍵視覺(jué)信息包括:獲取智能體針對(duì)當(dāng)前環(huán)境圖像的價(jià)值注意力圖;對(duì)所述價(jià)值注意力圖和所述當(dāng)前環(huán)境圖像進(jìn)行合成處理,獲得熱力圖;根據(jù)所述熱力圖確定所述智能體針對(duì)當(dāng)前環(huán)境圖像的注意力區(qū)域。

在本申請(qǐng)?jiān)僖粚?shí)施方式中,所述獲取智能體針對(duì)當(dāng)前環(huán)境圖像的價(jià)值注意力圖包括:獲取當(dāng)前環(huán)境圖像的特征圖;根據(jù)所述特征圖獲得依次屏蔽所述特征圖各通道而形成的各改變特征圖;獲取所述各改變特征圖分別相對(duì)于所述特征圖的狀態(tài)價(jià)值改變量;根據(jù)各狀態(tài)價(jià)值改變量以及各改變特征圖形成所述價(jià)值注意力圖。

在本申請(qǐng)?jiān)僖粚?shí)施方式中,所述獲取當(dāng)前環(huán)境圖像的特征圖包括:將所述當(dāng)前環(huán)境圖像輸入卷積神經(jīng)網(wǎng)絡(luò),并獲取卷積神經(jīng)網(wǎng)絡(luò)的最后一層卷積層輸出的特征圖。

在本申請(qǐng)?jiān)僖粚?shí)施方式中,所述獲取所述各改變特征圖分別相對(duì)于所述特征圖的狀態(tài)價(jià)值改變量包括:將各改變特征圖輸入智能體的價(jià)值網(wǎng)絡(luò),以獲得各改變特征圖的狀態(tài)價(jià)值;計(jì)算所述價(jià)值網(wǎng)絡(luò)針對(duì)所述特征圖輸出的狀態(tài)價(jià)值,分別與所述各改變特征圖的狀態(tài)價(jià)值的差值,以獲得各改變特征圖分別相對(duì)于所述特征圖的狀態(tài)價(jià)值改變量。

在本申請(qǐng)?jiān)僖粚?shí)施方式中,所述當(dāng)前環(huán)境圖像的實(shí)際關(guān)鍵視覺(jué)信息包括:當(dāng)前環(huán)境圖像中的目標(biāo)對(duì)象所在區(qū)域。

在本申請(qǐng)?jiān)僖粚?shí)施方式中,所述根據(jù)所述所依據(jù)的關(guān)鍵視覺(jué)信息以及所述實(shí)際關(guān)鍵視覺(jué)信息,確定注意力變化回報(bào)信息包括:根據(jù)智能體在做出決策時(shí),針對(duì)當(dāng)前環(huán)境圖像的注意力區(qū)域,與所述目標(biāo)對(duì)象所在區(qū)域的交集與目標(biāo)對(duì)象所在區(qū)域的比值,確定注意力變化回報(bào)信息。

在本申請(qǐng)?jiān)僖粚?shí)施方式中,所述智能體強(qiáng)化學(xué)習(xí)的回報(bào)反饋包括:注意力變化回報(bào)信息以及智能體針對(duì)當(dāng)前環(huán)境圖像進(jìn)行決策所形成的回報(bào)信息。

在本申請(qǐng)?jiān)僖粚?shí)施方式中,所述方法還包括:根據(jù)所述所依據(jù)的關(guān)鍵視覺(jué)信息,確定環(huán)境探索周期內(nèi)的探索程度;在判斷出所述探索程度不符合預(yù)定探索程度的情況下,利用存儲(chǔ)的歷史訓(xùn)練數(shù)據(jù)進(jìn)行經(jīng)驗(yàn)回放;所述歷史訓(xùn)練數(shù)據(jù)包括:利用預(yù)設(shè)要求對(duì)采樣的強(qiáng)化學(xué)習(xí)訓(xùn)練數(shù)據(jù)進(jìn)行篩選,而獲得的訓(xùn)練數(shù)據(jù)。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市商湯科技有限公司,未經(jīng)深圳市商湯科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201810849877.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 欧美日韩国产影院| 99er热精品视频国产| 国产精品一区一区三区| 国产精品一二三区免费| 免费午夜在线视频| 香蕉视频一区二区三区| 国产精品1234区| 欧美日韩激情一区| 中文字幕精品一区二区三区在线| 日韩精品中文字幕一区| 国产在线精品一区二区| 欧美日韩乱码| 久久久久国产精品www| 亚洲国产精品日韩av不卡在线| 亚洲欧美色一区二区三区| 一区二区精品久久| 午夜三级电影院| 国产91高清| 国产午夜精品免费一区二区三区视频 | 欧美国产一区二区在线| 国产1区2| 国产精品午夜一区二区| 综合在线一区| 午夜av影视| 午夜av资源| 中文字幕制服丝袜一区二区三区| 欧美一区二区色| 一区二区三区国产精品视频| 午夜电影天堂| 国产又色又爽无遮挡免费动态图| 亚洲国产午夜片| 538国产精品一区二区免费视频| 99国产精品9| 日韩中文字幕一区二区在线视频| 国产一区二区三区网站| 亚洲日本国产精品| 午夜大片网| 亚洲影院久久| 欧美日韩一区视频| 国产日韩一区二区三区| 欧美一区二区伦理片| 国产精品综合一区二区| 国产视频精品久久| 国产精品黑色丝袜的老师| 一本一道久久a久久精品综合蜜臀 国产三级在线视频一区二区三区 日韩欧美中文字幕一区 | 国产日韩一区二区三区| 91精品夜夜| 欧美精品九九| 91福利视频免费观看| 国产精品6699| 国产高清在线观看一区| 欧美精品一卡二卡| 亚洲精品国产一区二区三区| 国产视频一区二区在线| 奇米色欧美一区二区三区| 亚洲欧美一区二区三区三高潮| 国产精品电影一区二区三区| 国产精品久久久久久久久久久不卡| 一区二区三区中文字幕| 福利片一区二区三区| 国产69精品久久久久久| 国产69精品久久99不卡免费版 | 久久久久亚洲精品| 久久69视频| 国产91免费在线| 国产精品v欧美精品v日韩精品v| 国产精品一二二区| 久久午夜鲁丝片| 国产精品一区二区6| 黄色国产一区二区| 欧美日韩国产三区| 91精品啪在线观看国产手机 | 91超碰caoporm国产香蕉| 欧美乱偷一区二区三区在线| 九九视频69精品视频秋欲浓 | 欧美三区二区一区| 97人人添人人爽一区二区三区| 天干天干天干夜夜爽av| 天天射欧美| 国产性猛交96| 97国产婷婷综合在线视频,| 国产日韩欧美一区二区在线观看| 国产玖玖爱精品视频| 国产精品乱码久久久久久久| 亚洲国产精品二区| 国产精品久久久久久久久久久久冷| 国产69精品久久久久久| 日韩夜精品精品免费观看| 午夜影院啪啪| 黄毛片免费| 久久一二区| 亚洲精品一品区二品区三品区 | 国产原创一区二区 | 国产二区三区视频| 日本一区二区三区电影免费观看| 国产精品久久久视频| 国产69精品久久久久999天美| 日韩欧美激情| 久久国产精彩视频| 午夜影院激情| 国内精品在线免费| 免费高潮又黄又色又爽视频| 国产一区网址| 国产午夜精品一区二区三区四区 | 日本精品一区二区三区视频| 欧美精品六区| 99久久免费精品国产免费高清| 制服丝袜视频一区| 欧美一区二粉嫩精品国产一线天| 国产亚洲精品久久午夜玫瑰园 | 国产精品亚洲а∨天堂123bt| 日本一二三区视频| 久久一区二| 狠狠色噜噜狠狠狠狠2021天天| 91丝袜诱惑| 精品久久9999| 九九久久国产精品| 色偷偷一区二区三区| 日韩欧美一区精品| 欧美人妖一区二区三区| 99国产精品久久久久| 久久免费视频一区二区| 91黄色免费看| av毛片精品| 一色桃子av大全在线播放| 91久久国产露脸精品国产 | 国产女人好紧好爽| 97人人澡人人添人人爽超碰| 久久久久国产亚洲日本| 99精品久久99久久久久| 国产欧美精品一区二区在线播放| 午夜影皖精品av在线播放| 日韩一级免费视频| 91精品国产91热久久久做人人| 香蕉av一区二区三区| 91亚洲精品国偷拍自产| 91麻豆文化传媒在线观看| 久久一区二区视频| 亚洲日本国产精品| 91精品视频一区二区| 免费看片一区二区三区| 欧美在线视频二区| 国产精品九九九九九九| 91精品久久久久久久久久| 88888888国产一区二区| 久久福利视频网| 亚洲一区中文字幕| 国产欧美一区二区三区在线看| 久久免费精品国产| 亚洲精品色婷婷| 国产精品自拍在线| 制服丝袜视频一区| 狠狠色很很在鲁视频| 国产理论片午午午伦夜理片2021| 男人的天堂一区二区| 日韩精品一区二区三区中文字幕| 一区二区久久久久| 国产精品一卡二卡在线观看| 国偷自产一区二区三区在线观看| 国产麻豆一区二区| 99国产精品一区二区| 精品国产一区二区三区久久久久久| 男女午夜爽爽| 丰满少妇高潮惨叫久久久一| 狠狠色成色综合网| 制服丝袜二区| 欧美大片一区二区三区| 国产精品无码永久免费888| 精品久久久影院| 国产伦精品一区二区三区免费迷| 久久综合伊人77777麻豆最新章节| 欧美精品在线观看视频| 国产91丝袜在线| 国产69精品久久久久男男系列| 国产在线拍偷自揄拍视频 | 99久久婷婷国产综合精品电影| 国产精品久久免费视频| 亚洲国产日韩综合久久精品| 欧美日韩国产91| 日韩精品一区二区av| 午夜欧美a级理论片915影院| 久久福利视频网| 高清国产一区二区| 国产乱人乱精一区二视频国产精品 | 久久国产麻豆| 久久精品爱爱视频| 亚洲欧美一卡二卡| xxxx18hd护士hd护士| 国产欧美久久一区二区三区| 国产精品高清一区| 日本美女视频一区二区| 国产99久久九九精品免费| 久久久精品免费看| 片毛片免费看| 窝窝午夜理伦免费影院| 国产97免费视频| 国产一区午夜| 狠狠躁夜夜躁2020| 国产日产精品一区二区三区| 国产高清在线观看一区| 中文字幕一二三四五区| 91精品丝袜国产高跟在线| 国产精品19乱码一区二区三区| 国产欧美精品久久| 日韩一区高清| 久久久精品观看| 亚洲五码在线| 午夜在线看片| 福利片91| 国产无套精品一区二区| 亚洲欧美另类综合| 日韩av一区不卡| 91久久综合亚洲鲁鲁五月天 | 日韩欧美一区二区在线视频| 麻豆精品国产入口| 激情久久久| 国产精彩视频一区二区| a级片一区| 色妞www精品视频| 欧美一区二区伦理片| 亚洲久色影视| 狠狠色噜噜狠狠狠狠色综合久老司机| 免费看片一区二区三区| 国产日本欧美一区二区三区| 精品综合久久久久| 国产91一区二区在线观看| 午夜影皖精品av在线播放| 丰满岳乱妇bd在线观看k8| 色综合久久88| 一区二区三区四区视频在线| 亚洲四区在线观看| 午夜欧美影院| 日韩精品一区二区av| 国产一卡在线| 亚洲精品中文字幕乱码三区91| 色婷婷精品久久二区二区6| 欧美二区精品| 欧美在线观看视频一区二区三区 | 国产视频一区二区在线播放| 亚洲精品久久在线| 国产三级一区二区| 国v精品久久久网| www.午夜av| 欧美一级久久久| 日韩精品一区二区三区四区在线观看| 97精品国产aⅴ7777|