日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種強化學習方法在審

專利信息
申請號: 202110101401.6 申請日: 2021-01-26
公開(公告)號: CN112734048A 公開(公告)日: 2021-04-30
發明(設計)人: 李紀先;安濤;王瑞杰;朱青山;譚緒祥;劉烜宏;劉宇生;聶琳靜;于湃 申請(專利權)人: 天津飛騰信息技術有限公司
主分類號: G06N20/00 分類號: G06N20/00
代理公司: 廣州三環專利商標代理有限公司 44202 代理人: 陳志明
地址: 300450 天津市濱海新*** 國省代碼: 天津;12
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 強化 學習方法
【說明書】:

發明公開了一種強化學習方法,包括:CPU端初始化智能體參數,所述智能體參數包括智能體的模型參數,以及所述智能體的多層感知機的輸入權重矩陣和輸出權重矩陣;所述CPU端采用所述智能體與環境進行交互,以采集初始經驗值,并將所述初始經驗值存入緩存器;所述CPU端將經初始化的智能體參數傳輸至FPGA端;所述FPGA端將所述經初始化的智能體參數作為訓練的初值,根據從所述緩存器中讀取的初始經驗值對所述智能體進行迭代更新。本發明通過在CPU端對智能體進行初始化訓練,在FPGA端進行后續訓練,從而能有效減少FPGA的計算資源和內存空間。

技術領域

本發明涉及人工智能技術領域,尤其涉及一種強化學習方法。

背景技術

強化學習主要研究在隨機環境中,智能體采取何種行為以最大化累計獎勵,強化學習與典型深度學習的不同之處在于,智能體本身會探索自己所處的環境并學習適當的行動。因此,強化學習需要很高的泛化能力,以便不受低質量數據影響。

為了減少對輸入數據序列的依賴性,通常將經驗回放技術應用于DQN(Deep Q-learning,強化學習),將經驗值(包括狀態、動作和獎勵)記錄在緩沖區中,然后隨機選取經驗值進行訓練。目前,邊緣設備上執行DQN強化學習存在以下問題:1)基于GPU設備對深度學習和強化學習算法的研究,但其計算功耗很大;2)基于FPGA的加速平臺,但權重參數訓練時間長,且需要相對較大的數據傳輸開銷和存儲容量;3)將TRPO算法應用于FPGA平臺上的深度強化學習,但強化神經網絡結構過于復雜,導致其在資源占用和功耗方面消耗較大。因此,FPGA等硬件平臺因計算資源和存儲資源受限,難以獨立運行強化學習。

發明內容

本發明實施例提供一種強化學習方法,通過在CPU端對智能體進行初始化訓練,在FPGA端進行后續訓練,從而能有效減少FPGA的計算資源和內存空間。

本發明一實施例提供一種強化學習方法,包括:

CPU端初始化智能體參數,所述智能體參數包括智能體的模型參數,以及所述智能體的多層感知機的輸入權重矩陣和輸出權重矩陣;

所述CPU端采用所述智能體與環境進行交互,以采集初始經驗值,并將所述初始經驗值存入緩存器;

所述CPU端將經初始化的智能體參數傳輸至FPGA端;

所述FPGA端將所述經初始化的智能體參數作為訓練的初值,根據從所述緩存器中讀取的初始經驗值對所述智能體進行迭代更新。

在一些實施例中,所述FPGA端通過如下步驟以對所述智能體進行迭代更新:

讀取來自所述CPU端的所述經初始化的智能體參數;

從所述環境中獲取當前狀態,并根據所述當前狀態確定當前動作;

利用所述智能體向所述環境輸出所述當前動作,以從所述環境獲取響應于所述動作的下一個狀態、當前獎勵以及當前情節結束標志;

當所述當前情節結束標志表示為當前情節結束時,將所述當前狀態、所述當前動作、所述下一個狀態和所述當前獎勵組織成經驗值,以更新所述緩存器的數據;

判斷所述多層感知機中神經元數量是否等于網絡節點數;若是,則對所述經初始化的輸出權重矩陣進行初始化訓練,并利用所述緩存器中存儲的當前經驗值更新所述下一個狀態對應的動作Q值;若否,且在神經元數量大于所述網絡節點數時,則對所述經初始化的輸出權重矩陣進行優化,并利用所述緩存器中存儲的當前經驗值更新所述下一個狀態對應的動作Q值;

當檢測到當前運算結束時,更新所述智能體的模型參數。

在一些實施例中,所述根據所述當前狀態確定當前動作:

獲取所述當前狀態下的一隨機動作;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津飛騰信息技術有限公司,未經天津飛騰信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110101401.6/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: а√天堂8资源中文在线| 日韩一区二区福利视频| 国产精品videossex国产高清| 日本美女视频一区二区三区| 欧美激情视频一区二区三区免费| 欧美一区二区三区激情视频| 久久伊人色综合| 亚洲欧美国产精品久久| 国产精品久久国产三级国电话系列 | 淫片免费看| 国产日韩一区在线| 色噜噜日韩精品欧美一区二区| 日韩av中文字幕在线| 粉嫩久久久久久久极品| 91精品中综合久久久婷婷| 国产日韩区| 欧美一区二区免费视频| 国产精品乱码一区二区三区四川人| 99精品欧美一区二区| 大bbw大bbw巨大bbw看看| 亚洲日韩aⅴ在线视频| 中文字幕一区一区三区| 欧美一区二区三区久久精品视| 欧美系列一区二区| 午夜影院91| 国产亚洲综合一区二区| 欧美精品六区| 日本一区二区在线电影| 亚洲欧美一卡| 亚洲精品久久久久玩吗| 日韩精品一二区| 欧美激情综合在线| 久久久久久综合网| 国产第一区二区| 国偷自产一区二区三区在线观看 | 91社区国产高清| 97久久国产精品| 国产一区在线精品| 国产精品亚洲а∨天堂123bt| 在线精品一区二区| 国产精品自拍在线| 国产二区精品视频| 欧美一区二区三区久久久| 国产一区二区四区| 国产亚洲综合一区二区| 91麻豆产精品久久久| 亚洲精品乱码久久久久久国产主播| 久久精品爱爱视频| 国产中文字幕一区二区三区 | 97人人揉人人捏人人添| 久久国产精久久精产国| 天摸夜夜添久久精品亚洲人成| 国产69精品久久久久男男系列| 国产精品久久久久久久久久久杏吧| 91精品国产高清一二三四区 | 国产99久久九九精品| 久久久精品观看| 色综合久久综合| 91精品久| 日韩亚洲欧美一区二区| 97人人模人人爽人人喊小说| 中文字幕一区二区三区不卡| 国产精品国产亚洲精品看不卡15 | 国产精品国外精品| 爱看av在线入口| 日本一区免费视频| 久久久久国产精品免费免费搜索 | 午夜电影理伦片2023在线观看| 国产日韩欧美精品| 国产乱人伦精品一区二区| 亚洲精品中文字幕乱码三区91| 视频一区二区中文字幕| 久久一区二区精品| 性国产videofree极品| 九九精品久久| 亚洲区日韩| 国产福利一区在线观看| 亚洲高清久久久| 午夜肉伦伦| 欧美国产一区二区在线| 一区二区三区在线影院| 久久精品爱爱视频| 日本一级中文字幕久久久久久| 日韩精品免费一区二区中文字幕 | 国产精品电影一区二区三区| 日韩中文字幕亚洲精品欧美| 国产男女乱淫视频高清免费| 热久久国产| 国产日韩欧美亚洲综合| 久久99中文字幕| 精品国产91久久久| 亚洲欧美另类久久久精品2019| 日本精品视频一区二区三区| 国产品久精国精产拍| 国产乱老一区视频| 欧美一区二区三区激情| 国产淫片免费看| 91超碰caoporm国产香蕉| 美女直播一区二区三区| 国产一级在线免费观看| 强制中出し~大桥未久10| 真实的国产乱xxxx在线91| 国产偷窥片| 国产欧美性| 狠狠躁夜夜躁人人爽天天天天97 | 午夜精品一区二区三区三上悠亚 | 国产在线不卡一| 国产日韩欧美网站| 欧洲激情一区二区| 九九视频69精品视频秋欲浓| 综合欧美一区二区三区| 亚洲免费永久精品国产| 护士xxxx18一19| 国产精品综合一区二区三区| 亚洲第一天堂无码专区| 国产亚洲精品久久yy50| 国内精品久久久久影院日本| 亚洲国产欧美一区二区丝袜黑人| 中文字幕区一区二| 亚洲欧美日韩在线看| 国产精品伦一区二区三区视频| 999偷拍精品视频| 国产日韩欧美第一页| 欧美福利一区二区| 国产一区欧美一区| 日韩精品一区在线观看| 好吊色欧美一区二区三区视频| 国产精品久久久久久久久久不蜜月| 国产精品视频一区二区二| 亚洲国产另类久久久精品性| 少妇自拍一区| 午夜爽爽爽男女免费观看| 97精品国产97久久久久久粉红| 欧美精品国产精品| 亚洲欧美另类久久久精品2019| 欧美一区二区三区在线免费观看| 91亚洲国产在人线播放午夜| 亚洲国产精品国自产拍久久| 91在线一区二区| 偷拍区另类欧美激情日韩91| 综合国产一区| 91片在线观看| 国产欧美亚洲精品| 国产精品999久久久| 久久一区二区精品| 国产精品你懂的在线| 国产日韩欧美精品一区二区| 久久狠狠高潮亚洲精品| 亚洲国产精品国自产拍久久| 天干天干天啪啪夜爽爽99| 国产日韩精品一区二区| 色就是色欧美亚洲| 日韩av免费电影| 亚洲精华国产欧美| 亚洲精品suv精品一区二区| 日韩av在线影视| 欧美大成色www永久网站婷| 色综合欧美亚洲国产| 国产黄一区二区毛片免下载| 国产日韩欧美中文字幕| 国产亚洲久久| 欧美一级免费在线视频| 日韩av三区| 中文字幕另类日韩欧美亚洲嫩草| 99精品欧美一区二区| 久久国产精品欧美| 国产激情二区| 女人被爽到高潮呻吟免费看| 欧美激情片一区二区| 日本一区二区电影在线观看| 91超碰caoporm国产香蕉| 欧美一区二区三区在线免费观看 | 96国产精品| 亚洲乱在线| 国产69精品久久久久孕妇不能看| 欧美一区二区三区免费播放视频了| 亚洲欧美精品suv| 99热久久这里只精品国产www | 91麻豆精品一区二区三区| 国产视频一区二区在线| 国产日韩欧美精品一区| 久久精视频| 国产精品久久免费视频在线| 91avpro| 性少妇freesexvideos高清bbw| 性生交大片免费看潘金莲| 19videosex性欧美69| 国产麻豆精品久久| 97人人模人人爽视频一区二区| 99er热精品视频国产| 日韩一级在线视频| 国产一区二区在线精品| 国产亚洲精品精品国产亚洲综合| 99久久精品国产系列| 欧美日韩一区免费| 91理论片午午伦夜理片久久| 片毛片免费看| 日韩av在线影视| 欧美极品少妇videossex| 国产精品美女久久久另类人妖| 日本一区欧美| 粉嫩久久99精品久久久久久夜| 久久久精品欧美一区二区 | 国产午夜亚洲精品羞羞网站 | 亚洲一区2区三区| 麻豆国产一区二区三区| 国产欧美三区| 中文字幕日韩一区二区| 搡少妇在线视频中文字幕| 欧美一区二区性放荡片| 日韩精品中文字| 国产综合久久精品| 欧美乱妇高清无乱码免费| 右手影院av| 久久99精品国产| 中文文精品字幕一区二区| 欧美一区二区三区国产精品| 国产二区免费视频| 国产欧美日韩二区| 麻豆天堂网| 男女午夜爽爽| 免费观看xxxx9999片| 国产在线不卡一区| 久久久久国产精品www| 91亚洲精品国偷拍自产| 综合色婷婷一区二区亚洲欧美国产| 国产精品欧美一区二区视频| 高清国产一区二区| 欧美色综合天天久久综合精品| 午夜亚洲影院| 蜜臀久久99静品久久久久久| 国产69精品久久久久孕妇不能看| 久久99精品久久久野外直播内容 | xxxx在线视频| 国产一区日韩一区| 国产福利精品一区| 国产男女乱淫视频高清免费| 国产精品v一区二区三区| 午夜码电影| 97久久精品人人澡人人爽| 国产69久久| 久久国产精品久久| 国产一区二区高潮| 欧美日韩一区二区三区在线播放 | 亚洲午夜国产一区99re久久| 国产天堂一区二区三区|