日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]面向深度強化學習的策略保護防御方法有效

專利信息
申請號: 202110651675.2 申請日: 2021-06-11
公開(公告)號: CN113392396B 公開(公告)日: 2022-10-14
發明(設計)人: 陳晉音;章燕;王雪柯;胡書隆 申請(專利權)人: 浙江工業大學
主分類號: G06F21/55 分類號: G06F21/55;G06F21/62;G06N3/08
代理公司: 杭州天勤知識產權代理有限公司 33224 代理人: 高燕
地址: 310014 浙*** 國省代碼: 浙江;33
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 面向 深度 強化 學習 策略 保護 防御 方法
【權利要求書】:

1.一種面向深度強化學習的策略保護防御方法,其特征在于,包括以下步驟:

1)搭建深度強化學習的目標智能體自動駕駛模擬環境,基于強化學習中的深度Q網絡預訓練目標智能體以優化深度Q網絡的參數;

2)根據優化后的深度Q網絡的策略πt生成T個時刻目標智能體駕駛序列狀態動作對和獎勵值作為專家數據;

3)根據專家數據模仿學習生成模仿策略πIL

4)目標智能體在模仿策略πIL的基礎上對自身的策略進行調整學習,通過對深度Q網絡進行微調并修改目標函數,使得在保證目標智能體策略πt可以獲得較高的期望獎勵值的同時,保證根據模仿策略πIL得到的期望獎勵值較低,以達到策略保護的目的。

2.根據權利要求1所述的面向深度強化學習的策略保護防御方法,其特征在于,步驟1)包括:

1.1)搭建深度強化學習的目標智能體自動駕駛模擬環境;

1.2)基于強化學習中的深度Q網絡訓練目標智能體,訓練目標是在較短的時間內安全地到達目的地;

1.3)訓練過程中,將目標智能體的狀態轉換過程存儲在經驗回放緩沖區Buff中,作為深度Q網絡的訓練數據集;所述的深度Q網絡包括當前Q網絡和目標Q網絡;

1.4)從經驗回放緩沖區Buff中隨機采樣N個訓練數據集,通過最小化當前Q網絡的預測Q值和目標Q網絡的目標Q值的均方差來更新當前Q網絡的網絡參數;每隔一段時間將當前Q網絡的參數復制給目標Q網絡。

3.根據權利要求1所述的面向深度強化學習的策略保護防御方法,其特征在于,步驟3)包括:

3.1)將專家數據中的狀態s作為Actor網絡的輸入,根據初始化的模仿策略πIL(a|s)輸出Actor網絡所采取的動作a';

3.2)將a'和專家數據中的狀態s作為狀態動作對(s,a'),與專家數據中對應的狀態動作對(s,a)一起輸入到判別器網絡當中,對其產生的動作進行判別,利用判別器網絡的輸出yD來作為獎勵值以指導模仿策略πIL的學習;

3.3)在模仿策略πIL的學習過程中,通過最大化得到的期望獎勵值來學習專家數據的策略,最小化損失函數以更新Actor網絡和判別器網絡的參數;

3.4)重復步驟3.2)-3.3),迭代更新Actor網絡和判別器網絡的結構參數以學習專家數據的策略,得到模仿策略πIL

4.根據權利要求3所述的面向深度強化學習的策略保護防御方法,其特征在于,所述判別器網絡的損失函數為:

其中,πIL表示模仿學習得到的策略;πt表示采樣的專家策略;第一項中的logD(s,a)表示判別器對真實數據的判斷;第二項log(1-D(s,a))則表示判別器對生成數據的判斷。

5.根據權利要求3所述的面向深度強化學習的策略保護防御方法,其特征在于,步驟3.3)中,通過梯度求導來最小化損失函數從而反向更新判別器和Actor網絡參數,其損失函數如下:

其中,是模仿策略πIL的熵,由常數λ(λ≥0)控制,作為損失函數中的策略正則項。

6.根據權利要求1所述的面向深度強化學習的策略保護防御方法,其特征在于,步驟4)中,對深度Q網絡進行微調包括:

將深度Q網絡最后的Q網絡層進行復制擴充,得到k個并行的Q網絡層;

在訓練過程中,隨機從k個Q網絡層中選擇一個作為Q值輸出層用于進行策略動作選取;更新參數時,從經驗回放緩沖區Buff中進行數據采樣,然后利用泊松分布生成一個k×1的掩碼對k個Q網絡層進行參數更新,利用k個Q值的平均值作為目標智能體策略πt進行學習和模仿。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110651675.2/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 狠狠色综合久久婷婷色天使| 久久99精品国产麻豆宅宅| 91精品国产91久久久| 午夜爽爽视频| 国产伦精品一区二区三区免费优势| 日日狠狠久久8888偷色| 国产一区二区资源| 欧美日韩国产123| 国产欧美一区二区三区沐欲| 一区二区三区欧美日韩| 国内少妇偷人精品视频免费| 91麻豆精品国产91久久久更新资源速度超快 | 丰满少妇高潮惨叫久久久一| 性色av香蕉一区二区| 狠狠操很很干| 亚洲视频h| 久久一区二区精品| 欧美在线视频一区二区三区| 午夜国产一区| 中文字幕视频一区二区| 91午夜在线观看| 精品一区中文字幕| 欧美一区二区免费视频| 99久久久国产精品免费调教网站| 国产香蕉97碰碰久久人人| 亚洲欧美精品suv| 夜夜爽av福利精品导航| 亚洲区在线| 91麻豆精品国产综合久久久久久| 99re热精品视频国产免费| 久久91精品国产91久久久| 国产午夜精品一区二区三区最新电影| 一区二区三区日韩精品| 久久91精品国产91久久久| 一区二区在线不卡| 一区二区三区国产精华| 久久精品国语| 亚洲精品日韩色噜噜久久五月| 欧美日韩国产一区二区三区在线观看| 999久久久国产| 黄色国产一区二区| 丰满岳妇伦4在线观看| 欧美精品久久一区二区| 性欧美激情日韩精品七区| 91亚洲精品国偷拍| 大bbw大bbw巨大bbw看看 | 日本一二三不卡| 日韩欧美激情| 国产精品9区| 国产亚洲精品久久久久动| www.日本一区| 中文字幕一二三四五区| 欧美日韩一级在线观看| 亚洲国产精品精品| 国产黄色一区二区三区| 91精品久久久久久| 久久99精品久久久噜噜最新章节 | 精品久久久综合| 欧美高清xxxxx| 国产69精品久久99的直播节目| 国产精品乱码久久久久久久久| 狠狠色噜噜狠狠狠狠88| 久久免费福利视频| 国产足控福利视频一区| 日韩午夜三级| 国产目拍亚洲精品区一区| 少妇厨房与子伦在线观看| 日日夜夜亚洲精品| 99国产精品永久免费视频| 日韩av在线免费电影| 日韩亚洲欧美一区二区| 日韩精品人成在线播放| 二区三区视频| 精品一区二区三区影院| 欧美髙清性xxxxhdvid| 精品国产一区二| 国产在线精品二区| 欧美一区二区激情三区| 国产精品女同一区二区免费站| 国产一级不卡毛片| 8x8x国产一区二区三区精品推荐| 福利视频亚洲一区| 亚洲精品久久久久中文字幕欢迎你| 肉丝肉足丝袜一区二区三区| 亚洲国产欧美一区| 国产另类一区| 欧美日韩一区二区三区不卡| 欧美精品国产一区二区| 欧美久久一区二区三区| 午夜av免费观看| 国产一级不卡视频| 69久久夜色精品国产7777| 久久久精品观看| 91国产在线看| 91精品系列| 亚洲制服丝袜在线| 91精品第一页| 欧美一区二区三区免费看| 片毛片免费看| 国产一区在线视频观看| 亚洲一区精品视频| 精品国产一区二区三区高潮视| 国产综合久久精品| 国产一区亚洲一区| 国产专区一区二区| 狠狠躁夜夜| 国产精品理人伦一区二区三区| 国产亚洲另类久久久精品| 欧美日韩中文字幕三区| 日本高清二区| 一区二区三区免费高清视频| 国产精品18久久久久白浆| 国产无套精品一区二区| 国产白丝一区二区三区| 欧美一区二区在线不卡| 日本一二三区视频在线| 久久免费福利视频| 国产二区三区视频| 精品国产乱码久久久久久图片| 亚洲国产精品一区在线观看| 性色av香蕉一区二区| 精品无码久久久久国产| 午夜影院一区二区| 精品国产乱码久久久久久a丨| 国产一区网址| 亚洲精品www久久久| 中文字幕制服狠久久日韩二区 | 色综合久久网| 午夜激情综合网| 亚洲伊人久久影院| 亚洲精品www久久久| 国产精品久久久久久久久久不蜜月| 国产精品三级久久久久久电影| 久久久国产精品一区| 香蕉视频一区二区三区| 欧美一区二区综合| 午夜免费一级片| 午夜激情影院| 国产精品刺激对白麻豆99| 亚洲欧美色图在线| 国产精品二十区| 国产99久久九九精品免费| 中文字幕一区二区三区乱码视频| 免费a级毛片18以上观看精品| 国产伦精品一区二区三区免费迷| 日韩精品久久久久久中文字幕8| 精品国产区一区二| 91一区二区三区在线| 农村妇女毛片精品久久| 日韩欧美视频一区二区| 欧美国产精品久久| 亚洲四区在线| 视频一区二区三区中文字幕| 久久不卡精品| 夜夜躁日日躁狠狠躁| 美女直播一区二区三区| 一二三区欧美| 欧美一区二区久久久| 亚洲精品乱码久久久久久国产主播| 国产一区二区三区的电影| 日本免费电影一区二区| 农村妇女精品一二区| 亚洲欧美制服丝腿| 午夜天堂在线| 热久久一区二区| 国产另类一区| 中文字幕区一区二| 国产理论片午午午伦夜理片2021 | 91超碰caoporm国产香蕉| 国产精品欧美日韩在线| 国产精品一区二区在线看| 88888888国产一区二区| 日本高清二区| 国产88av| 午夜免费av电影| 国产麻豆一区二区三区在线观看| 欧美日韩一区二区三区在线播放 | 日本看片一区二区三区高清| 欧美片一区二区| www色视频岛国| av午夜在线| 热久久国产| 国产一区二区三区四区五区七| 国产精品一区不卡| 日韩亚洲欧美一区| 国产一区二区手机在线观看| 狠狠色丁香久久综合频道| 国产亚洲精品久久久久久网站 | 一区不卡av| **毛片在线| 免费久久99精品国产婷婷六月| 欧美一区二区三区国产精品| 夜夜爱av| 国产69精品久久久久按摩| 精品国产一区二区三区免费 | 91人人精品| 视频二区一区国产精品天天| 午夜影院一级片| 日本高清h色视频在线观看| 国产日韩欧美不卡| 亚洲精品久久久久久久久久久久久久 | a级片一区| 一区二区三区精品国产| 午夜电影一区二区三区| 久久69视频| 久久99中文字幕| 狠狠插狠狠插| 国产一区二区午夜| 午夜诱惑影院| 野花国产精品入口| 国产乱人伦偷精品视频免下载| 欧美精品一区二区久久| 日本免费电影一区二区三区| 亚洲欧洲日本在线观看| 国产二区三区视频| 在线精品国产一区二区三区| 伊人欧美一区| 亚洲在线久久| 日韩区欧美久久久无人区| 韩漫无遮韩漫免费网址肉| 99久久夜色精品国产网站| 国产精品一区二区麻豆| 国产二区视频在线播放| 中文字幕欧美另类精品亚洲| 久久久久久久国产| 亚洲精品久久久久中文第一暮| 日韩精品久久一区二区| 国产一区二区三区在线电影| 亚洲s码欧洲m码在线观看| 国产区一二| 欧美日韩久久一区| 99欧美精品| 久久国产精品99国产精| 国产白嫩美女在线观看| 色午夜影院| 国产乱老一区视频| 久久99精品久久久秒播| 91国偷自产中文字幕婷婷| 九九视频69精品视频秋欲浓| 亚洲福利视频二区| 激情久久久| 午夜免费av电影| 欧美国产在线看 | 午夜精品在线观看| 国产精品一二三区免费| 日韩精品中文字幕一区二区|