日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于模糊規(guī)則和決策樹的策略強化學(xué)習(xí)方法在審

專利信息
申請?zhí)枺?/td> 202211308748.9 申請日: 2022-10-25
公開(公告)號: CN115618924A 公開(公告)日: 2023-01-17
發(fā)明(設(shè)計)人: 蘇苒;劉鵬;孫倩 申請(專利權(quán))人: 天津大學(xué)
主分類號: G06N3/04 分類號: G06N3/04;G06N3/08
代理公司: 天津市北洋有限責(zé)任專利代理事務(wù)所 12201 代理人: 劉子文
地址: 300072*** 國省代碼: 天津;12
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 模糊 規(guī)則 決策樹 策略 強化 學(xué)習(xí)方法
【說明書】:

發(fā)明公開一種基于模糊規(guī)則和決策樹的策略強化學(xué)習(xí)方法,基于策略生成模塊、策略細化模塊和規(guī)則決策模塊,策略生成模塊用于輸出初始策略,策略細化模塊用于優(yōu)化初始策略以獲得優(yōu)化策略,規(guī)則決策模塊用于評估優(yōu)化策略和擴展模糊規(guī)則集;具體步驟如下:將模糊規(guī)則集輸入策略生成模塊,策略生成模塊輸出初始策略并將初始策略輸入策略細化模塊,策略細化模塊輸出優(yōu)化策略;將優(yōu)化策略輸入規(guī)則決策模塊,規(guī)則決策模塊輸出新的模糊規(guī)則集,新的模糊規(guī)則集進一步輸入到策略生成模塊;策略生成模塊、策略細化模塊和規(guī)則決策模塊反復(fù)迭代形成自適應(yīng)增長流程,并最終輸出強化學(xué)習(xí)策略模型和全局最優(yōu)的模糊規(guī)則集。

技術(shù)領(lǐng)域

本發(fā)明主要涉及策略強化學(xué)習(xí)算法,尤其涉及一種將決策樹和模糊規(guī)則結(jié)合的具備自適應(yīng)增長流程的策略強化學(xué)習(xí)方法。

背景技術(shù)

強化學(xué)習(xí)(Reinforcement Learning,RL)是機器學(xué)習(xí)領(lǐng)域的重要分支,通常被認為是實現(xiàn)決策智能的重要手段。強化學(xué)習(xí)通過試錯法(Trial and Error)來指導(dǎo)一個代理在環(huán)境中完成規(guī)定任務(wù),它的基本思想就是通過反復(fù)獎勵或懲罰代理使其逐漸學(xué)會一個最優(yōu)策略[1]。強化學(xué)習(xí)主要解決如何在環(huán)境中做出決策的問題[1],其基本方法是構(gòu)建一個代理(Agent)和環(huán)境(Environment)不斷交互的學(xué)習(xí)模型,在交互的每一個時間步中,代理獲取關(guān)于環(huán)境狀態(tài) (State)的觀察值(Observation),之后對自身要采取的動作(Action)做出決策。動作作用于環(huán)境后,環(huán)境可能會發(fā)生變化。代理在采取動作后會得到環(huán)境的獎勵(Reward)和此刻的狀態(tài)。RL模型通過反復(fù)獎勵代理的行為使RL代理學(xué)會最優(yōu)決策。

基于上述描述,RL模型可以被規(guī)范為一個馬爾科夫決策過程(Markov DecisionProcess, MDP),通常用一個元組表示S,A,P,R,γ[1],其中:

(1)S表示狀態(tài)空間,它描述環(huán)境的所有可觀測的屬性。

(2)A表示動作空間,它描述代理可以在給定環(huán)境下采取的所有合法動作集,動作空間可分為離散動作空間和連續(xù)動作空間。

(3)P:S×A×S→[0,1]是一個狀態(tài)轉(zhuǎn)移的概率分布函數(shù),它描述代理在時刻t下觀測到環(huán)境的狀態(tài)st,執(zhí)行動作at后轉(zhuǎn)移到下一時刻t+1下狀態(tài)st+1的概率。

(4)R:S×A→r是一個獎勵函數(shù),它描述代理在時刻t下觀測到環(huán)境的狀態(tài)st,執(zhí)行動作at后獲得的即時獎勵rt。代理的目標是最大化一個軌跡τ(Trajectories,也叫Episodes或者 Rollouts)的累計獎勵,這個軌跡τ通常是一個有限長度T的狀態(tài)動作對序列,可以表示如下所示:

τ=(s0,a0,s1,a1,...sT,aT)

(5)γ∈[0,1]是一個折扣因子,它描述代理在即時獎勵和長期獎勵之間的偏好,折扣因子越低表示代理越看重即時獎勵,而較高的折扣因子,會讓代理的累計獎勵中更加平衡即時獎勵和長期獎勵之間的權(quán)重。在MDP中,未來每個時間步所獲得的即時獎勵都必須乘以一個折扣因子γ,則從時刻t到時刻T軌跡τ結(jié)束時,累計獎勵定義如下:

折扣因子的使用本質(zhì)上是一種數(shù)學(xué)上的處理技巧,因為在數(shù)學(xué)上一個無窮長度的獎勵累加和可能不會收斂到一個有限值,且在方程中很難處理。但是有折扣因子且處于合理條件下,無窮和會收斂。

強化學(xué)習(xí)通常所述的策略π:S×A→[0,1]是一個狀態(tài)空間到動作空間的概率分布函數(shù),它描述代理在時刻t下觀測到環(huán)境的狀態(tài)st,執(zhí)行動作at的概率。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202211308748.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 狠狠躁狠狠躁视频专区| 精品国产一区二区三区四区vr| 国产精品一区二| 亚洲欧美另类久久久精品2019| 国产第一区二区三区| 欧美二区精品| 国产一区在线视频播放| 日本精品一二区| 国产精品自产拍在线观看桃花| 国产精品影音先锋| 亚洲午夜天堂吃瓜在线| 国产69精品久久久久孕妇不能看| 激情久久久| 97国产精品久久| 欧美久久一区二区三区| 亚洲精品少妇一区二区| 国产品久久久久久噜噜噜狼狼| 香蕉av一区| 国产一区二| 日韩国产精品久久| 欧洲在线一区二区| 欧美一区二区三区三州| av毛片精品| 国产一区二区三区四区五区七| 久久精品国产一区二区三区不卡| 久久久久国产精品嫩草影院| 国产专区一区二区| 国产精欧美一区二区三区久久久| 久久久久久中文字幕| 国产综合亚洲精品| 国产全肉乱妇杂乱视频在线观看| 精品少妇的一区二区三区四区| 狠狠色丁香久久婷婷综合_中| 亚洲高清乱码午夜电影网| 国产经典一区二区三区| 91精品一区二区中文字幕| 91精品久久天干天天天按摩| 欧美高清极品videossex| 欧美黄色一二三区| 91精品视频一区二区三区| 欧美一区久久| 久久人做人爽一区二区三区小说| 国产二区视频在线播放| 91亚洲精品国偷拍自产| 欧美一区二区三区免费视频| 91高清一区| 日韩一区免费| 国产麻豆一区二区| 亚洲影院久久| 国产精品6699| 97视频精品一二区ai换脸| 亚洲精品无吗| 精品国产区一区二| 狠狠色综合欧美激情| 久久久久亚洲| 中文字幕日韩一区二区| 久久久999精品视频| 欧美激情在线免费| 一本一道久久a久久精品综合蜜臀| 亚洲欧美国产中文字幕| 狠狠色噜噜狠狠狠狠黑人| 中文无码热在线视频| 日本高清二区| 免费的午夜毛片| 久久精品欧美一区二区| 日韩av中文字幕在线| 国产二区三区视频| 亚洲一二三在线| 午夜情所理论片| 国产精品女人精品久久久天天| 欧美精品粉嫩高潮一区二区| 99国产精品久久久久| 国产精品18久久久久白浆| 久久三级精品| 日韩av中文字幕一区二区| 亚洲精品久久久久999中文字幕| 日韩一级免费视频| 色婷婷噜噜久久国产精品12p| 久久96国产精品久久99软件| 狠狠色噜噜狠狠狠四色米奇| 国产88av| 97人人模人人爽人人喊小说| 国产一区二区手机在线观看| 国产精品久久久久99| 日韩国产精品久久| 久久国产精品精品国产| 国产一区二区三区中文字幕| 激情久久久| 免费观看又色又爽又刺激的视频| 国产亚洲精品久久777777| 国产69精品久久久久999小说| 亚洲欧美制服丝腿| 久久人人爽爽| 美女销魂免费一区二区| 国产一区二三| 国产精品一二三四五区| 欧美hdfree性xxxx| 久久久中精品2020中文| 免费看农村bbwbbw高潮| 欧美精品五区| 在线国产一区二区三区| 免费精品一区二区三区视频日产| 国产一区=区| 亚洲高清国产精品| 国产在线一卡二卡| 欧美一区二区三区激情在线视频| 一本色道久久综合亚洲精品浪潮| 国产91九色在线播放| 精品久久久综合| 91国内精品白嫩初高生| 久久夜色精品国产亚洲| 91久久国产视频| 国产偷久久一区精品69| 国产精品麻豆99久久久久久| 一区二区免费在线观看| 91精品国产综合久久国产大片 | 国产伦精品一区二区三区免| 国产精品久久久久久久久久软件| 少妇高潮一区二区三区99小说| 99精品偷拍视频一区二区三区| 一区二区三区欧美在线| 日韩午夜电影在线| 日本中文字幕一区| 7777久久久国产精品| 丝袜诱惑一区二区三区| 久久精品色欧美aⅴ一区二区| 夜夜精品视频一区二区| 夜夜躁狠狠躁日日躁2024| 91视频国产九色| 亚洲精品久久久久中文第一暮| 久久青草欧美一区二区三区| 精品久久国产视频| 91精品国产高清一区二区三区| 日韩av中文字幕第一页| 国产日韩欧美在线影视| 日韩精品一区在线观看| 亚洲欧美另类久久久精品2019| 国产一区影院| 国产一区二区三区色噜噜小说| 久久99国产视频| 护士xxxx18一19| 国产精品日韩电影| 中文字幕在线播放一区| 91中文字幕一区| 69久久夜色精品国产69–| 97视频久久久| 国产精品日韩一区二区三区| 精品91av| 国产91免费在线| 在线精品国产一区二区三区| 国产视频在线一区二区| 国产玖玖爱精品视频| 欧美日韩中文字幕三区| 久爱视频精品| 国产高清精品一区二区| 国产综合久久精品| 午夜社区在线观看| 日本一区二区电影在线观看| 99久久国产综合精品色伊| 99国产伦精品一区二区三区| 日韩精品中文字幕在线| 久久影院国产精品| 亚洲乱子伦| 日韩欧美中文字幕一区| 久久久一二区| 午夜一级免费电影| 亚洲国产欧美一区| 午夜毛片在线观看| 91精品婷婷国产综合久久竹菊| 中文字幕一级二级三级| 国产69精品99久久久久久宅男| 欧美大成色www永久网站婷| 日韩亚洲欧美一区| 91精品国产综合久久福利软件| 久久国产欧美一区二区免费| 久久婷婷国产综合一区二区| 日韩午夜三级| 亚洲第一天堂久久| 97人人澡人人爽人人模亚洲| 欧美一区二区三区四区夜夜大片 | 91热国产| 国产精品视频免费看人鲁| 99re热精品视频国产免费| 午夜av在线电影| 一区精品二区国产| 日本护士hd高潮护士| 亚洲乱亚洲乱妇50p| 精品a在线| www亚洲精品| 高清欧美xxxx| 日韩不卡毛片| 欧美网站一区二区三区| 一区二区国产盗摄色噜噜| 欧美激情精品久久久久久免费| 激情欧美一区二区三区| 欧美freesex极品少妇| 国产精品久久久av久久久| 日本伦精品一区二区三区免费| 日本一二三区视频| 91精品系列| 国内少妇自拍视频一区| 欧美大片一区二区三区| 国产精品视频久久久久久| 中文乱码字幕永久永久电影| 日韩精品中文字幕一区| xxxxhdvideosex| 一区二区三区免费高清视频| 国产欧美一区二区三区精品观看| 91久久一区二区| 李采潭无删减版大尺度| 国产麻豆一区二区三区精品| 狠狠色丁香久久婷婷综| 精品国产二区三区| 久久国产麻豆| 国产原创一区二区| 国产麻豆91视频| 亚洲国产日韩综合久久精品| 国产欧美一区二区三区免费| 国产日产高清欧美一区二区三区| 国产日韩欧美精品| 日韩区欧美久久久无人区| 国产精品麻豆一区二区| 国产精品一区亚洲二区日本三区| 国产在线一卡| 国产精品久久国产精品99| 久久人做人爽一区二区三区小说 | 欧美一区二区三区在线免费观看| 国产精品一区二区免费| 国产欧美视频一区二区三区| 少妇又紧又色又爽又刺激视频网站 | 满春阁精品av在线导航| 午夜爽爽视频| 国产精品一区二区免费| 精品国产一区二| 亚洲欧美一卡| 亚洲午夜国产一区99re久久| 高清欧美精品xxxxx| 欧美精品日韩精品| 日本五十熟hd丰满| 日本一区二区三区免费在线| 久久人人97超碰婷婷开心情五月| 精品中文久久| 精品久久久久99| 国产午夜精品一区二区三区欧美 | 精品久久9999| 国产精品日产欧美久久久久|