日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于因果圖的分層強化學習任務圖進化方法無效

專利信息
申請號: 201110369847.3 申請日: 2011-11-18
公開(公告)號: CN102521203A 公開(公告)日: 2012-06-27
發明(設計)人: 王紅兵;周建才 申請(專利權)人: 東南大學
主分類號: G06F15/18 分類號: G06F15/18;G06N3/12
代理公司: 南京天翼專利代理有限責任公司 32112 代理人: 朱戈勝
地址: 210089 江蘇*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 因果 分層 強化 學習 任務 進化 方法
【權利要求書】:

1.一種基于因果圖的分層強化學習任務圖進化方法,其特征是步驟包括:

(1)參數設置;

(2)探索目標環境的因果圖;

(3)種群N初始化;

(4)計算適應度值;

(5)遺傳操作,包括選擇、交叉和變異;操作時保持結點之間的因果關系;

(6)判斷是否終止;

(7)保存此因果圖對應的k個適應度最高的任務圖G1,G2,…,GK;

(8)輸出適應度最高的任務圖G1。

2.根據權利要求1所述的特征是所述的基于因果圖的分層強化學習任務圖進化方法,其特征是步驟1)中,進行進化的參數設置,包括種群規模、最大迭代次數、交叉概率和變異概率。

3.根據權利要求1所述的特征是所述的基于因果圖的分層強化學習任務圖進化方法,其特征是所述步驟3)中,進行種群M的初始化:

已知層次圖種群U1:HI-MAT構造出的現有環境的任務圖,如數量少于一個閥值,則進行單親繁殖,繁殖時保持因果依賴性;

隨機生成圖種群U2:隨機構造的任務圖,包括從包含所有原子動作的任務圖到包含所有合成子任務的任務圖;

M=U1+U2,M指初始化后生成的種群。

4.根據權利要求1所述的特征是所述的基于因果圖的分層強化學習任務圖進化方法,其特征是所述步驟4)中,計算適應度值:

Fitness(g)=total-reward(g)/steps:運行種群中的任務圖,計算各個體的適應度。

5.根據權利要求1所述的特征是所述的基于因果圖的分層強化學習任務圖進化方法,其特征是所述步驟5)中,

選擇:對適應度高的個體以更大的概率進行復制,各個體被選擇進行復制的概率選擇復制后生成N個個體;

交叉:隨機選擇N*Pc個個體進行交配,每對個體通過交配產生兩個新個體,代替原來的“老”個體,而不參與交配的個體則保持不變;對于兩個父個體,其子任務節點的交換時保持因果依賴性;

變異:隨機選擇N*Pm個個體的基因進行變異操作;

變異策略:隨機選擇個體的若干個子任務結點,對這些結點進行以下三種變換中的一種:

將結點用隨機產生且保持父子任務結點的因果依賴關系的結點進行替換;

重新產生新的子樹來替代舊子樹并保持因果依賴性;

交換結點的左右子樹,更新M。

本步驟中,Pc指交叉概率,Pm指變異概率,在參數設置時進行設置。

6.根據權利要求1所述的特征是所述的基于因果圖的分層強化學習任務圖進化方法,其特征是所述6)中,判斷是否終止的終止條件:執行次數大于n次且適應度最高的k個個體結構一樣且適應度高的一半個體和此k個個體的距離<a;未滿足終止條件則轉步驟3)。

7.根據權利要求1所述的特征是所述的基于因果圖的分層強化學習任務圖進化方法,其特征是交叉時,根據各個體的距離,進行遠親雜交。

8.根據權利要求1所述的基于因果圖的分層強化學習任務圖進化方法,其特征是當目標環境的因果圖逐漸變化時,需要調整算法適用這種動態變化的情況:采用保存先前學習的因果圖的對應k個適應度最高的任務圖,利用這種記憶機制加快學習;

處理變化的目標環境的步驟是:(a)當任務圖的學習性能下降了一個閾值時,啟動DBN學習算法;(b)構造因果圖;(c)此因果圖和先前保存的因果圖進行比較,選擇相同或最相似的因果圖對應的k個適應度最高的任務圖;(d)將此k個任務圖加入初始種群并重新啟動任務圖進化學習算法;(e)使用進化后的任務圖執行任務。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201110369847.3/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 亚洲一卡二卡在线| 精品一区二区三区中文字幕| www亚洲精品| 国产精品高潮呻吟视频| 91精品色| 国产原创一区二区 | 日韩午夜三级| 国产日本一区二区三区| 好吊妞国产欧美日韩免费观看网站 | 狠狠操很很干| 国产另类一区| 午夜看片网站| av国产精品毛片一区二区小说| 综合久久激情| 国产一级不卡视频| 国产www亚洲а∨天堂| 国产国产精品久久久久| 国产精品久久国产三级国电话系列 | 欧美一区二区三区久久| 中文字幕久久精品一区| 日韩av中文字幕在线免费观看| 亚洲国产精品肉丝袜久久| 国产亚洲精品久久777777| 香蕉视频一区二区三区| 日本高清一二区| 欧美一区二区三区久久精品视 | 亚洲欧美另类国产| 国产精品久久久久四虎| 4399午夜理伦免费播放大全| 国内精品久久久久久久星辰影视| 久久久精品a| 国产伦精品一区二区三区免费迷| 午夜影院伦理片| 91av精品| 国产亚洲精品久久午夜玫瑰园| 自拍偷在线精品自拍偷无码专区| 国产精品视频1区2区3区| 欧美日韩一区二区三区在线播放| 国产精品乱码一区二区三区四川人| 综合在线一区| 国产一区二区伦理片| 欧美国产在线看| 青苹果av| 国产精品一区二区在线看| 欧美资源一区| 色婷婷精品久久二区二区蜜臂av| 国产91视频一区| 97午夜视频| 欧美日韩一区二区三区不卡| 久久久久一区二区三区四区| 一区二区三区四区中文字幕| 国产精品亚发布| 国产一区二区伦理片| 欧美一区二区三区免费电影| 中文丰满岳乱妇在线观看| 国产一区二区三区影院| 国产精品视频免费一区二区| 欧美日韩一区二区三区不卡视频| 国产精品人人爽人人做av片| 欧美国产一区二区三区激情无套| 亚洲欧美日韩综合在线| 国产二区视频在线播放| 日韩av一二三四区| 国产精品一二二区| 久久狠狠高潮亚洲精品| 欧美日本91精品久久久久| 国产亚洲精品久久777777| 老女人伦理hd| 国产精品综合一区二区三区| 香蕉视频在线观看一区二区| 日韩欧美一区二区久久婷婷| 久久一区欧美| 欧美一区二区三区四区在线观看| 狠狠色很很在鲁视频| 国产精品视频久久| 91看片淫黄大片91| 亚洲一级中文字幕| 久久精品国产一区二区三区| 国产精品久久91| 97精品国产97久久久久久免费| 国产精品一区不卡| 国产精华一区二区精华|