日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于模型學習的清潔機器人最優目標路徑規劃方法有效

專利信息
申請號: 201610171859.8 申請日: 2016-03-24
公開(公告)號: CN105740644B 公開(公告)日: 2018-04-13
發明(設計)人: 劉全;周誼成;朱斐 申請(專利權)人: 蘇州大學
主分類號: G06F19/00 分類號: G06F19/00
代理公司: 蘇州市新蘇專利事務所有限公司32221 代理人: 朱亦倩
地址: 215000 江蘇*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 模型 學習 清潔 機器人 最優 目標 路徑 規劃 方法
【說明書】:

技術領域

發明涉及一種涉及機器學習中的強化學習方法,具體涉及一種基于模型學習的清潔機器人最優目標路徑規劃方法。

背景技術

強化學習(Reinforcement Learning,RL)是一種學習環境狀態到動作映射的機器學習方法。Agent選擇動作作用于環境,改變環境的狀態,遷移到新的環境狀態,并得到環境的反饋信號。這個反饋信號通常稱為獎賞或強化信號,Agent利用它通過一定的算法強化自己已經學習到的經驗,它的目標是最大化累計期望獎賞。

傳統的強化學習方法利用Agent與環境交互得到的信息進行學習,不斷更新值函數使之趨近最優解,例如動態規劃(Dynamic Programming,DP),蒙特卡洛(Monte Carlo,MC),和時間差分(Temporal Difference,TD)。這些方法是強化學習的基本方法,許多算法都由它們衍生而來。

模型學習方法的出現使強化學習的算法效率提高了一個臺階,它在近年來已成為強化學習中的一個研究熱點。

模型學習的最初思想(Dyna-Q算法)是將采集到的歷史樣本保存下來,在隨后的更新步驟中,除了更新當前時間步的樣本外,還從歷史樣本中抽取一些樣本進行更新。這樣,樣本的利用率得到增加,提高了值函數收斂的效率。在這樣的思想下之后進一步演化為對模型的構建,即利用當前得到的樣本構建一個環境的模型。在對真實環境的不斷探索中,構建的模型會越來越精確和完整,這個模型就可以代替真實環境被充分地利用,節省與真實環境交互的開銷。

那么,模型學習的效率就取決于模型構建的速度,模型構建得越快,算法從模型中得到的信息就越有價值。顯然,交互獲得的樣本廣度直接影響到模型構建的速度。Dyna-H使用了一種啟發式的規劃方法,通過預測做出動作后到達的下一個狀態與終點之間的歐式距離,來使Agent盡量遠離終點,這樣就可以使Agent在一個情節中盡可能多地探索環境,避免過早到達終點。

然而,Dyna-H算法是有局限性的。在有障礙物的情況下,兩點間的歐式距離并不能很好的反映它們之間的真實距離。可能由于一墻之隔,位于墻一側的Agent可能需要繞一個大彎才能到達墻另一側的終點,而歐式距離則顯示它們離得很近。另外,Dyna-H保留了Dyna-Q中取歷史樣本的方法,而沒有去為環境建立真正的模型。基于此,算法的性能還可以進一步提高。

在模型學習的方法中,R-MAX是一種高效探索的方法,它的核心思想是假設所有未知的狀態-動作所獲得的獎賞為最大獎賞Rmax,并轉移到終止狀態。這樣,當選擇值最大的動作時,就會選擇這個未知動作,從而隱式地達到了探索的目的。當狀態-動作對被訪問到m次時,則標記該狀態-動作對為已知,將來不再探索。這樣,所有狀態-動作對都能被快速均勻地探索,從而學習到較為精確的模型。

針對Dyna-H中計算狀態間距離的局限性,本發明采用更為精確的自模擬度量的方法。首先介紹自模擬關系:若兩個狀態滿足自模擬關系,則它們擁有相同的最優值函數和最優動作。Ferns等人在在自模擬關系的基礎之上,利用Kantorovich距離衡量兩個概率分布之間的距離,提出了一種可用于衡量兩個狀態之間遠近關系的自模擬度量方法(Bisimulation Metric)。相比于歐式距離,自模擬度量引入了獎賞函數,狀態轉移函數等要素,能更精確地表示狀態之間的距離。

發明內容

本發明目的是:提供一種基于模型學習的清潔機器人最優目標路徑規劃方法,通過將自模擬度量和R-MAX相結合來改進搜索方式,提高模型學習的效率,從而最終提高值函數的搜索效率,效率的提高使得機器人能夠快速地建立環境模型,從而優先選擇垃圾最多的地點,并計算出達到該地點的最優路徑。

本發明的技術方案是:一種基于模型學習的清潔機器人最優目標路徑規劃方法,其特征在于,包括如下步驟:

步驟1)初始化模型,設置R(x,u)=Rmax,f(x,u,x′)=1,其中R(x,u)為獎賞函數,f(x,u,x′)為狀態轉移函數,Rmax為最大獎賞值,x、u為狀態動作對,x′為執行x、u后轉移到的下一個狀態;

步驟2)初始化環境,設置機器人的起始位置;

步驟3)判斷當前的探索完全度η,若達到閾值I,轉入步驟4),否則轉入步驟(5);

步驟4)使用自模擬度量方法,計算當前機器人可做的所有動作所到達的地點與最多垃圾堆的距離,選擇使距離最大的動作,轉入步驟(6);

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學,未經蘇州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201610171859.8/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 一区二区三区国产精华| 亚洲国产精品美女| 日韩一区二区中文字幕| av中文字幕一区二区| 国产精品久久久久久一区二区三区| 狠狠躁夜夜躁人人爽天天天天97| 国产精品久久久久久久久久久杏吧 | 久久久久久中文字幕| 国产日韩麻豆| 亚洲欧美国产中文字幕 | 艳妇荡乳欲伦2| 九一国产精品| 欧美精品一区久久| 91区国产| 99国产超薄丝袜足j在线观看| 国产.高清,露脸,对白| 91精品国产91久久久| 国产精品一区二区免费视频| 久久国产这里只有精品| 精品国产乱码一区二区三区在线| 性色av香蕉一区二区| 国产理论一区二区三区| 亚洲视频h| 中文字幕一区二区在线播放| 欧美日韩偷拍一区| 狠狠躁夜夜躁人人爽天天天天97 | 久久久国产精品一区| 国产精品免费观看国产网曝瓜| 国产精品刺激对白麻豆99| 国产99久久九九精品| 麻豆精品一区二区三区在线观看| 一区二区三区四区国产| 国产日产欧美一区| 精品福利一区二区| 亚洲欧洲一区| 国产乱xxxxx国语对白| 国产99小视频| 91麻豆精品国产91久久久无限制版| 欧美亚洲视频一区二区| 老太脱裤子让老头玩xxxxx| 亚洲精品一区二区三区98年| 欧美精品久久一区| 国产精品视频久久久久久| 一区二区久久精品| 日韩一级片免费观看| 色午夜影院| 91精品一区二区中文字幕| 国产伦精品一区二区三区免费迷| 日韩一区二区三区福利视频| 欧美日韩综合一区| 国产精品v欧美精品v日韩精品v| 国产美女三级无套内谢| 日韩精品免费一区二区中文字幕| 99国产精品久久久久99打野战| 欧美性xxxxx极品少妇| 狠狠插狠狠插| 久久精品入口九色| 亚洲欧美一区二区三区三高潮| 亚洲国产精品网站| 久久99国产视频| 午夜在线看片| 狠狠色综合久久丁香婷婷| 日韩精品免费一区| 欧美日韩综合一区二区| 久精品国产| 国产精品视频一区二区三| 麻豆91在线| 在线观看欧美一区二区三区| 国产理论片午午午伦夜理片2021 | 欧美高清xxxxx| 亚洲欧美另类国产| 国产午夜一级一片免费播放| 国产区二区| 国产一区日韩在线| 欧美髙清性xxxxhdvid| 亚洲国产精品激情综合图片| 久久夜色精品国产噜噜麻豆| 久久精品视频中文字幕| 国产精品无码永久免费888| 欧美一区二区三区久久精品| 国产乱老一区视频| 欧美日韩三区二区| 曰韩av在线| 午夜肉伦伦影院九七影网| 91亚洲欧美日韩精品久久奇米色| 久久国产精品首页| 国产精品黑色丝袜的老师| 亚洲精品国产精品国自| 2023国产精品久久久精品双| 日韩国产精品一区二区 | 久久一区二区三区视频| 少妇bbwbbwbbw高潮| 午夜av资源| 亚洲精品色婷婷| 久久精品男人的天堂| 国产欧美精品一区二区三区-老狼| 色综合久久精品| 91视频一区二区三区| 999久久久国产| 国产清纯白嫩初高生视频在线观看| 欧美777精品久久久久网| 色乱码一区二区三在线看| 粉嫩久久久久久久极品| 国产欧美精品va在线观看| 国产一区二区三区精品在线| 美女直播一区二区三区| 久久精品国产亚洲7777 | 国产欧美一区二区三区免费视频| 国产精品视频二区三区| 91精品久久久久久| 国产88在线观看入口| 久久国产这里只有精品| 国产精品一级在线| 一区二区不卡在线| 午夜av免费观看| 亚洲精欧美一区二区精品| 99国精视频一区一区一三| 亚洲高清乱码午夜电影网| 久久天天躁狠狠躁亚洲综合公司 | 少妇又紧又色又爽又刺激的视频 | 国产乱人乱精一区二视频国产精品| 欧美在线视频三区| 猛男大粗猛爽h男人味| 亚洲精品国产一区| 久久99久久99精品蜜柚传媒| 对白刺激国产对白精品城中村| 亚洲精品久久久久www| av午夜在线| 国产精品久久免费视频| 狠狠综合久久av一区二区老牛| 欧美精品一区二区三区四区在线| 精品国产亚洲一区二区三区| 玖玖爱国产精品| www.日本一区| 午夜影院黄色片| 欧美在线一区二区视频| 国产天堂一区二区三区| 国产日韩欧美综合在线| а√天堂8资源中文在线| 欧美视频1区| 性视频一区二区三区| 欧美一区二区三区激情| 窝窝午夜理伦免费影院| 97香蕉久久国产超碰青草软件| 亚洲精品乱码久久久久久写真| 久久夜色精品亚洲噜噜国产mv| 欧美日韩久久一区| 少妇高潮ⅴideosex| 久久96国产精品久久99软件| 中出乱码av亚洲精品久久天堂| 日韩免费一级视频| 淫片免费看| 国产日韩麻豆| 久99久精品| 中文天堂在线一区| 爱看av在线入口| 午夜毛片影院| 99久久精品免费看国产免费粉嫩| 国产69精品久久99不卡免费版| 精品国产一区二区三| 国产一区二| 日本一区二区免费电影| 精品a在线| 国产欧美日韩va另类在线播放| 欧美一区二区三区性| 91婷婷精品国产综合久久| 国产精品二区一区二区aⅴ| 午夜影院毛片| 国产91电影在线观看| 国产亚洲久久| 9999国产精品| 久久综合伊人77777麻豆| 国产精品理人伦一区二区三区| 偷拍自中文字av在线| 国产亚洲精品久久久456| 视频二区狠狠色视频| 午夜无人区免费网站| 久久九九国产精品| 日韩精品免费一区二区中文字幕| 窝窝午夜精品一区二区| 国产九九影院| 国产精品人人爽人人做av片| 久久一区二区三区欧美| 日韩精品一区二区av| 亚洲精品国产setv| 人人玩人人添人人澡97| 中文字幕一二三四五区| 国产91视频一区| 亚洲精品乱码久久久久久写真| 日本精品三区| 欧美日韩久久一区| 午夜激情在线| 国产一级片自拍| 久久一区欧美| 国产69精品久久久久按摩 | 久久er精品视频| 欧美精品久| 欧美一级久久久| 日本一区二区电影在线观看| 欧美一区二区三区中文字幕| 色噜噜日韩精品欧美一区二区 | 日韩av免费电影| 国产精品电影一区二区三区| 少妇高潮ⅴideosex| 国产一区免费播放| 精品国产一二区| 91麻豆精品国产自产欧美一级在线观看| 肉丝肉足丝袜一区二区三区| 亚洲福利视频二区| 性欧美1819sex性高播放| 中文字幕一二三四五区| 久久天天躁狠狠躁亚洲综合公司| 最新国产一区二区| 91福利视频免费观看| 国产精品99999999| 亚洲精品国产主播一区| 国产99久久久久久免费看| 日韩久久精品一区二区三区| 精品欧美一区二区在线观看| 狠狠色综合久久婷婷色天使| 国产一区二区二| 日韩一级片免费观看| 婷婷午夜影院| 日韩精品乱码久久久久久| 日韩av在线影视| 国产一区在线视频播放| 午夜理伦影院| 黄色香港三级三级三级| 久久天天躁夜夜躁狠狠躁2022| 精品国产乱码久久久久久图片| 精品国产一区二区三区四区vr| 久99久视频| 午夜色影院| 日韩欧美国产第一页| 国产精品久久国产精品99| 日韩av在线高清| 久久国产中文字幕| 亚洲精品国产一区二区三区| 理论片午午伦夜理片在线播放 | 一区二区在线国产| 色综合久久精品| 91久久国产露脸精品国产护士| 欧美日韩久久精品| 国产精品高潮呻吟88av| 国产91刺激对白在线播放| 久久99国产精品久久99果冻传媒新版本 |