日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]移動機器人路徑規劃Q學習初始化方法無效

專利信息
申請號: 201210269280.7 申請日: 2012-07-30
公開(公告)號: CN102819264A 公開(公告)日: 2012-12-12
發明(設計)人: 宋勇;李貽斌;劉冰;王小利;榮學文 申請(專利權)人: 山東大學
主分類號: G05D1/02 分類號: G05D1/02
代理公司: 濟南圣達知識產權代理有限公司 37221 代理人: 張勇
地址: 250061 山東*** 國省代碼: 山東;37
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 移動 機器人 路徑 規劃 學習 初始化 方法
【說明書】:

技術領域

發明屬于機器學習技術領域,尤其涉及一種移動機器人路徑規劃Q學習初始化方法。

背景技術

隨著機器人應用領域的不斷拓展,機器人所面臨的任務也越來越復雜,盡管很多情況下研究人員可以對機器人可能執行的重復行為進行預編程,但為實現整體的期望行為而進行行為設計變得越來越困難,設計人員往往不可能事先對機器人的所有行為做出合理的預測。因此,能夠感知環境的自治機器人必須能夠通過與環境的交互在線學習獲得新的行為,使得機器人能夠根據特定的任務選擇能達到目標的最優動作。

強化學習利用類似于人類思維中的試錯(trial-and-error)的方法來發現最優行為策略,目前已經在機器人行為學習方面展現出了良好的學習性能。Q學習算法是求解信息不完全Markov決策問題的一種強化學習方法,根據環境狀態和上一步學習獲得的立即回報,修改從狀態到動作的映射策略,以使行為從環境中獲得的累積回報值最大,從而獲得最優行為策略。標準Q學習算法一般將Q值初始化為0或隨機數,機器人沒有對環境的先驗知識,學習的初始階段只能隨機地選擇動作,因此,在復雜環境中算法收斂速度較慢。為了提高算法收斂速度,研究人員提出了許多改進Q學習的方法,提高算法學習效率,改善學習性能。

通常情況下,加速Q學習收斂速度的方法主要包括兩個方面:一種方法是設計合適的回報函數,另一種方法是合理初始化Q函數。

目前,研究人員已經提出了許多改進的Q學習算法,使機器人在強化學習的過程中能夠獲得更加有效的回報,主要包括:關聯Q學習算法、惰性Q學習算法、貝葉斯Q學習算法等。其主要目的就是將對于機器人有價值的隱含信息融入到回報函數中,從而加速算法收斂速度。

關聯Q學習將當前回報與過去時刻的立即回報進行比較,選擇回報值更大的動作,通過關聯回報方法能夠改善系統的學習能力,減少獲得最優值所需要的迭代步數。

惰性Q學習的目標是提供一種預測狀態立即回報的方法,學習過程中利用信息延遲原則,在必要的情況下對新的目標進行預測,動作比較器檢查每一種情形的期望回報,然后選擇期望回報最大的動作執行。

貝葉斯Q學習利用概率分布描述機器人狀態-動作對Q值的不確定性估計,學習過程中需要考慮前一時刻Q值的分布,并利用機器人學習到的經驗對先前的分布進行更新,利用貝葉斯變量表示當前狀態的最大累積回報,貝葉斯方法從本質上改進了Q學習的探索策略,改善了Q學習的性能。

由于標準強化學習中強化信號都是由狀態值函數計算得到的標量值,無法將人的知識形態和行為模式融入到學習系統中。而在機器人學習過程中,人往往具有相關領域的經驗和知識,因此,在學習過程中將人的認知和智能以強化信號的形式反饋給機器人,能夠減小狀態空間維數,加快算法收斂速度。針對標準強化學習在人機交互過程中存在的問題,Thomaz等在機器人強化學習過程中由人實時地給出外部強化信號,人根據自身經驗調整訓練行為,引導機器人進行前瞻性探索。Arsenio提出了一種對訓練數據進行在線、自動標注的學習策略,在人機交互過程中通過觸發特定的事件獲得訓練數據,從而將施教者嵌入到強化學習的反饋回路。Mirza等提出了基于交互歷史的體系結構,機器人能夠利用與人進行社會性交互的歷史經驗進行強化學習,使機器人能夠在與人進行的簡單游戲中逐漸獲得合適的行為。

另一種改善Q學習算法性能的方法就是將先驗知識融入到學習系統中,對Q值進行初始化。目前,對Q值進行初始化的方法主要包括近似函數法、模糊規則法、勢函數法等。

近似函數法利用神經網絡等智能系統逼近最優值函數,將先驗知識映射成為回報函數值,使機器人在整個狀態空間的子集上進行學習,從而能夠加快算法收斂速度。

模糊規則法根據初始環境信息建立模糊規則庫,然后利用模糊邏輯對Q值進行初始化。利用這種方法建立的模糊規則都是根據環境信息人為設定的,往往不能客觀地反映機器人的環境狀態,造成算法不穩定。

勢函數法在整個狀態空間定義相應的狀態勢函數,每一點勢能值對應于狀態空間中某一離散狀態值,然后利用狀態勢函數對Q值進行初始化,學習系統的Q值可以表示為初始值加上每次迭代的改變量。

在機器人的各種行為當中,機器人必須遵守一系列的行為準則,機器人通過認知與交互作用涌現出相應的行為與智能,機器人強化學習Q值初始化就是要將先驗知識映射成為相應的機器人行為。因此,如何獲得先驗知識的規則化表達形式,特別是實現領域專家的經驗與常識知識的機器推理,將人的認知和智能轉化為機器的計算和推理的人機智能融合技術是機器人行為學習急需解決的問題。

發明內容

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東大學,未經山東大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210269280.7/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 99re6国产露脸精品视频网站| 少妇中文字幕乱码亚洲影视| 日本神影院一区二区三区| 国产性猛交xx乱视频| 大bbw大bbw超大bbw| 国产一区二区视频播放| 久久激情图片| 国产麻豆精品久久| 日韩av一二三四区| 夜夜躁日日躁狠狠躁| 精品一区在线观看视频| 91国偷自产中文字幕婷婷| 日本一区二区三区免费在线| 伊人精品一区二区三区| 日韩亚洲欧美一区| 国产精品videossex国产高清| 久热精品视频在线| 国产精品99一区二区三区| 欧美日韩国产免费观看| 国产大片一区二区三区| 日本久久不卡| 国产精品9区| 国产精品久久久久久久久久久新郎| 国产一区二区三区四区五区七| **毛片在线免费观看| 亚洲精品日本无v一区| 欧美一区二区三区片| xxxx国产一二三区xxxx| 日韩精品一区二区中文字幕| 538国产精品一区二区| 日韩欧美多p乱免费视频| 91偷自产一区二区三区精品| 91黄在线看| 亚洲国产精品精品| 日韩欧美中文字幕一区| 久久精品视频3| 国产精品亚洲精品一区二区三区| 久久久精品观看| 国产精品九九九九九| 日本一区欧美| 99精品欧美一区二区| 亚洲一级中文字幕| 91一区在线观看| 久久综合国产精品| 福利片91| 91亚洲欧美日韩精品久久奇米色| 一区二区三区国产精品| 色综合久久久久久久粉嫩| 久久午夜鲁丝片| 久久久综合香蕉尹人综合网| 首页亚洲欧美制服丝腿 | 玖玖玖国产精品| 狠狠色综合久久婷婷色天使| 999久久国精品免费观看网站| 久热精品视频在线| 国产日韩精品久久| 国产高清一区在线观看| 国产一区日韩在线| 欧美老肥婆性猛交视频| 精品久久9999| 日本美女视频一区二区三区| 日韩av在线播放观看| 欧美在线免费观看一区| 国产日韩欧美在线影视| 国产丝袜一区二区三区免费视频| 97人人模人人爽人人喊小说| 国产精品久久亚洲7777| 狠狠色狠狠综合久久| 中文字幕国内精品| 日本xxxxxxxxx68护士| 精品国产一区二区三区久久久久久| 久久一区二区三区视频| 国产麻豆91欧美一区二区| 理论片高清免费理伦片| 欧美一区二区三区免费观看视频 | 精品国产一区二区三区高潮视| 日韩av在线影院| 精品国产乱码久久久久久久| 亚洲精品一区二区三区香蕉| 国产精品欧美一区乱破| 一区二区免费播放| 国产精品乱码一区| 91精品国产91热久久久做人人| 欧美日韩偷拍一区| 日韩av在线中文| 中文在线一区| 精品久久久久一区二区| 91视频国产一区| 精品久久不卡| 国产精品99999999| 一区二区国产精品| 欧美xxxxhdvideos| 久久激情网站| 久久精品99国产精品亚洲最刺激 | 亚洲国产精品激情综合图片| 国产99久久九九精品免费| 免费精品99久久国产综合精品应用| 午夜特片网| 一区二区精品久久| 国产69精品福利视频| 久久综合激情网| 51区亚洲精品一区二区三区| 91视频国产九色| 午夜大片男女免费观看爽爽爽尤物| 一区二区三区国产视频| 国产日韩欧美综合在线| 亚洲精品91久久久久久| 亚洲欧美国产精品va在线观看| 国产乱人乱精一区二视频国产精品 | 欧美精品在线视频观看| 欧美一区二区三区免费在线观看| 99国产精品九九视频免费看| 日韩免费一级视频| 久久久精品免费看| 午夜剧场一区| 粉嫩久久久久久久极品| 麻豆91在线| 在线国产一区二区三区| 久久精品男人的天堂| 在线国产91| 国模精品免费看久久久| 亚洲欧洲国产伦综合| 久久夜色精品国产噜噜麻豆| 国产精品剧情一区二区三区| 午夜剧场a级免费| 国产一区二区伦理| 日韩无遮挡免费视频| 国产色99| 精品99在线视频| 欧美一区二区三区爽大粗免费| 国产精品视频久久| 一区二区三区电影在线观看| 午夜wwwww| 久久二区视频| 欧美日韩一区视频| 91一区二区三区在线| 亚洲精品主播| 欧美片一区二区| 99日韩精品视频| 在线国产精品一区| 亚洲无人区码一码二码三码| 国产在线不卡一| 日韩在线一区视频| 久久久精品欧美一区二区| 国产精品高潮在线| 亚洲在线久久| 久久久久国产一区二区三区不卡| 91久久精品国产亚洲a∨麻豆 | 99日本精品| 99国产精品丝袜久久久久久| 右手影院av| 久草精品一区| 日韩精品一区在线观看| 国产精品一区二区免费视频| 少妇久久精品一区二区夜夜嗨| 色狠狠色狠狠综合| 日本五十熟hd丰满| 午夜爽爽视频| 国产伦理久久精品久久久久| 韩漫无遮韩漫免费网址肉| 久久99国产视频| 国产偷窥片| 国产精品一二三区视频出来一 | 亚洲精品国产91| 在线视频不卡一区| 91人人精品| 国产精品麻豆一区二区三区| 日韩av免费网站| 久久久99精品国产一区二区三区 | 欧美一区二区三区国产精品| 97久久精品人人澡人人爽| 精品无人国产偷自产在线| 91精品啪在线观看国产线免费| 97国产精品久久| 国产精品一区二区av麻豆| 欧美一区视频观看| 91av中文字幕| 欧美精品二区三区| 国产欧美日韩精品在线| 99久热精品| 色噜噜狠狠狠狠色综合久| 玖玖国产精品视频| 国产欧美亚洲精品第一区软件| 国产馆一区二区| 午夜看片网址| 国产日产精品一区二区| 国模精品免费看久久久| 久久网站精品| 国产99久久久国产精品免费看| 国产精品久久久久久久久久软件| 亚洲精品久久久久久久久久久久久久 | 大伊人av| 狠狠躁夜夜躁xxxxaaaa| 国产乱子伦农村xxxx| 亚洲区在线| 亚洲欧美v国产一区二区| 夜夜躁人人爽天天天天大学生 | 精品国产一二三四区| 国91精品久久久久9999不卡| 8x8x国产一区二区三区精品推荐| 国产精品一区亚洲二区日本三区 | 狠狠色综合欧美激情| 丝袜美腿诱惑一区二区| 91精品国产麻豆国产自产在线| 国产婷婷色一区二区三区在线| 国产精品久久久久久久岛一牛影视| 欧美在线视频精品| 亚洲美女在线一区| 精品视频在线一区二区三区| 黑人巨大精品欧美黑寡妇| 精品少妇的一区二区三区四区| 久久国产精彩视频| 国产一区二区在线免费| 午夜电影毛片| 国产有码aaaae毛片视频| 91亚洲精品国偷拍| 久久久久久久久亚洲精品| 国产一级精品在线观看| 国模一区二区三区白浆| 日韩精品中文字幕一区二区三区| 日本一区午夜艳熟免费| 国产精品女同一区二区免费站| 久久精品亚洲一区二区三区画质| 欧美日韩一区二区电影| 一区二区国产精品| 中文字幕欧美另类精品亚洲| 欧美精品日韩精品| 亚洲午夜精品一区二区三区电影院| 国产区一区| 日韩久久电影| 日韩不卡毛片| 亚洲欧美日韩精品suv| 影音先锋久久久| 6080日韩午夜伦伦午夜伦| 综合久久国产九一剧情麻豆| 久久激情综合网| 男人的天堂一区二区| 91精品视频一区二区| 国产人澡人澡澡澡人碰视| 国产日韩欧美精品一区| 97精品久久人人爽人人爽| 国产69精品久久久久777| 91看片app| 欧美日韩一级在线观看| 亚洲制服丝袜在线| 四虎久久精品国产亚洲av|