日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于積分強化學習的多消防巡檢協作機器人系統有效

專利信息
申請號: 202110419574.2 申請日: 2021-04-19
公開(公告)號: CN113134187B 公開(公告)日: 2022-04-29
發明(設計)人: 陳剛;劉智 申請(專利權)人: 重慶大學
主分類號: A62C27/00 分類號: A62C27/00;A62C37/00;A62C37/50
代理公司: 北京同恒源知識產權代理有限公司 11275 代理人: 趙榮之
地址: 400044 重*** 國省代碼: 重慶;50
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 積分 強化 學習 消防 巡檢 協作 機器人 系統
【權利要求書】:

1.基于積分強化學習的多消防巡檢協作機器人系統,其特征在于:包括依次連接的硬件層、交互層、感知層和控制層;

所述硬件層采用DSP作為控制器,將里程計和陀螺儀采集到的數據送入DSP內部進行處理,實時計算出機器人在巡檢地圖中的位置;通過上位機向DSP發送速度指令,DSP將獲取到速度信息編碼后以控制伺服電機的運轉;消防巡檢機器人采用的是履帶式驅動;當機械臂需要動作時,由上位機中的ros系統通過在moveit!平臺對機械臂將要移動到的目標點進行運動軌跡規劃,將規劃好的運動軌跡離散化后發送到DSP中,DSP獲得各個軸的角速度、加速度后控制機械臂的伺服電機運動以到達目標點;

所述感知層包括用于建圖的激光雷達、避障的紅外線傳感器、檢測火焰的火焰探測器、溫度傳感器和realsenseD435i深度攝像頭、里程計和陀螺儀;

所述控制層為:

設整個消防巡檢區域下共有N個機器人協同巡檢,N個機器人從各自的初始位置(xi0,yi0)要到達各自的目的地(xiD,yiD),i∈{1,2,…,N},設第i個消防巡檢機器人在t時刻的位置Li(t)=[Lix(t),Liy(t)]T,速度Vi(t)=[Vix(t),Viy(t)]T,控制器輸入Ui(t)=[uix(t),uiy(t)]T,控制輸入和未知的環境擾動Wi(t)=[Wix(t),Wiy(t)]T,為避免執行器飽和,對輸入進行約束,要求|U(t)|≤λ,其中λ為正常數;設兩個巡檢機器人之間的距離rij(t)=||Li(t)-Lj(t)||,為避免兩個巡檢機器人發生碰撞需要設置一個安全距離rs,要求在巡檢過程中的任意時刻都要滿足rij(t)≥rs,設當N個機器人到達巡檢目的地后保證rij(t)>>rs,此時i≠j;

則考慮第i個消防巡檢機器人的二階線性動力學模型為:

其中系統矩陣為A,輸入矩陣為B,輸出矩陣為C,干擾矩陣為D,為機器人在t時刻的狀態,為輸入,yi(t)為系統唯一輸出;

將全局動力學模型寫為:

其中為Kronecker乘積,X(t)=[x1(t),x2(t),...,xn(t)]T,Y(t)=[y1(t),y2(t),...,yn(t)]T,IN為N階單位矩陣,且設L(t)=[L1t,L2t,...,LNt]T,LD=[L1D,L2D,...,LND]T,U0=[U1,U2,...,UN]T分別為N個機器人的在t時刻的位置、目標點位置和控制輸入;

為使N個消防巡檢機器人在未知的擾動下實現在連續時間、連續狀態和控制輸入空間中的最小時間和能量的最優控制,并且在整個過程中要避免碰撞,考慮以下成本函數:

其中ζ0,用于表示巡檢過程中時間的比重,R為正定矩陣;為求解機器人最小到達時間T未知的路徑規劃問題,引入雙曲正切函數將成本函數改寫成無窮積分的形式以便求解,另外為避免執行器飽和,還想要對輸入進行約束,將U(t)TRU(t)線性二次型改寫成非二次型性能函數φ(U(t)用于逼近最小能量成本并且捕獲輸入約束,且為避免兩個機器人之間發生碰撞引入了人工勢場函數,將成本函數近似改寫為:

其中ζ為正常數,tanh為雙曲正切函數,該函數為單調遞增的奇函數且連續可微,成本函數是IRL可解的形式;將ζ改寫為ζtanh(L(t)-LD)T(L(t)-LD),當機器人當前位置L(t)距離目標點LD時ζtanh(L(t)-LD)T(L(t)-LD)近似為ζ,到達目標點時ζtanh(L(t)-LD)T(L(t)-LD)=0,將未知時間的T積分轉化為與到達時間T無關的無窮積分,以實現對值函數的最優求解;

將U(t)TRU(t)線性二次型改寫成非二次型性能函數φ(U(t)用于逼近最小能量成本并且捕獲輸入約束:

其中輸入約束為|U(t)|≤λ,λ和σ均為正常數,R=diag(r1,r2...rm)>0;

為避免任何一對巡檢機器人發生碰撞,加入人工勢場函數fR(rij(t))使得兩個機器人之間發出排斥勢場使得二者相互避開,為使得加入勢場函數之后的V(x(t),U(t))有界,設計權重矩陣ΛR(t),用于抵消非零尾部;將排斥函數fR(rij(t))定義高斯函數的形式,且該高斯函數總是大于0:

其中s越大則排斥函數的陡度就越大,σ越大排斥范圍也越大;為捕捉排斥距離rij(t),求解排斥函數中的s和σ,設有:

fR(rs)=K0;fR(rs+Δ)=K1 (4-7)

其中0<K1<K0<1;Δ為正增量,代入得:

通過權重矩陣ΛR(t)=[Λ12(t),Λ13(t),...,ΛN-1,N(t)]T來使得引入人工勢場函數后的值函數是有界的,且權重矩陣取決于與目標點的距離;

ΛR(t)=βtanh(||Li(t)-LiD||2+||Lj(t)-LjD||2) (4-9)

當機器人遠離目標點時ΛR(t)=β,當機器人到達目標點時ΛR(t)=0,β為碰撞系數,β的大小由巡檢過程中避免碰撞的重要性決定;

下面利用(4-4)中的成本函數求解最優控制輸入,(4-4)式兩邊對t求導,貝爾曼方程寫為:

令Fζ(t)=ζtanh(L(t)-LD)T(L(t)-LD),定義最優值函數為:

根據(4-10)式定義HJB方程為:

其中

在穩定性條件下有(4-12)式兩邊同時對U求導得:

移項后得最優控制輸入U*(t)為:

將(4-14)代入到(4-5)中得:

其中l為全為一的列向量,將(4-14)代入(4-15)中得:

其中將(4-16)代入(4-12)中得:

利用基于積分強化學習的策略迭代算法求解HJB方程,積分強化學習使用(t,t+T)內的信號用于學習,不需要知道系統具體的動力學模型;

首先將值函數改寫成積分差值的形式,得到如下的貝爾曼方程:

為能夠在線實時地求解(4-18),引入actor-critic神經網絡算法來實現策略迭代過程中的實時更新;首先通過critic神經網絡對值函數V(X)進行近似逼近,因為

而其中第一項為易求得的二次型,只對第二項進行逼近,并設用神經網絡對V0(X)進行逼近得:

其中wc為critic神經網絡的權重,ψc(X)為基函數,εc(X)為逼近誤差;

將(4-20)兩邊對X求微分得:

將(4-20)代入到(4-18)中得到新的貝爾曼方程:

其中εe(t)=εc(X(t+T))-εc(X(t))為貝爾曼方程誤差,Δψc(X(t)=ψc(X(t+T)-ψc(X(t);

為確定wc,將(4-20)改寫成:

其中為V0(X)的近似值,為理想的逼近系數,則(4-22)式為:

令為貝爾曼跟蹤誤差,并構造以下目標函數,通過使得εe(t)最小化來調整critic神經網絡的權重系數:

將(4-25)式兩邊對求導,再由鏈式法則得:

其中βc0為學習率,為Δψc的近似值;

將Ee代入到(4-26)得critic神經網絡的權重系數的更新應服從:

將得到的理想權重系數代入到(4-14)中得最優控制策略,然而通過critic逼近的值函數所求得的最優策略卻并不能保證閉環系統的穩定性,要為執行器引入actor神經網絡來保證收斂到最優解的同時還能夠保證系統的穩定性:

為actor神經網絡的最優逼近系數,的更新由以下李雅普諾夫函數來確定:

當wa滿足下式時,所逼近的策略使得系統一致最終有界,通過得到U*(t);

其中K1、K2為設計好的正常數,

基于(4-19)、(4-27)、(4-28)和(4-30)式,分別利用critic和actor算法實現對值函數和策略函數的同步更新,設計一種基于策略迭代的在線積分強化學習算法來求解HJB方程,以求解最優控制輸入;

算法:基于策略迭代的在線IRL算法

初始化:給定一個可行的執行器輸入

Step1:策略評估,給定初始利用下式求解

Step2:策略改進,將代入下式更新

Step3:令返回Step1,直至收斂到最小值。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶大學,未經重慶大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110419574.2/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 一区二区在线视频免费观看 | 欧美极品少妇xx高潮| 国产一区二区麻豆| 国产精品电影免费观看| 麻豆精品一区二区三区在线观看| 国产亚洲精品久久久久久网站| 亚洲国产精品国自产拍av| 国产精品视频免费看人鲁| 中文字幕亚洲欧美日韩在线不卡| 欧美亚洲另类小说| 国产美女三级无套内谢| 国产在线不卡一区| 男女午夜爽爽| 国产91在线播放| 91精品啪在线观看国产手机| 色婷婷综合久久久中文一区二区| 欧美hdxxxx| 久久99国产精品久久99| 激情久久一区二区| 99久久精品一区| 亚洲精品久久久中文| 欧洲另类类一二三四区| 91久久国产露脸精品| 欧美日韩一级黄| 视频一区二区中文字幕| 国产伦精品一区二区三区四区| 国产白丝一区二区三区| 亚洲精品性| 满春阁精品av在线导航| 精品国产一二区| 狠狠色噜噜狠狠狠狠黑人| 国产一区三区四区| 狠狠色噜噜狠狠狠狠2021天天| 国产精品96久久久| 麻豆国产一区二区三区| 91黄在线看 | _97夜夜澡人人爽人人| 国产一区免费播放| 日韩精品1区2区3区| 91亚洲国产在人线播放午夜| 国产日韩欧美三级| 午夜生活理论片| 亚洲欧美国产日韩色伦| 亚洲国产精品美女| 一级久久精品| 一色桃子av| 欧美一区二区三区精品免费| 国产91丝袜在线| 少妇高潮一区二区三区99小说| 97人人澡人人爽91综合色| 亚洲二区在线播放视频| 国产精品久久久区三区天天噜| 国产一区www| 狠狠色噜噜狠狠狠狠| 国产色婷婷精品综合在线手机播放| 午夜激情在线播放| 日韩偷拍精品| 国产一区二区三区午夜| 欧美亚洲另类小说| 一区二区久久精品| 97人人澡人人添人人爽超碰| 久久精品一| 久久久精品中文| 欧美精品免费看| 午夜wwww| 国产精品日本一区二区不卡视频| 色综合久久久| 亚洲乱强伦| 国产精品免费自拍| 亚洲一区欧美| 国产欧美日韩va另类在线播放| 久久精品视频偷拍| 国产乱对白刺激视频在线观看 | 中文字幕一区二区三区四| 色婷婷久久一区二区三区麻豆| 欧美精品免费看| av国产精品毛片一区二区小说| 久久一区二区三区欧美| 97欧美精品| 国偷自产中文字幕亚洲手机在线 | 日本边做饭边被躁bd在线看| 性欧美激情日韩精品七区| 一区不卡av| 91偷自产一区二区三区精品| 在线精品国产一区二区三区 | 99久久国产综合| 国产午夜亚洲精品午夜鲁丝片| 精品国产伦一区二区三区免费 | 日韩av在线影院| 国产91丝袜在线熟| 九九热国产精品视频| 少妇性色午夜淫片aaa播放5| 国产日韩区| 香蕉视频在线观看一区二区| 国产一二区精品| 久久精品国产久精国产| 亚洲欧美另类久久久精品2019| 午夜看片在线| 亚洲国产美女精品久久久久∴| 97久久精品一区二区三区观看| 久久99精品久久久久国产越南| 狠狠躁夜夜躁| 国产精品久久久不卡| 91国偷自产中文字幕婷婷| 国产精品欧美久久| 91超薄丝袜肉丝一区二区| 国产精品一区在线观看你懂的 | 国产在线干| 2018亚洲巨乳在线观看| 国产精品亚洲欧美日韩一区在线| 激情aⅴ欧美一区二区三区| 国产69精品久久久| 国产另类一区| 欧美一区二区三区四区五区六区| 综合国产一区| 亚洲欧美日韩国产综合精品二区| 亚欧精品在线观看| 91久久精品国产91久久性色tv| 日本美女视频一区二区三区| 欧美一区二区三区艳史| 国产精品视频一区二区三| 91久久国产露脸精品| 麻豆精品一区二区三区在线观看| 中文在线一区二区三区| 国产一区在线免费| 亚洲欧洲日本在线观看| 97人人澡人人爽人人模亚洲| 午夜一级电影| 99国产精品免费| 午夜影院91| 91麻豆国产自产在线观看hd| 国产一区二三| 狠狠躁夜夜躁xxxxaaaa| 午夜一级免费电影| 精品国产乱码久久久久久老虎| 99久久国产综合精品尤物酒店| 91精品国产九九九久久久亚洲| 亚洲va国产| 欧美一区二区三区视频在线观看| 国产精品二区在线| 激情欧美日韩| 国产精品一二三区免费| 欧美一区二区三区中文字幕| 好吊色欧美一区二区三区视频 | 国产区精品区| 国产一区网址| 久久乐国产精品| 国产偷亚洲偷欧美偷精品| 久久激情综合网| 91精品美女| 狠狠色狠狠色综合日日2019| xoxoxo亚洲国产精品| 999亚洲国产精| 午夜影皖精品av在线播放| 亚洲欧洲另类精品久久综合| 国产91视频一区| 亚洲欧洲另类精品久久综合| 欧美日韩久久一区| 国产99久久久精品视频| 精品久久综合1区2区3区激情| 99国产精品免费| 欧美一区亚洲一区| 日韩欧美一区精品| 欧美一区二区三区免费观看视频| 久久不卡一区| 中文字幕一区三区| 狠狠色丁香久久婷婷综合丁香| 国产二区三区视频| 一区二区国产盗摄色噜噜| 精品欧美一区二区精品久久小说 | 国产乱淫精品一区二区三区毛片| 国产在线不卡一区| 亚洲码在线| 亚洲欧美v国产一区二区| 国产91九色视频| 国产乱人乱精一区二视频国产精品| 亚洲国产精品国自产拍久久| 国产在线精品区| 婷婷嫩草国产精品一区二区三区| 久久精品综合| 国产欧美日韩中文字幕| 国产一区正在播放| 亚洲日本国产精品| 99国产精品免费| 免费**毛片| 中文字幕一区二区三区免费| 一区二区在线不卡| 日本午夜久久| 国产精品自产拍在线观看蜜| 午夜影院毛片| 99精品区| 中文字幕二区在线观看| 国产精品亚发布| 亚洲精品日韩色噜噜久久五月| 午夜电影网一区| 国产精品99一区二区三区| 欧美精品一区免费| 91精品黄色| 91丝袜国产在线观看| 日本xxxxxxxxx68护士| 欧美久久一区二区三区| 国产精品欧美久久久久一区二区 | 日韩精品一区三区| 456亚洲精品| 久久一区二区三区视频| 91福利视频导航| 国产乱xxxxx97国语对白| 99久久国产综合| 日韩av在线网| 亚洲国产一区二| 国产精品天堂| 欧美在线观看视频一区二区 | 91久久香蕉| 亚洲国产精品一区在线| 国产一区二区在线观| 玖玖爱国产精品| 久久久久亚洲最大xxxx| 99国产精品久久久久| 日本精品99| 国内自拍偷拍一区| 精品国产鲁一鲁一区二区三区| 91在线一区二区| 国产精品一区二区不卡| 欧美精品日韩一区| 国产一区二区影院| 久久99精品国产麻豆婷婷洗澡| 欧美一区二区三区性| 国产经典一区二区三区| 久免费看少妇高潮a级特黄按摩 | 99视频国产精品| 国产伦精品一区二区三区免| 一区二区三区欧美视频| 欧美日韩国产精品一区二区亚洲| 免费的午夜毛片| 国产精品一区二区麻豆| 日韩av电影手机在线观看| 97午夜视频| 99精品偷拍视频一区二区三区| 又色又爽又大免费区欧美| 欧美激情精品一区| 国产视频一区二区视频| 三级视频一区| 国产精品综合在线观看| 国产不卡三区| 性xxxxfreexxxxx交| 日韩一区免费在线观看|