日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于強化學習的機器人時間最優軌跡規劃方法及控制器有效

專利信息
申請號: 202010746579.1 申請日: 2020-07-29
公開(公告)號: CN111983924B 公開(公告)日: 2022-03-15
發明(設計)人: 李琳;肖佳棟;張鐵;鄒焱飚 申請(專利權)人: 華南理工大學;中山市華南理工大學現代產業技術研究院
主分類號: G05B13/04 分類號: G05B13/04
代理公司: 廣州粵高專利商標代理有限公司 44102 代理人: 江裕強
地址: 510640 廣*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 強化 學習 機器人 時間 最優 軌跡 規劃 方法 控制器
【權利要求書】:

1.基于強化學習的機器人時間最優軌跡規劃方法,其特征在于,包括以下步驟:

S1將任務路徑的各關節參數輸入到路徑參數化模塊轉化為關于末端路徑的標量參數,具體包括以下步驟:

S11獲取任務路徑的時間序列的各關節角位移;

S12將各關節角度代入機器人正運動學方程獲得時間序列的笛卡爾空間位移;

其中,上述機器人正運動學方程為采用如下的矩陣表達式

其中px、py、pz表示機器人末端坐標相對于基坐標的位置在極坐標x、y、z軸方向的分量,通過計算相鄰時間間隔px、py、pz的變化得到笛卡爾空間位移;nx、ny、nz表示末端姿態的X軸方向在極坐標x、y、z方向的分量;ox、oy、oz表示末端姿態的Y軸方向在極坐標x、y、z方向的分量;ax、ay、az表示末端姿態的Z軸方向在極坐標x、y、z方向的分量;

矩陣Γ由各軸的相鄰坐標系的變換矩陣相乘得到,即其中為機器人總的關節數,相鄰坐標系的變換矩陣表達式如下

其中表示機器人任一關節,表示第軸的坐標系的Z軸繞著根據右手定則確定的X軸轉到第軸的坐標系的Z軸需要的角位移,表示第軸的坐標系的Z軸沿著根據右手定則確定的X軸到第軸的坐標系的Z軸的垂直距離,表示根據右手定則確定的第軸的坐標系的X軸沿著第軸的Z軸到第軸的坐標系的X軸的距離,表示根據右手定則確定的第軸的坐標系的X軸沿著第軸的Z軸轉動到第軸的坐標系的X軸的角位移;

S13根據笛卡爾空間位移計算機器人的路徑弧長,并取位移在總弧長的占比作為機器人在任一時刻的標量位移s;

S14使用分段最小二乘方法擬合關節角位移q關于標量位移s的函數q(s);

S15對函數q(s)進行求導,獲得路徑曲率q′(s)和路徑曲率變化率q″(s);

S2將參數化后的路徑輸入到路徑離散化模塊進行路徑離散化,具體包括以下步驟:

S21設定路徑曲率之差的閾值σ以及路徑曲率變化率之差的閾值

S22設定m=1,κ=n=時間序列數,將各時間序列的路徑標量位移按時間順序構成集合其中m,κ,n均表示中間變量;

S23當m<n時,如果或則令m=m+1,否則取集合中第m-1個數放入集臺并令κ=m;上式中max()表示取最大值,和表示集合中的第κ個數和第m個數,下標i表示機器人的第i個關節,表示當路徑位移為集合中的第κ個數的值時的第i個關節的路徑曲率,表示當路徑位移為集合中的第κ個數的值時的第i個關節的路徑曲率變化率,表示當路徑位移為集臺中的第m個數的值時的第i個關節的路徑曲率,表示當路徑位移為集合中的第m個數的值時的第i個關節的路徑曲率變化率;

S24重復步驟S23直到m≥n,則集合N就是離散化后的路徑標量位移的集合;

S3將離散化后的路徑輸入到強化學習模塊中構建強化學習環境,具體包括以下步驟:

S31將相平面分割為N×M的網格;所述網格分割方法具體包括以下步驟:

S311設定機器人運行時允許的各關節最大允許速度最大允許加速度最小允許速度最大允許加速度

S312根據不等式組

求得每個離散點允許的最大路徑標量速度,式中表示機器人的末端標量速度,表示機器人的末端標量加速度,q′i(s)和q″i(s)表示機器人的第i關節在末端標量位移為s時的函數q(s)的一階導數和二階導數;

S313設定在相平面上要劃分的網格尺寸N×M,其中N是沿著s方向要離散的網格數,沿著s方向的分割方法為步驟S2的離散化,從而將相平面沿s方向分割為N部分,M是沿著方向要離散的網格數;

S314以各離散點中最大的路徑標量速度作為速度上限以為步長,將相平面沿方向分割為M部分;

S315將相平面分割為N×M的網格,每個網格點即為一個狀態,當前網格點到下一個網格點的移動即為一個動作;

S32設定強化學習的狀態值函數,所述狀態值函數為:

Q(Sk,Ak)←Q(Sk,Ak)+α[Rk+1+γQ(Sk+1,Ak+1)-Q(Sk,Ak)]

式中Sk表示相平面上的第k個狀態,Ak表示在第k個狀態時選擇的動作,Q()表示在狀態Sk時選擇動作Ak對應的Q值表上的值,α表示學習系數,γ表示折扣因子,Rk+1表示在狀態Sk時執行動作Ak獲得的獎勵或懲罰,箭頭←表示箭頭右邊的值賦值給左邊;

S33設定強化學習的搜索策略,所述的搜索策略為貪婪策略,其具體步驟為:

S331設定貪婪因子ε,其取值范圍在0到1之間;

S332隨機生成一個在0到1之間的數λ;

S333如果λ<ε,則執行探索,在動作范圍內隨機選取一個動作;如果λ≥ε,則選取動作范圍內具體最大路徑標量速度的動作;

S34設定強化學習的動作獎勵和懲罰,所述動作獎勵和懲罰的表達式如下

其中,和表示在第k-1和k個狀態選擇的動作得到的狀態對應的路徑標量速度;

當程序選擇的動作指向的下一個狀態違反約束條件,即違反步驟S312不等式組或當前狀態的動作范圍內沒有動作可選擇時,則獲得懲罰,否則,當程序選擇的動作指向的下一個狀態不違反約束條件時,則得到獎勵;

S35設定強化學習的動作選擇范圍,所述動作范圍選擇設定步驟具體如下:

S35l根據式計算當前狀態的最大標量加速度以及最小標量加速度

S352根據勻加速運動方程求得下一狀態允許的最大/最小標量速度,標量速度范圍內Q值大于0的網格點即為可供選擇的動作范圍;

S4使用強化學習模塊學習最優的策略軌跡,具體包括以下步驟:

S41初始化Q值表,將Q值表上的值都設置為0,設定最大學習次數并初始化學習次數為1;

S42當學習次數<最大學習次數時,轉到步驟S44,否則轉到步驟S49;

S43令k=1,初始化獎勵值Rk+1=0,從起始狀態(0,0)開始學習過程,計算下一狀態動作范圍,并使用貪婪策略從動作范圍中選取出動作Ak

S44當k≤N并且Rk+1≥0時,轉到步驟S45;

S45執行動作Ak,獲得獎勵或懲罰Rk+1和狀態Sk+1,并計算下一狀態動作范圍;

S46如果獎勵或懲罰Rk+1<0或下一狀態動作范圍為空,則轉到步驟S47,否則轉到步驟S48;

S47令Q(sk+1,Ak+1)=0,并根據步驟S32的狀態值函數更新動作Q值,同時為了加速懲罰,對這段探索過程中的所有動作都添加一個懲罰項進行懲罰,具體做法為對于從1逐漸增大到k的整數j,有Q(Sj,Aj)=Q(Sj,Aj)+ρk-jRk+1,其中ρ為懲罰因子,其取值范圍為0<ρ<1,之后令學習次數+1并轉到步驟S42;

S48在狀態Sk+1計算動作范圍,并通過貪婪策略從動作范圍中選取動作Ak+1,之后根據步驟S32的狀態值函數更新動作Q值,令Sk←Sk+1,Ak←Ak+1,k←k+1,并轉到步驟S45;

S49當學習次數到達最大學習次數時,令貪婪因子ε=0重新進行學習過程,即在從狀態(0,0)開始學習時,不會再進行探索,而會直接選取當前動作范圍內具有最大路徑標量速度的動作,從而獲得在最大學習次數下所能獲得的最優策略軌跡,同時將訓練后的Q值表保存到存儲模塊中,在下一次訓練時調用訓練過的Q值表,節省學習時間;

S5運行策略軌跡獲得反饋的關節力矩:求出到達每個路徑離散點k所需要的時間t(k):

由勻加速運動方程,規劃完成時間最優軌跡后路徑離散點的加速度為

其中s(k)表示第k個離散點所對應的路徑位移,表示第k個離散點所對應的路徑速度,表示第k個離散點所對應的路徑加速度;

由速度加速度方程,可求出到達每個路徑離散點k所需要的時間t(k):

求得到達每個路徑離散點的時間之后,便可求得每個控制周期的路徑標量位移;若要求第n個控制周期的標量位移,到達該控制點的時間即為nT,其中T為控制周期;假設該控制時間與到達路徑離散點k所需要的時間t(k)最接近,則這兩點的時間間隔為:

Δt=nT-t(k)

根據勻加速運動方程,該控制點的路徑位移即為:

從而可以求得每個控制周期的路徑標量位移,再代入函數q(s)即可求得每個控制周期的關節角度,最后將關節角度轉化為關節脈沖指令傳輸到機器人控制器運行;

S6將反饋的關節力矩輸入到強化學習模塊從而對強化學習環境進行修正,具體做法為:在獲得測量力矩之后,如果某一狀態點對應的測量力矩超過給定力矩約束的限制,即將相平面上的該狀態點設為不可行狀態,當在該狀態的前一狀態通過貪婪策略剛好選擇的動作指向該不可行狀態時,將之視為違反約束條件的情況并直接對相應動作的Q值進行懲罰。

2.根據權利要求1所述的基于強化學習的機器人時間最優軌跡規劃方法的控制器,其特征在于,包括路徑參數化模塊、路徑離散化模塊、強化學習模塊和存儲模塊;

所述路徑參數化模塊,用于將機器人關節參數轉化為關于末端路徑的標量參數;

所述路徑離散化模塊,用于將機器人末端的連續任務路徑離散化為若干個離散點;

所述強化學習模塊,用于構建機器人時間最優軌跡規劃的強化學習環境以及在強化學習環境中學習最優策略軌跡;

所述存儲模塊,用于存儲強化學習的學習數據。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學;中山市華南理工大學現代產業技術研究院,未經華南理工大學;中山市華南理工大學現代產業技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010746579.1/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产欧美性| 狠狠色成色综合网| 欧美精品粉嫩高潮一区二区| 国产精品自拍在线| 国产日韩欧美亚洲综合| 999久久久国产| 93久久精品日日躁夜夜躁欧美| 午夜黄色网址| 思思久久96热在精品国产| 日本久久不卡| 欧美久久久一区二区三区| 国产精品一区二区麻豆| 国产激情视频一区二区| 欧美精品日韩| 亚洲一区欧美| 91黄色免费看| 国产女人和拘做受视频免费| 91精品国产综合久久国产大片 | 中文字幕+乱码+中文字幕一区 | 国产福利一区在线观看| 国产欧美性| 国产麻豆91视频| 伊人久久婷婷色综合98网| 一区二区三区国产视频| 日韩毛片一区| 激情久久久| 欧洲在线一区二区| 亚洲欧美色一区二区三区| 538国产精品一区二区免费视频| 少妇**毛片| 激情久久一区二区| 中文字幕欧美一区二区三区 | 91波多野结衣| 国产在线拍偷自揄拍视频| 日韩av在线播放观看| 中文字幕日本精品一区二区三区| 亚洲国产精品网站| 国产精品欧美久久| 日韩欧美一区精品| 国产精品九九九九九| 国产目拍亚洲精品区一区| 国产综合亚洲精品| 天摸夜夜添久久精品亚洲人成| 亚洲精品97久久久babes| 91精品久久久久久| 国产一区不卡视频| 亚洲激情中文字幕| 国产日产欧美一区二区| 国产精品乱码久久久久久久久| 久久99精品国产麻豆宅宅| 国偷自产中文字幕亚洲手机在线| 国产一级不卡视频| 欧美日韩一级二级| 亚洲精品国产suv| 国产一区在线免费| 午夜诱惑影院| 亚洲一二三在线| 福利电影一区二区三区| 国产69精品久久久久久| 免费观看又色又爽又刺激的视频| 国产精品天堂| 精品久久久久久中文字幕大豆网| 四虎国产永久在线精品| 亚洲国产精品国自产拍久久| 亚洲精品无吗| 日韩欧美中文字幕精品| 精品久久综合1区2区3区激情| 国产69精品久久久久按摩| 亚洲一二区在线观看| 中文字幕一区二区三区四| 91精品啪在线观看国产手机| 精品一区欧美| 久久99国产综合精品| 精品少妇一区二区三区免费观看焕 | av午夜电影| 88888888国产一区二区| 三级视频一区| 国产视频二区在线观看| 国产女性无套免费看网站| 躁躁躁日日躁网站| 99精品国产一区二区三区麻豆 | 91片在线观看| 免费欧美一级视频| 91一区二区三区视频| 国产一区二区伦理| 91九色精品| 狠狠色噜噜狠狠狠狠69| 97精品国产aⅴ7777| 国产精品9区| 人人要人人澡人人爽人人dvd| 狠狠色狠狠色很很综合很久久| 国产精品日韩一区二区三区| 91精品色| 亚洲久久在线| av不卡一区二区三区| 国产99视频精品免视看芒果| 午夜爽爽爽男女免费观看| 亚洲午夜久久久久久久久电影院| 99视频国产在线| 国产一区二区综合| 午夜电影天堂| 亚洲乱小说| 久久精品国产精品亚洲红杏| 麻豆国产一区二区三区| 国产伦精品一区二区三区免费下载| 狠狠搞av| 国产精品高潮呻吟久| 精品少妇一区二区三区| 国产一区二区三区国产| 欧美福利三区| 欧美日韩亚洲另类| 91福利试看| 99国产精品| 日韩午夜一区| 久久精品国产色蜜蜜麻豆| 欧美精品日韩一区| 国产99小视频| 国产天堂一区二区三区| 视频一区欧美| 欧美乱偷一区二区三区在线 | 欧美一级日韩一级| 国产精品久久久久久久龚玥菲| 19videosex性欧美69| 久久密av| 91一区在线| 在线观看国产91| 亚洲天堂国产精品| 国产区一区| 久久99精品久久久久国产越南 | 狠狠插狠狠爱| 91avpro| 午夜激情影院| 久久国产精彩视频| 国产欧美精品va在线观看| 国产精品国外精品| 日韩欧美亚洲视频| 国产一区二区伦理| 国产一区日韩欧美| 亚洲久色影视| 国产精品不卡在线| 欧美一区二区三区久久精品| 午夜一级免费电影| 亚洲国产精品精品| 97精品超碰一区二区三区| 窝窝午夜理伦免费影院| 国产精品高潮在线| av不卡一区二区三区| 国产日韩欧美一区二区在线播放| 欧美久久久一区二区三区| 日本三级香港三级网站| 99久久久国产精品免费无卡顿| 韩日av一区二区三区| 欧美视屏一区| 在线国产精品一区二区| 亚洲欧美日韩国产综合精品二区| 国产91视频一区| 国产盗摄91精品一区二区三区| 一色桃子av大全在线播放| 久久久久亚洲国产精品| 91精品国产综合久久婷婷香| 国产精品久久久综合久尹人久久9| 国产一区三区四区| 欧美三区视频| 亚洲福利视频二区| 日韩av在线资源| 欧美精品一区二区三区久久久竹菊| 97欧美精品| 91精品国产91久久久| 久久精品入口九色| 日韩一级精品视频在线观看| 国产一区二区伦理片| 国产一区2区3区| 国产精品欧美一区二区三区| 国产伦精品一区二区三区照片91| 亚洲国产精品综合| 国产精品一区不卡| 自拍偷在线精品自拍偷写真图片| 欧美髙清性xxxxhdvid| 久久久中精品2020中文 | 一区二区三区国产欧美| 91精品一区二区在线观看| 国产精品久久久久99| 91精品久久久久久综合五月天| 人人澡超碰碰97碰碰碰| 三级视频一区| 午夜电影一区| 狠狠躁夜夜躁| 国产一区二区播放| 日韩精品免费看| 亚洲欧美一区二区精品久久久| 伊人av综合网| 中文天堂在线一区| 日韩一级片在线免费观看| 国产69精品久久久久孕妇不能看| 狠狠色依依成人婷婷九月| 欧美精品久| 亚洲一二区在线观看| _97夜夜澡人人爽人人| 国产大片黄在线观看私人影院| 亚洲精品久久久久久久久久久久久久 | 99爱精品视频| 亚洲精品国产一区二| 99精品国产免费久久| 亚洲精品色婷婷| xxxxx色| 欧美三级午夜理伦三级老人| 亚洲激情中文字幕| 国产精品一二三区视频网站| 精品国产乱码久久久久久影片| 日本一区二区三区四区高清视频| 亚洲w码欧洲s码免费| 国产精品区一区二区三| 精品国产一区二区三区在线| 91看片app| 久久99精品国产麻豆婷婷洗澡| 免费在线观看国产精品| 欧美精品国产一区| 激情久久综合网| 国产视频二区| 色噜噜狠狠一区二区| 国产乱人伦偷精品视频免下载 | 午夜性电影| 99国精视频一区一区一三| 国产女人和拘做受视频免费| 久久国产精品欧美| 精品国产一区二区三区国产馆杂枝| 亚洲va国产2019| 午夜在线看片| 美女被羞羞网站视频软件| 国产在线观看免费麻豆| 日韩毛片一区| 国产精品一区在线播放| 国产亚洲精品久久久久秋霞| 欧美一区二区三区不卡视频| 欧美日韩一区二区三区在线播放 | 国产资源一区二区| 亚洲欧美日韩在线看| 国产精品中文字幕一区二区三区 | 97香蕉久久国产超碰青草软件 | 午夜影院激情| 国产电影精品一区| 色乱码一区二区三区网站| 久久精品国产亚洲一区二区| 国产精彩视频一区二区| 亚洲午夜精品一区二区三区电影院| 日韩av视屏在线观看|