[發(fā)明專利]基于滑模控制器的輸送車尋跡方法有效
| 申請?zhí)枺?/td> | 201610814708.X | 申請日: | 2016-09-09 |
| 公開(公告)號: | CN107037808B | 公開(公告)日: | 2020-04-24 |
| 發(fā)明(設計)人: | 劉華珠;陳雪芳;王善進;羅欣;劉學良;吳泰峰 | 申請(專利權)人: | 東莞理工學院 |
| 主分類號: | G05D1/02 | 分類號: | G05D1/02;G05B13/04 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 張艷美;龍莉蘋 |
| 地址: | 523808 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 控制器 輸送 車尋跡 方法 | ||
1.一種基于滑模控制器的輸送車尋跡方法,使用滑模控制器控制輸送車的運行軌跡,使得所述輸送車的運行軌跡貼合磁道路徑,其特征在于,包括以下步驟:
(1)使用檢測單元采集獲得所述輸送車的中心位置到所述磁道的距離誤差ed和輸送車相對于所述磁道路徑的偏離角度eθ;
(2)依據(jù)預設或者已有的ε參數(shù)的策略模型,計算所述距離誤差ed對應的ε參數(shù)大小,使得ε參數(shù)隨著所述距離誤差的降低而縮小,ε參數(shù)為離散滑模趨近律中控制控制逼近速率的參數(shù),ε參數(shù)的策略為滑模控制器每一次動作對應的ε參數(shù)或者參數(shù)變化的映射,ε參數(shù)的策略模型為ε參數(shù)的策略集合;
(3)依據(jù)確定好的ε參數(shù)、距離誤差ed、偏離角度eθ和離散滑模趨近律計算并調(diào)整所述輸送車左輪和右輪的速度,從而以調(diào)整所述輸送車的運行路徑;
其中,確定所述策略模型的方法,包括以下步驟:將輸送車離線運行若干回,利用馬爾科夫決策過程計算策略π并求解最優(yōu)策略以獲取策略模型。
2.如權利要求1所述的基于滑模控制器的輸送車尋跡方法,其特征在于,確定所述策略模型的方法具體步驟包括:將所述距離誤差馬爾科夫過程化,依據(jù)預設好的規(guī)律建立每一個動作對應的ε參數(shù),使得每一次動作時所述ε參數(shù)依據(jù)預設規(guī)律遞減,使用所述檢測單元檢測距離誤差ed,獲取每一次動作ε參數(shù)與距離誤差ed之間的映射,將輸送車離線運行若干回,依據(jù)策略迭代計算最優(yōu)策略以獲取策略模型。
3.如權利要求2所述的基于滑模控制器的輸送車尋跡方法,其特征在于,利用馬爾科夫決策過程計算策略π的具體步驟包括:
(11)使用檢測單元檢測所述輸送車的中心位置到所述磁道的距離誤差,將磁檢測單元的檢測最大偏差edmax數(shù)值分成M個等級,從而對應建立所述距離誤差的狀態(tài)集合S=edi,i=1、2…M,其中edi為量化過的誤差,從而將距離誤差ed馬爾科夫過程化;
(12)建立行動集合A,使用ε參數(shù)的變化程度代表一次行動a,將每一次行動a或者ε參數(shù)依據(jù)預設規(guī)律設置為不同速度的遞減,使得ε參數(shù)隨著距離誤差的減小而減小;
(13)獲取狀態(tài)集合S到行動集合A的映射。
4.如權利要求3所述的基于滑模控制器的輸送車尋跡方法,其特征在于,依據(jù)策略迭代計算最優(yōu)策略的方法具體步驟包括:(A)計算每一次行動a對應的回報值R;(B)依據(jù)最大化回報期望最優(yōu)原則,求取最優(yōu)回報值對應的策略以獲得最優(yōu)策略。
5.如權利要求4所述的基于滑模控制器的輸送車尋跡方法,其特征在于,所述步驟(A)具體包括:設計回報函數(shù)R=C/(Δedi+l),其中C、l為常數(shù),Δedi為每一次行動距離誤差的變化程度,依據(jù)回報函數(shù)計算每一次行動對應的回報值R。
6.如權利要求4所述的基于滑模控制器的輸送車尋跡方法,其特征在于,所述步驟(B)具體包括:確定最優(yōu)回報準則為折扣因子,K=M,E為常數(shù),依據(jù)最優(yōu)回報準則求取最優(yōu)回報值對應的策略。
7.如權利要求6所述的基于滑模控制器的輸送車尋跡方法,其特征在于,依據(jù)策略迭代計算最優(yōu)策略的方法還包括求取狀態(tài)轉移概率的步驟:當狀態(tài)Si時若采取行動ak從狀態(tài)Si到狀態(tài)Sj,則這個轉移的概率為狀態(tài)轉移概率(Psa)ijk,使得每一個行動都一個狀態(tài)轉移概率矩陣對應。
8.如權利要求7所述的基于滑模控制器的輸送車尋跡方法,其特征在于,依據(jù)策略迭代計算最優(yōu)策略獲取策略模型的具體步驟包括:
定義一值函數(shù)Vπ:S→R采用策略π時,在狀態(tài)s的期望回報:sk為采樣時刻的狀態(tài),k=0為初始狀態(tài)s,γ為輸送車減速機構傳動比,以遞歸形式表示為:
進行從值函數(shù)Vπ(s)到策略π的過程,定義行動值函數(shù)Qπ:S·A→R,為在狀態(tài)s采用行動a,其他狀態(tài)采用策略π的期望回報:
策略函數(shù)由最大化行動值函數(shù)獲得:
重復以上步驟從而通過不斷迭代來獲取一個最優(yōu)策略,從而獲取策略模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東莞理工學院,未經(jīng)東莞理工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610814708.X/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:終端裝置及終端控制方法
- 下一篇:一種馬達的冷卻裝置





