[發(fā)明專利]一種基于Q學(xué)習(xí)和胸鰭鰭條偏置的仿生魚俯仰控制方法在審
| 申請(qǐng)?zhí)枺?/td> | 202211567754.6 | 申請(qǐng)日: | 2022-12-07 |
| 公開(公告)號(hào): | CN115793678A | 公開(公告)日: | 2023-03-14 |
| 發(fā)明(設(shè)計(jì))人: | 曹勇;張代利;潘光;曹永輝;黃橋高 | 申請(qǐng)(專利權(quán))人: | 西北工業(yè)大學(xué)寧波研究院;西北工業(yè)大學(xué) |
| 主分類號(hào): | G05D1/06 | 分類號(hào): | G05D1/06 |
| 代理公司: | 西安凱多思知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 61290 | 代理人: | 王鮮凱 |
| 地址: | 315000 浙*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 學(xué)習(xí) 胸鰭 偏置 仿生 俯仰 控制 方法 | ||
1.一種基于Q學(xué)習(xí)和胸鰭鰭條偏置的仿生魚俯仰控制方法,其特征在于步驟如下:
步驟1、建立仿蝠鲼機(jī)器魚快速俯仰控制問(wèn)題的有限馬爾科夫模型:
1、俯仰控制的離散狀態(tài)空間S,俯仰角度的反饋為θ∈[0°,360°),傳感器反饋俯仰角為俯仰真值,期望俯仰的取值范圍為θ′∈[0°,+360°);
俯仰偏差Δθ的取值范圍:Δθ=θ-θ′,Δθ∈(-360°,+360°)
狀態(tài)空間離散化:={s-n,s-n+1,…,s-1,s0,s1,…,sn-1,sn}
其中:
s-n=(-180°,Δθ-n],
s-n+1=(Δθ-n,Δθ-n+1],
……,
s-1=(Δθ-2,Δθ-1],
s0=(Δθ-1,Δθ1),
s1=(Δθ1,Δθ2],
……,
sn-1=(Δθn-1,Δθn]
sn=(Δθn,180°)
其中,Δθi的取值范圍可以根據(jù)實(shí)際情況調(diào)整,其中一種簡(jiǎn)單的方式為取Δθi=360°/n,i∈{-n,-n+1,…,-1,0,1,…,n-1,n};
2、建立離散動(dòng)作空間A:
A={a-n,a-n+1,…,a-1,a0,a1,…,an-1,an}
其中a表示動(dòng)作空間的元素,代表固定的胸鰭前級(jí)鰭條和后級(jí)鰭條偏置的角度總和,且-180°≤a≤180°,左右胸鰭采用對(duì)稱的偏置角度作為控制量的響應(yīng);
3、設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù):
其中:rt+1為在時(shí)刻t,狀態(tài)為st,動(dòng)作為at,下一時(shí)刻狀態(tài)為st+1,得到的獎(jiǎng)勵(lì);δ為調(diào)整仿蝠鲼機(jī)器魚的俯仰控制精度的參數(shù);
步驟2、建立動(dòng)作-價(jià)值函數(shù)表格Q(s,a):
步驟3、訓(xùn)練Q表格:
1、以原始深度和姿態(tài)變化數(shù)據(jù),計(jì)算t時(shí)刻獎(jiǎng)勵(lì)函數(shù)rt+1(st,at);
建立訓(xùn)練Q表的數(shù)據(jù)集Datatest,設(shè)存儲(chǔ)量為N,里面存儲(chǔ)狀態(tài)轉(zhuǎn)移信息Transition;
其中:Datatest={Transition1,Transition2,…,TransitionN}
Transitioni={st,at,st+1,rt+1}
2、Q(sn,an)更新公式的為:
其中,α為學(xué)習(xí)率,γ為折扣因子;
3、從訓(xùn)練數(shù)據(jù)集中隨機(jī)抽取數(shù)據(jù),根據(jù)上步Q(sn,an)更新公式計(jì)算公式循環(huán)更新表格,直到Q表中Q價(jià)值的變化誤差小于規(guī)定值ε;
步驟4、設(shè)計(jì)控制策略:
在狀態(tài)為s時(shí),選擇使得Q(s,a)取得最大值的動(dòng)作a。
2.根據(jù)權(quán)利要求1所述基于Q學(xué)習(xí)和胸鰭鰭條偏置的仿生魚俯仰控制方法,其特征在于:所述原始深度和姿態(tài)變化實(shí)驗(yàn)數(shù)據(jù)通過(guò)實(shí)驗(yàn)手段獲得或者前人做實(shí)驗(yàn)獲得。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西北工業(yè)大學(xué)寧波研究院;西北工業(yè)大學(xué),未經(jīng)西北工業(yè)大學(xué)寧波研究院;西北工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211567754.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 一種大變形柔性機(jī)構(gòu)線驅(qū)動(dòng)的仿生牛鼻鲼擺動(dòng)胸鰭
- 具有獨(dú)立環(huán)狀尾部支撐的機(jī)器魚及其浮潛方法
- 一種具有獨(dú)立環(huán)狀尾部支撐的機(jī)器魚
- 一種基于全柔性胸鰭的模塊化仿生水下機(jī)器人
- 一種仿生柔體線驅(qū)動(dòng)大變形海豚
- 一種仿生柔體線驅(qū)動(dòng)大變形海豚
- 可實(shí)現(xiàn)橢圓軌跡的海豚胸鰭蝶泳式拍動(dòng)機(jī)構(gòu)
- 一種柔性線驅(qū)動(dòng)海豚
- 一種柔性線驅(qū)動(dòng)海豚
- 一種聯(lián)動(dòng)式探測(cè)機(jī)器魚





