[發(fā)明專利]一種基于GRU網(wǎng)絡(luò)的UUV實時避碰規(guī)劃方法有效
| 申請?zhí)枺?/td> | 201810052628.4 | 申請日: | 2018-01-17 |
| 公開(公告)號: | CN108334677B | 公開(公告)日: | 2021-06-11 |
| 發(fā)明(設(shè)計)人: | 王宏健;林常見;呂洪莉;李慶;張勛;劉大偉 | 申請(專利權(quán))人: | 哈爾濱工程大學(xué) |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06N3/04;G06N3/08;G01C21/20 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150001 黑龍江省哈爾濱市南崗區(qū)*** | 國省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 gru 網(wǎng)絡(luò) uuv 實時 規(guī)劃 方法 | ||
1.一種基于GRU網(wǎng)絡(luò)的UUV實時避碰規(guī)劃方法,其特征在于,包括以下步驟:
步驟一 構(gòu)建全局坐標(biāo)系和局部坐標(biāo)系,建立聲納仿真模型;
全局坐標(biāo)系采用北東坐標(biāo)系,地圖左下角為原點,正北方向為X軸,正東方向為Y軸;局部坐標(biāo)系原點選在UUV重心處,X軸取在UUV縱向剖面內(nèi),指向UUV艏端,Y軸與縱剖面垂直,指向UUV右舷;二維多波束聲納仿真模型水平開角為120°,最大探測半徑為120m,共80個波束,波束角為1.5°,每個波束上探測噪聲為±1%;
步驟二 設(shè)計用于實時避碰規(guī)劃的GRU網(wǎng)絡(luò);
所設(shè)計的GRU網(wǎng)絡(luò)為端對端模型,可以直接根據(jù)傳感器探測信息得出規(guī)劃結(jié)果,該網(wǎng)絡(luò)模型包含四層,分別為輸入層、隱藏層、中間層以及輸出層;
步驟三 構(gòu)建數(shù)據(jù)集;
數(shù)據(jù)集包括訓(xùn)練集和測試集,分別用于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練階段和測試階段;構(gòu)建訓(xùn)練集時,在全局坐標(biāo)系中生成若干組隨機地圖及實時路徑,并在每個路徑節(jié)點采集聲納信息,所采集的信息為訓(xùn)練樣本,將實時路徑中UUV艏向調(diào)整的轉(zhuǎn)艏及速度作為訓(xùn)練標(biāo)簽;構(gòu)建測試集時,在全局坐標(biāo)系中生成若干組隨機地圖及實時路徑,并在每個路徑節(jié)點采集聲納信息,所采集的信息為測試樣本,將實時路徑中UUV轉(zhuǎn)艏及速度作為測試標(biāo)簽;
步驟四 利用訓(xùn)練集中數(shù)據(jù)訓(xùn)練GRU網(wǎng)絡(luò),得到基于GRU網(wǎng)絡(luò)的實時避碰規(guī)劃器;
將訓(xùn)練數(shù)據(jù)中的聲納信息作為輸入數(shù)據(jù),將訓(xùn)練集中相對應(yīng)的標(biāo)簽作為輸出數(shù)據(jù),對GRU網(wǎng)絡(luò)進(jìn)行訓(xùn)練,從而獲得基于GRU網(wǎng)絡(luò)的實時避碰規(guī)劃器;損失函數(shù)為均方差函數(shù);在訓(xùn)練過程中,采用小批量梯度下降誤差反向傳播算法優(yōu)化GRU網(wǎng)絡(luò)的權(quán)值;
步驟五 將聲納探測信息及目標(biāo)點信息輸入至基于GRU網(wǎng)絡(luò)的避碰規(guī)劃器,獲得UUV下一時刻的轉(zhuǎn)艏及速度的調(diào)整指令。
2.根據(jù)權(quán)利要求1所述的一種基于GRU網(wǎng)絡(luò)的UUV實時避碰規(guī)劃方法,其特征在于,GRU網(wǎng)絡(luò)的輸入層由81個單元組成,其中前80個單元分別對應(yīng)仿真聲納的80個波束中包含的距離信息,第81個單元對應(yīng)UUV當(dāng)前位置與目標(biāo)點之間的夾角;隱藏層由45個GRU模塊組成,每個GRU模塊都包含復(fù)位門和更新門結(jié)構(gòu);序列長度為10,上一時刻的隱藏層的輸出反饋到下一時刻的模塊中;中間層由23個單元組成;輸出層由2個單元組成,分別對應(yīng)所規(guī)劃的下一時刻UUV的轉(zhuǎn)艏和速度;輸入層與隱藏層、隱藏層與中間層、中間層與輸出層間的連接方式為全連接;
GRU記憶模塊輸出計算方式為:
zt=σ(Whzht-1+Wxzxt+bz)
rt=σ(Whrht-1+Wxrxt+br)
其中,zt、rt和ht分別為t時刻更新門、復(fù)位門和記憶模塊的輸出;xt為t時刻記憶模塊的輸入向量;ht-1為t-1時刻記憶模塊的輸出向量;Wxz、Wxr和Wxh分別為模塊輸入與更新門、復(fù)位門和間的權(quán)重矩陣;Whz和Whr分別為t-1時刻記憶模塊的輸出與更新門和復(fù)位門間的權(quán)重矩陣;bz、br和bh分別為更新門、復(fù)位門和的偏置;σ(·)表示邏輯sigmoid函數(shù),其為門單元的激活函數(shù);·表示對應(yīng)元素相乘。
3.根據(jù)權(quán)利要求1所述的一種基于GRU網(wǎng)絡(luò)的UUV實時避碰規(guī)劃方法,其特征在于,數(shù)據(jù)集中仿真聲納探測到的距離信息為其中為當(dāng)前時刻第i個波束探測到的距離信息,當(dāng)?shù)趇個波束未探測到障礙時,
將t時刻聲納探測到的距離信息做如下處理:
將t時刻UUV所在位置與目標(biāo)點形成的角度表示為則t時刻GRU網(wǎng)絡(luò)的輸入向量
t時刻GRU網(wǎng)絡(luò)的標(biāo)簽lt=[Δθt,vt],其中Δθt和vt分別表示期望的UUV轉(zhuǎn)艏和速度的調(diào)整指令。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工程大學(xué),未經(jīng)哈爾濱工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810052628.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于值導(dǎo)數(shù)GRU的入侵檢測算法
- 一種基于機器學(xué)習(xí)的民航旅客標(biāo)簽分析方法及處理終端
- 文本的情感傾向分類方法、裝置和服務(wù)器
- 一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)的視頻分類方法
- 一種用于合成語音檢測的GRU-SVM深度學(xué)習(xí)模型的構(gòu)造方法
- 基于GRU的多域SDN網(wǎng)絡(luò)流量態(tài)勢預(yù)測方法及系統(tǒng)
- 一種基于GRU網(wǎng)絡(luò)實現(xiàn)水位預(yù)測的方法及系統(tǒng)
- 基于三重融合卷積GRU的共享單車需求預(yù)測方法
- 基于交叉融合卷積GRU的股票開盤價格預(yù)測方法
- 一種基于三重卷積融合GRU的建筑物能耗預(yù)測方法
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





