[發(fā)明專利]基于遷移學(xué)習(xí)的改進(jìn)YOLOv3模型側(cè)掃聲納沉船目標(biāo)自動(dòng)識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010967912.1 | 申請(qǐng)日: | 2020-09-15 |
| 公開(公告)號(hào): | CN112052817B | 公開(公告)日: | 2023-09-05 |
| 發(fā)明(設(shè)計(jì))人: | 金紹華;湯寓麟;邊剛;張永厚;王美娜 | 申請(qǐng)(專利權(quán))人: | 中國(guó)人民解放軍海軍大連艦艇學(xué)院 |
| 主分類號(hào): | G06V20/20 | 分類號(hào): | G06V20/20;G06V10/762;G06V10/80;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 大連理工大學(xué)專利中心 21200 | 代理人: | 梅洪玉 |
| 地址: | 116018 遼*** | 國(guó)省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 遷移 學(xué)習(xí) 改進(jìn) yolov3 模型 聲納 沉船 目標(biāo) 自動(dòng)識(shí)別 方法 | ||
基于遷移學(xué)習(xí)的改進(jìn)YOLOv3模型側(cè)掃聲納沉船目標(biāo)自動(dòng)識(shí)別方法,屬于側(cè)掃聲納圖像目標(biāo)識(shí)別和深度學(xué)習(xí)技術(shù)領(lǐng)域。本發(fā)明提出一種基于遷移學(xué)習(xí)的改進(jìn)YOLOv3模型側(cè)掃聲納圖像沉船目標(biāo)識(shí)別方法,解決現(xiàn)有側(cè)掃聲納圖像人工判讀和人工特征提取存在的問題,同時(shí)解決Faster?R?CNN模型在小目標(biāo)識(shí)別上效果不佳,存在漏警率高以及識(shí)別速度慢的問題。進(jìn)一步提高沉船目標(biāo)的識(shí)別定位精度,使模型達(dá)到更好的收斂效果,最終達(dá)到提升模型整體性能以及實(shí)時(shí)探測(cè)的目的。
技術(shù)領(lǐng)域
本發(fā)明屬于側(cè)掃聲納圖像目標(biāo)識(shí)別和深度學(xué)習(xí)技術(shù)領(lǐng)域,涉及一種基于遷移學(xué)習(xí)的改進(jìn)YOLOv3模型側(cè)掃聲納沉船目標(biāo)自動(dòng)識(shí)別方法,是深度學(xué)習(xí)目標(biāo)識(shí)別技術(shù)領(lǐng)域的一種改進(jìn)的識(shí)別算法,在側(cè)掃聲納圖像沉船目標(biāo)識(shí)別上應(yīng)用。
背景技術(shù)
如何精準(zhǔn)、快速、高效的搜索失事船只是海上搜救和障礙物核查的重要組成部分。側(cè)掃聲納可用于探測(cè)海底目標(biāo),在應(yīng)急搜救方面發(fā)揮了關(guān)鍵作用。側(cè)掃聲納探測(cè)一般采用拖曳測(cè)量方式,受海上機(jī)動(dòng)制約和拖纜長(zhǎng)度影響,拖魚入水深度一般僅為幾十米,這對(duì)于深海區(qū)域測(cè)量存在的分辨率低、目標(biāo)影像特征不明顯、聲納圖像質(zhì)量差的缺陷。目前側(cè)掃聲納圖像主要采用人工判讀的方式,對(duì)于圖像的分辨率有較高的要求。而自主式水下潛器(AUV)搭載側(cè)掃深納實(shí)施深海高精度、高分辨率海底沉船探測(cè)可彌補(bǔ)船載拖曳式測(cè)量的缺陷,但由于水聲通信的限制,掃測(cè)的沉船數(shù)據(jù)無法實(shí)時(shí)傳輸,這勢(shì)必造成搜索效率的低下,從而錯(cuò)失救援的黃金時(shí)間。同時(shí)傳統(tǒng)人工判讀存在效率低、耗時(shí)長(zhǎng)、資源消耗大及主觀不確定性強(qiáng)和過分依賴經(jīng)驗(yàn)等問題。為了彌補(bǔ)人工判讀方式存在的問題,減弱人為主觀因素的影響,國(guó)內(nèi)外學(xué)者進(jìn)行了廣泛的研究,主要包括利用圖像處理的基本算法、基于脈沖耦合神經(jīng)網(wǎng)絡(luò)(PCNN)的圖像處理算法、形態(tài)學(xué)圖像處理算法及通過中值濾波、二值化處理、噪聲抑制、增益負(fù)反饋控制、邊緣特征提取、圖像增強(qiáng)、圖像分割等方式識(shí)別側(cè)掃聲納圖像目標(biāo)。這些方法盡管在人工干預(yù)的情況下可以識(shí)別部分典型目標(biāo),但由于人工干涉多,存在特征設(shè)計(jì)難度大、處理過程繁雜、檢測(cè)精度和可靠性低、泛化能力不強(qiáng)等問題。
近年來,卷積神經(jīng)網(wǎng)絡(luò)(CNN)在目標(biāo)定位與檢測(cè)、圖像分類與識(shí)別、人臉驗(yàn)證、交通標(biāo)志識(shí)別、語音識(shí)別等各方面獲得廣泛的應(yīng)用。本發(fā)明者曾提出了利用Faster?R-CNN模型進(jìn)行側(cè)掃聲納圖像海底沉船目標(biāo)識(shí)別方法,該方法雖然識(shí)別精度很高,但由于其中區(qū)域生成網(wǎng)絡(luò)(RPN)網(wǎng)絡(luò)生成建議框耗費(fèi)時(shí)間過多,導(dǎo)致模型處理速度較低,滿足不了沉船海上搜救的實(shí)時(shí)性需求。同時(shí)側(cè)掃聲納圖像沉船目標(biāo)一般占比較小,屬于小尺度目標(biāo),而FasterR-CNN模型由于在卷積網(wǎng)絡(luò)的深層特征圖中進(jìn)行回歸預(yù)測(cè),在獲得豐富語義信息的同時(shí)丟失了部分位置信息,在小目標(biāo)識(shí)別上效果不佳,存在漏警率高的問題。
同時(shí),卷積神經(jīng)網(wǎng)絡(luò)盡管在各個(gè)領(lǐng)域得到了廣泛的應(yīng)用,但其性能只有在網(wǎng)絡(luò)結(jié)構(gòu)比較復(fù)雜、訓(xùn)練樣本數(shù)足夠多的情況下才能得以展現(xiàn),卷積神經(jīng)網(wǎng)絡(luò)往往有數(shù)百萬個(gè)參數(shù),因此訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)需要使用大量的標(biāo)記樣本。而側(cè)掃聲納沉船圖像數(shù)據(jù)較少,在訓(xùn)練時(shí),模型容易出現(xiàn)過擬合、陷入局部最優(yōu)解以及模型泛化能力差等現(xiàn)象。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)上述現(xiàn)有技術(shù)的不足,提出一種基于遷移學(xué)習(xí)的改進(jìn)YOLOv3模型側(cè)掃聲納圖像沉船目標(biāo)識(shí)別方法,解決現(xiàn)有側(cè)掃聲納圖像人工判讀和人工特征提取存在的問題,同時(shí)解決Faster?R-CNN模型在小目標(biāo)識(shí)別上效果不佳,存在漏警率高以及識(shí)別速度慢的問題。進(jìn)一步提高沉船目標(biāo)的識(shí)別定位精度,使模型達(dá)到更好的收斂效果,最終達(dá)到提升模型整體性能以及實(shí)時(shí)探測(cè)的目的。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案如下:
一種基于遷移學(xué)習(xí)的改進(jìn)YOLOv3模型側(cè)掃聲納沉船目標(biāo)自動(dòng)識(shí)別方法,包括以下步驟:
步驟1:對(duì)側(cè)掃聲納沉船圖像數(shù)據(jù)集進(jìn)行預(yù)處理;
所述步驟1包括:①對(duì)整個(gè)數(shù)據(jù)集圖像的像素進(jìn)行標(biāo)準(zhǔn)化,將尺寸不一致的圖像強(qiáng)制性統(tǒng)一為相同像素;②進(jìn)行歸一化處理,轉(zhuǎn)換為float32格式并轉(zhuǎn)換為0-1范圍內(nèi)的浮點(diǎn)數(shù);③采用中心剪裁的方式剪裁圖像的不同比例,再放大到原始圖像大小;④采用數(shù)據(jù)增強(qiáng)進(jìn)行數(shù)據(jù)集擴(kuò)充。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)人民解放軍海軍大連艦艇學(xué)院,未經(jīng)中國(guó)人民解放軍海軍大連艦艇學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010967912.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 遷移方法和裝置
- 移動(dòng)邊緣系統(tǒng)中遷移應(yīng)用方法、相關(guān)設(shè)備及系統(tǒng)
- 虛擬機(jī)的遷移方法及裝置
- 數(shù)據(jù)遷移方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 計(jì)算任務(wù)遷移方法及計(jì)算任務(wù)遷移器
- 文件遷移方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于遷移工具的國(guó)產(chǎn)化應(yīng)用系統(tǒng)遷移方法
- 數(shù)據(jù)遷移方法及裝置
- 文件遷移方法及裝置
- 一種數(shù)據(jù)遷移方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





