[發(fā)明專利]一種基于全卷積神經(jīng)網(wǎng)絡(luò)的側(cè)掃聲納圖像特征提取方法有效
| 申請?zhí)枺?/td> | 201910932848.0 | 申請日: | 2019-09-29 |
| 公開(公告)號: | CN110781924B | 公開(公告)日: | 2023-02-14 |
| 發(fā)明(設(shè)計(jì))人: | 王宏健;高娜;陳濤;肖瑤;阮力;李本銀 | 申請(專利權(quán))人: | 哈爾濱工程大學(xué) |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150001 黑龍江省哈爾濱市南崗區(qū)*** | 國省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 卷積 神經(jīng)網(wǎng)絡(luò) 聲納 圖像 特征 提取 方法 | ||
1.一種基于全卷積神經(jīng)網(wǎng)絡(luò)的側(cè)掃聲納圖像特征提取方法,其特征在于,具體的實(shí)現(xiàn)步驟為:
步驟1:利用原有的聲納圖像進(jìn)行數(shù)據(jù)增廣,獲得模型訓(xùn)練和測試所需的樣本集;對樣本集中的每幅圖像的海底地形的邊緣區(qū)域進(jìn)行人工標(biāo)注,將目標(biāo)和背景用不同的類別區(qū)分,獲得模型訓(xùn)練和測試所需的標(biāo)簽圖;
步驟2:構(gòu)建全卷積神經(jīng)網(wǎng)絡(luò)模型,即構(gòu)建FCNs模型;
所述FCNs模型以VGG16為基礎(chǔ)網(wǎng)絡(luò),利用與對應(yīng)全連接層輸入數(shù)據(jù)尺寸相同的卷積核,將VGG16的全連接層轉(zhuǎn)化為三個(gè)卷積層,其中最后一層卷積層輸出結(jié)果為熱圖,熱圖個(gè)數(shù)對應(yīng)類別個(gè)數(shù);FCNs模型在熱圖之后增加反卷積層,對熱圖進(jìn)行上采樣以恢復(fù)原始圖像尺寸;FCNs模型增加跳層結(jié)構(gòu),通過跳層結(jié)構(gòu)融合淺層與深層的特征信息,獲得更加準(zhǔn)確的特征輸出;步驟3:將海底地形圖像及對應(yīng)的標(biāo)簽圖輸入FCNs模型,采用帶動(dòng)量項(xiàng)的小批量梯度下降法訓(xùn)練,保存最優(yōu)的FCNs模型;
FCNs模型的訓(xùn)練過程可以抽象為尋找最佳的參數(shù)值使得損失函數(shù)值最小;損失函數(shù)softmaxwithloss由softmax和loss組成,softmax為:
其中,ak(x)表示在x點(diǎn)上第k類的輸出值;表示在x點(diǎn)上所有類的輸出值之和;pk(x)表示在x點(diǎn)上第k類的概率;
loss為:
loss=-log pj(x)
pj(x)表示在x點(diǎn)上最大的概率值;
采用沖量項(xiàng)的小批量梯度下降算法優(yōu)化損失函數(shù);小批量梯度下降算法的核心思想是利用梯度確定參數(shù)更新的方向,即在每次迭代中,對每個(gè)變量,按照目標(biāo)函數(shù)在該變量梯度的相反方向,更新對應(yīng)的參數(shù)值,通過對目標(biāo)函數(shù)中的參數(shù)不斷迭代更新,使得目標(biāo)函數(shù)逐漸靠近最小值;每次計(jì)算一小部分訓(xùn)練數(shù)據(jù)的損失函數(shù),根據(jù)這一部分?jǐn)?shù)據(jù)的平均梯度更新參數(shù);
FCNs模型的訓(xùn)練分為三個(gè)階段,第一階段為FCN-32s模型的訓(xùn)練;第二階段為FCN-16s模型的訓(xùn)練,采用第一階段訓(xùn)練好的FCN-32s模型初始化網(wǎng)絡(luò);第三階段為FCN-8s模型的訓(xùn)練,采用第二階段訓(xùn)練好的FCN-16s模型初始化網(wǎng)絡(luò);
FCNs模型中所有的反卷積層都采用雙線性插值的方式進(jìn)行初始化,中間的反卷積層的參數(shù)在網(wǎng)絡(luò)的訓(xùn)練過程中作為網(wǎng)絡(luò)的學(xué)習(xí)參數(shù)不斷進(jìn)行更新,最后的反卷積層的參數(shù)為固定值,訓(xùn)練過程中不學(xué)習(xí);
步驟4:利用訓(xùn)練好的FCNs模型進(jìn)行聲納圖像海底地形邊緣輪廓的特征提取并輸出特征提取結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種基于全卷積神經(jīng)網(wǎng)絡(luò)的側(cè)掃聲納圖像特征提取方法,其特征在于,所述步驟1的具體步驟為:
步驟1.1.將原有海底地形圖像通過旋轉(zhuǎn)、翻轉(zhuǎn)變化進(jìn)行擴(kuò)充;
步驟1.2.模擬實(shí)現(xiàn)聲納圖像噪聲,聲納圖像噪聲大部分為服從瑞利分布的散斑噪聲,模擬實(shí)現(xiàn)散斑噪聲的公式為
其中a表示噪聲強(qiáng)度,b表示光斑大小,U(0,1)代表平均噪聲,z代表散斑噪聲;
步驟1.3.利用labelme標(biāo)注圖像,將海底地形的輪廓用像素1表示,海底地形的背景用像素0表示,得到標(biāo)簽圖。
3.根據(jù)權(quán)利要求1所述的一種基于全卷積神經(jīng)網(wǎng)絡(luò)的側(cè)掃聲納圖像特征提取方法,其特征在于,所述步驟2中為使輸出的特征圖與原圖尺寸相同,F(xiàn)CNs模型設(shè)計(jì)了三種模式,
第一模式FCN-32s:直接對最后一個(gè)卷積層的輸出結(jié)果以雙線性插值的方式進(jìn)行上采樣,步長為32,一步將預(yù)測大小恢復(fù)為原圖像大小,這樣做導(dǎo)致?lián)p失過多的細(xì)節(jié)信息,結(jié)果不夠精細(xì),為了解決此問題,引入了跳級連接的策略;
第二模式FCN-16s:首先將最后一層上采樣,步長為2,然后和池化層4的預(yù)測結(jié)合起來,最后再上采樣,步長為16,恢復(fù)為原圖大小,使網(wǎng)絡(luò)能夠更好地預(yù)測細(xì)節(jié),同時(shí)保留高級別的語義信息;
第三模式FCN-8s:首先上采樣再結(jié)合高層信息,最后再上采樣,步長為8,恢復(fù)為原圖大小,可獲得更高的精度。
4.根據(jù)權(quán)利要求1所述的一種基于全卷積神經(jīng)網(wǎng)絡(luò)的側(cè)掃聲納圖像特征提取方法,其特征在于,所述步驟3中FCNs模型訓(xùn)練的第一階段的批量大小設(shè)置為8,學(xué)習(xí)率為1e-10;第二階段的批量大小設(shè)置為16,學(xué)習(xí)率為1e-12;第三階段的批量大小設(shè)置為8,學(xué)習(xí)率為1e-14;三個(gè)階段的權(quán)值的正則化系數(shù)設(shè)置為0.0005,動(dòng)量項(xiàng)的值為0.99,偏置項(xiàng)的學(xué)習(xí)率為權(quán)值的兩倍。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工程大學(xué),未經(jīng)哈爾濱工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910932848.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





