[發(fā)明專利]一種基于注意力機(jī)制卷積神經(jīng)網(wǎng)絡(luò)的紅外弱小目標(biāo)檢測方法在審
| 申請?zhí)枺?/td> | 202210354670.8 | 申請日: | 2022-04-06 |
| 公開(公告)號: | CN114863097A | 公開(公告)日: | 2022-08-05 |
| 發(fā)明(設(shè)計)人: | 白相志;孫衡;白君香 | 申請(專利權(quán))人: | 北京航空航天大學(xué) |
| 主分類號: | G06V10/26 | 分類號: | G06V10/26;G06V10/44;G06V10/764;G06V10/82;G06V10/80;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京慧泉知識產(chǎn)權(quán)代理有限公司 11232 | 代理人: | 王順榮;唐愛華 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 注意力 機(jī)制 卷積 神經(jīng)網(wǎng)絡(luò) 紅外 弱小 目標(biāo) 檢測 方法 | ||
1.一種基于注意力機(jī)制卷積神經(jīng)網(wǎng)絡(luò)的紅外弱小目標(biāo)檢測方法,其特征在于:該方法具體步驟如下:
步驟一:搭建基于注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò);首先使用骨干網(wǎng)絡(luò)對輸入圖像進(jìn)行特征提取;提取的三層特征經(jīng)過注意力模塊進(jìn)行特征增強(qiáng);隨后通過擴(kuò)大感受野模塊進(jìn)行感受野增強(qiáng);然后通過特征融合模塊進(jìn)行高低級特征融合;最后通過全卷積網(wǎng)絡(luò)逐像素預(yù)測,得到全圖像像素級別的概率預(yù)測圖;
步驟二:構(gòu)造損失函數(shù)對網(wǎng)絡(luò)進(jìn)行訓(xùn)練;利用得到的預(yù)測結(jié)果與像素級標(biāo)注圖像進(jìn)行損失計算,以實(shí)現(xiàn)對網(wǎng)絡(luò)參數(shù)的反饋訓(xùn)練;
輸出:用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)處理紅外圖像;在使用訓(xùn)練數(shù)據(jù)對注意力機(jī)制卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行充分迭代訓(xùn)練之后,得到訓(xùn)練好的網(wǎng)絡(luò)用于檢測目標(biāo)像素。
2.根據(jù)權(quán)利要求1所述的一種基于注意力機(jī)制卷積神經(jīng)網(wǎng)絡(luò)的紅外弱小目標(biāo)檢測方法,其特征在于:在步驟一中,具體包括如下步驟:
1.1:構(gòu)建骨干網(wǎng)絡(luò)對輸入圖像進(jìn)行特征提取;骨干網(wǎng)絡(luò)由三個殘差塊單元構(gòu)成,每個殘差塊單元由不同尺度的卷積單元與殘差塊組成,以提取不同尺度的特征;輸入圖像首先經(jīng)過一個卷積核大小為3×3,步長為1的卷積單元,生成通道數(shù)為16的特征圖;接著依次通過3個殘差塊單元,生成通道數(shù)為32、64、128的三組特征圖;
1.2:注意力模塊;針對弱小目標(biāo)特征的注意力模塊,考慮到淺層特征保留了更多的構(gòu)造目標(biāo)邊界的細(xì)節(jié)信息,深層特征保留了更多的定位目標(biāo)語義的信息,對不同層特征進(jìn)行區(qū)分處理,以增強(qiáng)與小目標(biāo)相關(guān)的特征信息;首先,針對三層特征的感受野不同,將空間注意力中卷積單元的卷積核大小按照從淺層到深層依次設(shè)置為7×7、5×5、3×3;同時,由于淺層特征圖包含著更多的紋理細(xì)節(jié)信息,因此淺層特征的處理首先應(yīng)用通道注意力機(jī)制,接著應(yīng)用空間注意力機(jī)制;然而對于深層特征,由于其體現(xiàn)著更多的語義信息,處理時首先應(yīng)用空間注意力機(jī)制,然后再應(yīng)用通道注意力機(jī)制;
1.3:擴(kuò)大感受野模塊;設(shè)計4個分支結(jié)構(gòu),使用1×1、3×3、5×5卷積,合理擴(kuò)大感受野;首先對處理后的前三個分支進(jìn)行拼接操作,對拼接后的特征信息再進(jìn)行1×1卷積降維,最后與第四個分支相加,得到擴(kuò)大了感受野后的特征圖;
1.4:特征融合模塊;綜合考慮紅外弱小目標(biāo)各層特征圖表征的不同信息,增加了代表更多語義信息的深層特征在最終特征圖中的比重,即在對各層特征進(jìn)行融合后,再與進(jìn)行特征融合中原有的深層特征進(jìn)行逐點(diǎn)加和操作,以增強(qiáng)圖像的語義信息;對于深層特征,在兩次卷積操作之間,增加了自適應(yīng)平均池化的操作,有利于在前后通道數(shù)不改變的前提下,在特征信息中保留更多的背景信息;然后將處理后的深層特征與原有的淺層特征相乘,同理,處理后的淺層特征也與原有的深層特征相乘,接著將兩者結(jié)果進(jìn)行拼接;最后,將拼接后的特征與原有的深層特征進(jìn)行加法操作;在整個網(wǎng)絡(luò)中,一共提取了三個尺度的特征,首先在最深層的兩層特征之間進(jìn)行特征融合操作,然后將融合的結(jié)果與淺層特征再次進(jìn)行同樣的特征融合操作,以得到最終應(yīng)用于結(jié)果預(yù)測的特征圖;
1.5:通過全卷積網(wǎng)絡(luò)進(jìn)行檢測;將融合后的特征利用全卷積網(wǎng)絡(luò)FCN逐像素預(yù)測,得到全圖像像素級別的概率預(yù)測圖。
3.根據(jù)權(quán)利要求2所述的一種基于注意力機(jī)制卷積神經(jīng)網(wǎng)絡(luò)的紅外弱小目標(biāo)檢測方法,其特征在于:在步驟1.1中:每個卷積單元由卷積層,批量歸一化層、LeakyReLu操作組合而成;三組特征圖F1、F2、F3;F通過第一個殘差塊單元生成特征圖F1(寬長隨后F1送入第二個殘差塊單元生成下一尺度特征圖F2(寬長隨后F2送入第三個殘差塊單元生成F3(寬長每個殘差塊單元先使用1次卷積核大小為3×3,步長為2的卷積單元,目的是對圖像進(jìn)行下采樣;再經(jīng)過2個殘差塊提取特征,得到該尺度的特征圖;每個殘差塊由2個卷積單元組成,卷積核大小為1×1、步長為1,第一個卷積單元將特征圖通道數(shù)降為原有一半,第二個卷積單元恢復(fù)原特征圖通道數(shù),與輸入進(jìn)行殘差連接。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京航空航天大學(xué),未經(jīng)北京航空航天大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210354670.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種機(jī)制蛋的制造方法
- 手機(jī)制式的校準(zhǔn)方法、系統(tǒng)及手機(jī)檢測設(shè)備
- 一種考慮激勵機(jī)制電量電價彈性矩陣的耗電量估測方法
- 選擇區(qū)塊鏈共識機(jī)制的方法、裝置以及共識節(jié)點(diǎn)
- 一種復(fù)合改性機(jī)制砂及其制備方法
- 一種存儲設(shè)備糾錯方法及糾錯裝置
- 區(qū)塊鏈中共識機(jī)制的處理方法、裝置和電子設(shè)備
- 一種建筑用機(jī)制砂整形裝置
- 通信方法、通信裝置及存儲介質(zhì)
- 一種網(wǎng)絡(luò)預(yù)約出租車市場準(zhǔn)入機(jī)制的優(yōu)化方法及系統(tǒng)
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計算機(jī)存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)





