[發(fā)明專利]基于注意力機制的多尺度SAR圖像識別方法及裝置有效
| 申請?zhí)枺?/td> | 201910630658.3 | 申請日: | 2019-07-12 |
| 公開(公告)號: | CN110647794B | 公開(公告)日: | 2023-01-03 |
| 發(fā)明(設(shè)計)人: | 翟懿奎;鄧文博;徐穎;甘俊英;曾軍英;應(yīng)自爐;柯琪銳;周文略 | 申請(專利權(quán))人: | 五邑大學(xué) |
| 主分類號: | G06V20/10 | 分類號: | G06V20/10;G06V10/25;G06V10/46;G06V10/764 |
| 代理公司: | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 44205 | 代理人: | 孫浩 |
| 地址: | 529000 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 注意力 機制 尺度 sar 圖像 識別 方法 裝置 | ||
1.基于注意力機制的多尺度SAR圖像識別方法,其特征在于,包括以下步驟:
訓(xùn)練步驟:輸入SAR訓(xùn)練圖像對原始的圖像識別網(wǎng)絡(luò)進行訓(xùn)練和調(diào)整,其中圖像識別網(wǎng)絡(luò)包括依次連接的注意力預(yù)測子網(wǎng)、感興趣區(qū)域定位子網(wǎng)和圖像分類子網(wǎng);
分類步驟:輸入SAR待測圖像至訓(xùn)練完成的圖像識別網(wǎng)絡(luò)處理輸出分類結(jié)果;
所述訓(xùn)練步驟包括:
注意力預(yù)測:使SAR訓(xùn)練圖像經(jīng)過注意力預(yù)測子網(wǎng)處理得到注意力預(yù)測圖,并計算注意力預(yù)測損失;
初步定位:使SAR訓(xùn)練圖像經(jīng)過感興趣區(qū)域定位子網(wǎng)結(jié)合注意力預(yù)測圖處理得到初步定位SAR圖像,并計算感興趣區(qū)域定位損失;
分類訓(xùn)練:使初步定位SAR圖像經(jīng)過圖像分類子網(wǎng)處理輸出分類結(jié)果,并計算分類損失;
網(wǎng)絡(luò)調(diào)整:根據(jù)注意力預(yù)測損失、感興趣區(qū)域定位損失和分類損失計算網(wǎng)絡(luò)損失并根據(jù)網(wǎng)絡(luò)損失調(diào)整圖像識別網(wǎng)絡(luò)。
2.根據(jù)權(quán)利要求1所述的基于注意力機制的多尺度SAR圖像識別方法,其特征在于,還包括以下步驟:
定位優(yōu)化:得到初步定位SAR圖像后,將所述初步定位SAR圖像進行區(qū)域框定并篩選,得到帶候選框區(qū)域特征的優(yōu)化定位圖像;
其中分類訓(xùn)練步驟中,將所述優(yōu)化定位圖像作為圖像分類子網(wǎng)的輸入。
3.根據(jù)權(quán)利要求1或2所述的基于注意力機制的多尺度SAR圖像識別方法,其特征在于,所述注意力預(yù)測步驟具體包括:
提取SAR訓(xùn)練圖像的RGB通道信息并以張量表示,并根據(jù)張量使SAR訓(xùn)練圖像經(jīng)過8個構(gòu)建塊處理得到多尺度特征;
根據(jù)多尺度特征為SAR訓(xùn)練圖像匹配權(quán)重,得到定位特征;
使定位特征經(jīng)過特征歸一化處理和反卷積處理結(jié)合SAR圖像得到注意力預(yù)測圖;
計算注意力預(yù)測損失。
4.根據(jù)權(quán)利要求1或2所述的基于注意力機制的多尺度SAR圖像識別方法,其特征在于,所述初步定位步驟具體包括:
使注意力預(yù)測圖以熱圖的形式對SAR訓(xùn)練圖像遮掩生成掩膜并提取掩膜特征;
經(jīng)感興趣區(qū)域?qū)R得到初步定位SAR圖像;
計算感興趣區(qū)域定位損失。
5.根據(jù)權(quán)利要求1或2所述的基于注意力機制的多尺度SAR圖像識別方法,其特征在于,網(wǎng)絡(luò)損失為Loss=α·Lossa+β·Lossf+γ·Lossc,其中Lossα、Lossf和Lossc分別是注意力預(yù)測損失、感興趣區(qū)域定位損失和分類損失,α、β和γ是平衡注意力預(yù)測損失、感興趣區(qū)域定位損失和分類損失之間權(quán)衡的超參數(shù)。
6.應(yīng)用權(quán)利要求1-5任一項所述的基于注意力機制的多尺度SAR圖像識別方法的裝置,其特征在于,包括:
訓(xùn)練模塊,用于輸入SAR訓(xùn)練圖像對原始的圖像識別網(wǎng)絡(luò)進行訓(xùn)練和調(diào)整,其中圖像識別網(wǎng)絡(luò)包括依次連接的注意力預(yù)測子網(wǎng)、感興趣區(qū)域定位子網(wǎng)和圖像分類子網(wǎng);
以及與訓(xùn)練模塊連接的分類模塊,用于輸入SAR待測圖像至訓(xùn)練模塊訓(xùn)練完成的圖像識別網(wǎng)絡(luò)處理輸出分類結(jié)果;
所述訓(xùn)練模塊具體包括:
注意力預(yù)測模塊,用于使SAR訓(xùn)練圖像經(jīng)過注意力預(yù)測子網(wǎng)處理得到注意力預(yù)測圖,并計算注意力預(yù)測損失;
初步定位模塊,用于使SAR訓(xùn)練圖像經(jīng)過感興趣區(qū)域定位子網(wǎng)結(jié)合注意力預(yù)測圖處理得到初步定位SAR圖像,并計算感興趣區(qū)域定位損失;
分類訓(xùn)練模塊,用于使初步定位SAR圖像經(jīng)過圖像分類子網(wǎng)處理輸出分類結(jié)果,并計算分類損失;
網(wǎng)絡(luò)調(diào)整模塊,用于根據(jù)注意力預(yù)測損失、感興趣區(qū)域定位損失和分類損失計算網(wǎng)絡(luò)損失并根據(jù)網(wǎng)絡(luò)損失調(diào)整圖像識別網(wǎng)絡(luò)。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括:與分類訓(xùn)練模塊連接的定位優(yōu)化模塊,用于將所述初步定位SAR圖像進行區(qū)域框定并篩選,得到帶候選框區(qū)域特征的優(yōu)化定位圖像;其中,將所述優(yōu)化定位圖像作為分類訓(xùn)練模塊的輸入。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于五邑大學(xué),未經(jīng)五邑大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910630658.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:用于對象識別和檢測的多尺度特征表示
- 下一篇:一種表格識別方法





