[發明專利]一種基于注意力網絡的遙感影像建筑物特征提取方法有效
| 申請號: | 202210810000.2 | 申請日: | 2022-07-11 |
| 公開(公告)號: | CN115063685B | 公開(公告)日: | 2023-10-03 |
| 發明(設計)人: | 周亞男;汪順營;馮莉;楊先增 | 申請(專利權)人: | 河海大學 |
| 主分類號: | G06V20/10 | 分類號: | G06V20/10;G06N3/0464;G06N3/047;G06N3/08;G06V10/44;G06V10/80;G06V10/82 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 王恒靜 |
| 地址: | 210024 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 注意力 網絡 遙感 影像 建筑物 特征 提取 方法 | ||
1.一種基于注意力網絡的遙感影像建筑物特征提取方法,其特征在于,該方法包括:
首先,獲取具有地物要素的遙感影像建筑物圖片,并進行預處理,得到預處理后的圖片;
其次,將大小為C×H×W的預處理后的圖片輸入至注意力網絡中,所述注意力網絡包括常規流、形狀流和融合模塊,所述常規流包括5個卷積塊,每個卷積塊結構相同,經過常規流后的特征圖為二值語義圖Fs,所述形狀流的輸入為常規流5個卷積塊的輸出特征圖,大小分別為CHW*1/2i,將其上采樣CHW大小后輸入到4個串聯的門控卷積層GCL后得到大小為1HW的二值邊緣圖Fe,0≤i≤4;
最后,將常規流和形狀流分別得到的二值圖Fs和Fe經過通道連接后輸入到融合模塊,經過卷積下采樣遇上采樣操作后,最終輸出為大小為HW的目標二值語義圖,該部分輸出由常規流中使用的語義標簽進行損失監督,從而得到邊緣清晰的二值語義圖。
2.根據權利要求1所述的基于注意力網絡的遙感影像建筑物特征提取方法,其特征在于,每個卷積塊包括編碼器、注意力部分和解碼器,所述常規流對圖像的處理方法包括以下步驟:
(1)將預處理后的圖片輸入到編碼器中,編碼器包括5個編碼層,除了第一個編碼層,其余四個編碼層都會將特征圖的尺寸縮小二分之一,當輸入特征圖大小為CHW時,先經過第一個編碼層依舊為C1HW,經過第二個編碼層后尺寸為C2H/2W/2,經過第三個編碼層后尺寸為C3H/22W/22,經過第四個編碼層后尺寸為C4H/23W/23,經過第五個編碼層后尺寸為C5H/24W/24,經過五個編碼層后,尺寸變為原來的1/16,得到編碼后的特征圖Fe;
(2)所述注意力部分包括通道注意力模塊、位置注意力模塊、疊加模塊,首先將特征圖Fe經過一個1×1卷積,將通道維度數量從C5降為C’,空間維度尺寸不變得到C’H/24W/24的特征圖Fi,輸入到通道注意力模塊中,得到與Fi同樣大小的特征圖Fo1,所述通道注意力模塊用于使用特征通道擠壓和激勵處理輸入的特征圖;
(3)將大小為C5H/24W/24的特征圖Fe先經過一個1×1卷積,將通道維度數量從C5降為C’,空間維度尺寸不變得到C’H/24W/24的特征圖Fi,此處的Fi與步驟(2)的Fi是相同的,步驟(2)與步驟(3)的兩個注意力是并行的,然后將其輸入到位置注意力模塊中,得到與Fi同樣大小的特征圖Fo2,所述位置注意力模塊用于使用Criss-Cross Attention Module通過兩次疊加得到像素的空間全局上下文信息;
(4)將特征圖Fo1和特征圖Fo2輸入到疊加模塊中,疊加模塊采用short-cut結構融合特征圖Fo1和特征圖Fo2,最終得到大小為3*C’×H/24×W/24的輸出特征圖,所述疊加模塊用于將不同輸入的特征圖在通道維度上進行疊加操作;
(5)將步驟(4)中得到的特征圖Fleveli經解碼塊上采樣為1HW大小的二值語義圖Fs。
3.根據權利要求1所述的基于注意力網絡的遙感影像建筑物特征提取方法,其特征在于,所述形狀流由邊緣標簽對輸出的二值邊緣圖進行損失監督。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學,未經河海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210810000.2/1.html,轉載請聲明來源鉆瓜專利網。





