[發明專利]基于多尺度注意力機制的遙感圖像車輛目標檢測方法在審
| 申請號: | 202010521480.1 | 申請日: | 2020-06-10 |
| 公開(公告)號: | CN111738110A | 公開(公告)日: | 2020-10-02 |
| 發明(設計)人: | 門飛飛;李訓根;馬琪;潘勉;呂帥帥;李子璇;張戰;劉愛林 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 浙江永鼎律師事務所 33233 | 代理人: | 陸永強 |
| 地址: | 310018*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 尺度 注意力 機制 遙感 圖像 車輛 目標 檢測 方法 | ||
1.一種基于多尺度注意力機制的遙感圖像車輛目標檢測方法,其特征在于,包括如下步驟:
S1,使用多層卷積神經網絡對原始圖片進行特征提取,將生成的不同尺度特征圖構建一個自底向上的金字塔網絡;
S2,對于已經構建好的金字塔網絡,實現自頂向下的特征融合,在融和過程中,依次對高層特征圖進行通道注意力操作,并融合到低層特征圖;
S3,獲取融合后的低層特征圖的空間注意力信息,并融合到原有的低層特征中;
S4,通過預先設定的大小、比例等生成大量候選框,根據檢測目標的真實框大小決定所用到的特征圖,再通過真實框與候選框的交并比判定候選框的正負性;
S5,對得到的正樣本候選框直接預測其類別信息以及回歸信息,使用非極大抑制方法,濾除得到的重疊區域同類別候選框,得到最終的檢測結果。
2.如權利要求1所述的基于多尺度注意力機制的遙感圖像車輛目標檢測方法,其特征在于,所述S1包括:選用ResNet-50作為基礎卷積神經網絡,圖片經過網絡,在不同的層輸出不同尺度的特征圖,每上一個特征圖是下一個特征圖所經過神經網絡的輸出,此時的不同特征具有不同的通道數,越上層的特征,通道數越多,但是尺度越小,首先對不同特征圖進行通道數統一化,其過程如下:
Pi=Conv3×3(Ci,256,3,1,1) (1)
其中,Pi代表第i層的特征圖,Conv3x3表示3×3卷積層,Ci表示輸入圖片經過ResNet-50得到的第i特征圖,在3×3卷積層Conv3x3內,Ci為輸入特征圖的通道數,256為輸出特征圖的通道數,3代表使用的卷積核尺寸,1表示卷積核每次移動的步長,1表示對特征圖的邊界填充數。
3.如權利要求1所述的基于多尺度注意力機制的遙感圖像車輛目標檢測方法,其特征在于,所述S2包括:每次的特征圖融合總是一個高層次特征和低層次特征參與操作,高層特征圖P4平移不變,次高層特征圖P3將會融合來自特征圖P4的信息,首先對低層次特征進行通道最大池化和平均池化,接著將合并的兩個池化結果輸入1×1卷積得到通道數為256,尺度大小為1×1的特征塊;其次,將該特征塊與低層次特征圖進行通道相乘得到包含通道注意力的低層次特征圖,其過程表示為以下形式:
其中表示Pi經過通道注意力得到特征圖,Pi-1為Pi的下一層網絡,Conv1×1表示1×1卷積操作,cat()表示特征圖的連接操作,Cmaxpool()表示通道最大池化,Cavgpool()表示通道平均池化,Unsample()是對特征圖進行上采樣。
4.如權利要求1所述的基于多尺度注意力機制的遙感圖像車輛目標檢測方法,其特征在于,所述S3包括:先對經過上一步得到的特征圖進行空間最大池化,得到尺度不變,通道數為1的特征塊,其次同時得到平均池化的特征塊;將兩個特征塊拼接后送入卷積核大小為1×1的卷積塊中得到通道數為1的特征塊,該特征塊融合了特征圖中的空間信息;
接著,利用Sigmoid()激活函數,將特征圖中像素點的值激活到0到1之間;
最后,通過特征圖與特征塊的矩陣相乘,獲得最終的結果,其過程可以表示為以下形式:
其中,表示最終通過通道注意力和空間注意力得到的特征圖,Smaxpool()表示空間最大池化,Savgpool()表示空間平均池化,Sigmoid()表示對經過卷積后得到的特征塊進行sigmoid激活。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010521480.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種預灌封安全裝置的滅菌設備
- 下一篇:觸摸開關及其控制方法





