[發明專利]一種基于注意力機制的改進YOLOv3目標檢測方法在審
| 申請號: | 202011396416.1 | 申請日: | 2020-12-04 |
| 公開(公告)號: | CN112508014A | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 李永勝;孫長銀;陸科林;徐樂玏 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/62;G06N3/04 |
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 杜靜靜 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 注意力 機制 改進 yolov3 目標 檢測 方法 | ||
1.一種基于注意力機制的改進YOLOv3目標檢測方法,其特征在于,包括如下步驟:
S1:針對一張原始圖像,對其進行預處理,并歸一化為416×416×3,得到訓練樣本;
S2:修改Darknet-53的網絡結構,在每個殘差層Basic Block模塊中均引入自適應卷積核大小的注意力機制;
S3:在Darknet-53頂部引入空間金字塔池化模塊SPP,以增加特征提取網絡的感受野;
S4:用改進后的Darknet-53網絡提取圖像特征,并從網絡的不同深度引出三個尺度的特征圖(feature map)至特征融合支路;
S5:在三條特征融合支路中引入通道注意力機制,為通道分配權重,充分提取通道的有效特征信息;
S6:最后在三條支路上分別預測,得到多尺度目標檢測結果。
2.根據權利要求1所述的一種基于注意力機制的改進YOLOv3目標檢測方法,其特征在于,所述步驟S1中,預處理方式包括隨機旋轉、水平翻轉和標準化處理。
3.根據權利要求1所述的一種基于注意力機制的改進YOLOv3目標檢測方法,其特征在于,所述步驟S2中,在殘差層Basic Block模塊中引入自適應卷積核大小的注意力機制的方法為:
S21:在第一個卷積核大小為1×1的卷積層后插入自適應卷積核大小的卷積模塊Selective Kernel Networks(SKNet);
S22:將原先第二個卷積層的卷積核大小由3×3修改為1×1。
4.根據權利要求1所述的一種基于注意力機制的改進YOLOv3目標檢測方法,其特征在于,所述步驟S3中,在Darknet-53頂部引入空間金字塔池化模塊SPP的方法為:
S31:從Darknet-53最后一個基本卷積模塊的輸出引出4條支路;
S32:第一、第二、第三條支路分別通過最大池化層a1、a2、a3,a1的核大小為5,步長為1,a2的核大小為9,步長為1,a3的核大小為13,步長為1,最后一條支路保留原輸出特征;
S33:將4條支路的輸出在通道維度上進行拼接,得到一個新的特征圖(feature map);
S34:將新得到的特征圖最后通過一個卷積層,得到原特征的通道數。
5.根據權利要求1所述的一種基于注意力機制的改進YOLOv3目標檢測方法,其特征在于,所述步驟S5中,在特征融合支路中引入通道注意力機制的方法為:
選擇8倍降采樣和16倍降采樣兩條支路,在上采樣層Upsample和這兩條支路輸出的特征圖按通道維度拼接融合后,插入一個通道注意力機制模塊Squeeze-and-ExcitationNetworks(SENet)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011396416.1/1.html,轉載請聲明來源鉆瓜專利網。





