[發明專利]基于空間自注意力機制的目標檢測方法有效
| 申請號: | 202010002235.X | 申請日: | 2020-01-02 |
| 公開(公告)號: | CN111222562B | 公開(公告)日: | 2022-04-08 |
| 發明(設計)人: | 張伶俐;陳可佳;周曉萌 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06F17/16 |
| 代理公司: | 南京蘇科專利代理有限責任公司 32102 | 代理人: | 姚姣陽 |
| 地址: | 210023 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 空間 注意力 機制 目標 檢測 方法 | ||
1.一種基于空間自注意力機制的目標檢測方法,其特征在于,主要包括以下步驟:
步驟S1、獲取原始數據集,搭建基礎網絡框架,以提取圖像的卷積特征;
步驟S2、構造目標檢測模型,基礎網絡框架采用的是對稱的上采樣層與下采樣層結合的網絡,其中,上采樣層與下采樣層進行特征融合之后,應用空間自注意力機制,作為下一個卷積層的輸入;
步驟S3、將訓練后的原始數據集作為基礎網絡框架的輸入,采用Adam優化器對目標檢測模型進行訓練優化,以得到最終的目標檢測模型,
其中,所述空間自注意力機制主要包括以下步驟:
步驟1、對特征圖F∈RC×H×W進行自適應平均池化得到特征圖F′;
步驟2、對特征圖F′分別進行兩次降維映射,得到f(F′)與g(F′),將f(F′)與g(F′)按行展開,得到矩陣M和矩陣N;
步驟3、將矩陣M和矩陣N進行相乘,得到矩陣Z=MT×N;
步驟4、對矩陣Z通過行卷積得到特征圖Y;
步驟5、對特征圖Y使用sigmoid激活并進行拓展,得到特征圖Q;
步驟6、對特征圖Q進行反自適應平均池化,得到最終空間每個像素的權重,將所述權重與特征圖F進行點乘,以獲得最終特征圖R;
步驟7、將最終特征圖R作為下一個卷積層的輸入。
2.根據權利要求1所述的基于空間自注意力機制的目標檢測方法,其特征在于:步驟1中,特征圖F′=AdaptiveAvgPool2d(F),此時F′的大小為C×H′×W′。
3.根據權利要求1所述的基于空間自注意力機制的目標檢測方法,其特征在于:步驟2中,所述矩陣M=reshape(f(F′)),N=reshape(g(F′)),且M,N的大小為C′×H′W′。
4.根據權利要求1所述的基于空間自注意力機制的目標檢測方法,其特征在于:步驟4中,特征圖Y的大小為H′W′×1。
5.根據權利要求1所述的基于空間自注意力機制的目標檢測方法,其特征在于:步驟5中,特征圖Q的大小為H′×W′。
6.根據權利要求1所述的基于空間自注意力機制的目標檢測方法,其特征在于,所述步驟S1具體包括以下步驟:
步驟S11、獲取原始數據集,將原始數據集通過數據增強進行擴充;
步驟S12、選取Hourglass-54作為基礎網絡框架,用于提取圖像的卷積特征。
7.根據權利要求6所述的基于空間自注意力機制的目標檢測方法,其特征在于,所述步驟S12具體包括:
步驟S121、縮放原始數據集,作為基礎網絡框架的輸入;
步驟S122、基礎網絡框架包含六層下采樣層與五層上采樣層,將對應的上采樣層與下采樣層進行特征融合之后,應用空間自注意力機制,作為下一個卷積層的輸入;
步驟S123、在基礎網絡框架的最后一層添加檢測層,所述檢測層采用CenterNet檢測層模塊。
8.根據權利要求1所述的基于空間自注意力機制的目標檢測方法,其特征在于,所述步驟S3具體包括以下步驟:
步驟S31、初始化基礎網絡框架參數,對其余層采用隨機初始化;
步驟S32、將訓練后的原始數據集作為基礎網絡框架的輸入,采用Adam優化器對目標檢測模型進行訓練優化,并不斷更新基礎網絡框架中的參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010002235.X/1.html,轉載請聲明來源鉆瓜專利網。





