[發明專利]一種面向行人檢測的輕量級卷積神經網絡模型在審
| 申請號: | 202210499061.1 | 申請日: | 2022-05-09 |
| 公開(公告)號: | CN114882530A | 公開(公告)日: | 2022-08-09 |
| 發明(設計)人: | 李旭;殷竟成;朱建瀟 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 許小莉 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 行人 檢測 輕量級 卷積 神經網絡 模型 | ||
1.一種面向行人檢測的輕量級卷積神經網絡模型,其特征在于,該輕量級卷積神經網絡模型由多個基本組成模塊堆疊而成,每個所述基本組成模塊采用多分支的并行結構獲取不同尺度感受野下的特征,每個分支包含不同擴張率的空洞卷積和分組卷積;在基本組成模塊之后,連接空間注意力機制模塊。
2.根據權利要求1所述的一種面向行人檢測的輕量級卷積神經網絡模型,其特征在于,所述基本組成模塊包含三個分支的并行結構,分別采用擴張率為3、5、7的空洞卷積,以及分組數分別為4、8、16的分組卷積,卷積核大小都為3×3,在卷積操作后添加批歸一化層和激活函數;
所述空洞卷積具體是指向普通卷積層引入新參數“擴張率”,該參數定義了卷積核處理數據時每個值相互之間的間距,根據擴張率往卷積核中間填充0,隨后再做卷積操作;
所述分組卷積是指將整個卷積過程拆成若干組規模更小的子運算來并行進行,具體包含如下兩個子步驟:
步驟一:保持輸入數據的高度和寬度不變,根據通道數將其分成若干組;
步驟二:分別對每個組執行卷積運算,隨后將所有組的輸出矩陣進行拼接得到最終結果。
3.根據權利要求2所述的一種面向行人檢測的輕量級卷積神經網絡模型,其特征在于,將所述基本組成模塊包含的三個分支的結果進行相加操作。
4.根據權利要求1所述的一種面向行人檢測的輕量級卷積神經網絡模型,其特征在于,所述空間注意力機制模塊包含以下子模塊:
子模塊一:全局最大池化層和全局平均池化層,用于將輸入的特征圖(H×W×C)分別進行全局最大池化和全局平均池化操作從而降低通道數,得到兩個H×W×1的特征圖,然后將這2個特征圖進行拼接操作得到通道數為2的特征圖,其中,H表示特征圖的高度,W表示特征圖的寬度,C表示特征圖的通道數;
子模塊二:一維卷積層和激活函數層,用于將子模塊一輸出的特征圖輸入一個3×3的一維卷積進行學習,從而將通道數降為1,即H×W×1,再經過激活函數生成空間注意力特征圖;
子模塊三:通道相乘層,用于將子模塊二輸出的空間注意力特征圖和最開始的輸入特征圖進行通道相乘操作。
5.根據權利要求1所述的一種面向行人檢測的輕量級卷積神經網絡模型,其特征在于,網絡中的激活函數均使用Hard Swish函數,具體公式如下:
ReLU6(x)=min(6,max(0,x))。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210499061.1/1.html,轉載請聲明來源鉆瓜專利網。





