[發明專利]一種基于輕量級卷積神經網絡的高效視頻目標檢測方法在審
| 申請號: | 202010691045.3 | 申請日: | 2020-07-17 |
| 公開(公告)號: | CN111797805A | 公開(公告)日: | 2020-10-20 |
| 發明(設計)人: | 高飛;董信陽;葛一粟;盧書芳;翁立波;張元鳴 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 杭州浙科專利事務所(普通合伙) 33213 | 代理人: | 周紅芳 |
| 地址: | 310006 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 輕量級 卷積 神經網絡 高效 視頻 目標 檢測 方法 | ||
1.一種基于輕量級卷積神經網絡的高效視頻目標檢測方法,其特征在于包括如下步驟:
步驟1:從監控視頻中獲取圖片幀,并將圖片調整到320×240尺寸;
步驟2:構建輕量級卷積神經網絡目標檢測模型;
步驟3:使用訓練好的輕量級卷積神經網絡目標檢測模型對每幀中所有目標進行檢測,獲取每幀內的所有目標的定位框。
2.根據權利要求1所述的基于輕量級卷積神經網絡的高效視頻目標檢測方法,其特征在于步驟2中的構建輕量級卷積神經網絡目標檢測模型,具體包括如下步驟:
步驟2.1:使用步長為2的3×3卷積核,增加特征通道深度到32通道,降低尺寸為160×120,然后使用BN歸一化和ReLU函數進行激活;
步驟2.2:使用步長為1的1×1卷積核,調整特征通道深度到16通道,然后使用BN歸一化和ReLU函數進行激活;
步驟2.3:通過5次組合卷積模塊,然后將第2次、第3次、第4次、第5次的組合卷積模塊輸出的特征進行融合進行定位和分類組合卷積模塊輸出的特征進行融合進行定位和分類;
步驟2.4:選取如式(1)所示的分類損失函數:
式中,L為損失函數值,y*為預測出類別得分值,y標簽值,y∈{0,1},α和γ為超參數;
步驟2.5:通過非極大值抑制篩選正確的目標檢測框。
3.根據權利要求2所述的基于輕量級卷積神經網絡的高效視頻目標檢測方法,其特征在于步驟2.3的通過5次組合卷積模塊,通過5次組合卷積模塊,然后將第2、3、4、5次組合卷積模塊輸出的特征進行融合進行定位和分類,包括:
步驟2.3.1:依次通過步長為2和1的3×3卷積核,降低特征圖尺度,然后使用BN歸一化和ReLU函數進行激活;
步驟2.3.2:依次通過步長為1的1×1和3×3深度可分離卷積,然后使用BN歸一化和ReLU函數進行激活。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010691045.3/1.html,轉載請聲明來源鉆瓜專利網。





