[發(fā)明專利]一種適用于智能視頻監(jiān)控的目標(biāo)檢測方法與系統(tǒng)有效
| 申請?zhí)枺?/td> | 202010984829.5 | 申請日: | 2020-09-18 |
| 公開(公告)號: | CN112183269B | 公開(公告)日: | 2023-08-29 |
| 發(fā)明(設(shè)計)人: | 徐勇;吳志昊 | 申請(專利權(quán))人: | 哈爾濱工業(yè)大學(xué)(深圳) |
| 主分類號: | G06V20/52 | 分類號: | G06V20/52;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/08 |
| 代理公司: | 深圳市添源創(chuàng)鑫知識產(chǎn)權(quán)代理有限公司 44855 | 代理人: | 覃迎峰 |
| 地址: | 518000 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 適用于 智能 視頻 監(jiān)控 目標(biāo) 檢測 方法 系統(tǒng) | ||
1.一種適用于智能視頻監(jiān)控的目標(biāo)檢測方法,其特征在于,包括以下步驟:
1)通過輕量級骨干網(wǎng)絡(luò)模塊提取圖像特征,同時利用大卷積核深度卷積和小卷積核深度卷積以分別捕獲高分辨率模式和低分辨率模式,從而在計算開銷小的前提下獲得良好的特征提取能力;
2)通過注意力機制模塊進(jìn)一步提升特征提取力,同時利用通道注意力模塊和空間注意力模塊在通道和空間軸兩個維度上對特征圖進(jìn)行加權(quán),調(diào)整特征響應(yīng)值以強調(diào)或抑制信息,從而提高網(wǎng)絡(luò)的表達(dá)力;
3)通過多尺度預(yù)測模塊預(yù)測目標(biāo)的類別和位置,同時利用多尺度信息以適用于不同大小目標(biāo)的檢測;
所述的輕量級骨干網(wǎng)絡(luò)模塊主要由1×1卷積、批標(biāo)準(zhǔn)化、激活函數(shù)和混合深度卷積所構(gòu)成的第一基本模塊堆疊而成;
所述的輕量級骨干網(wǎng)絡(luò)模塊提取特征的方式如下:
輸入:X∈RH×W×3為固定尺寸的訓(xùn)練/測試RGB圖像,H表示圖像的高,
W表示圖像的寬;
輸出:F∈RH×W×C為輕量級骨干網(wǎng)絡(luò)提取的特征圖,H表示特征圖的高,W表示特征圖的寬,C表示特征圖的數(shù)量;
步驟a1)通過1×1卷積將低維特征映射到高維,批標(biāo)準(zhǔn)化層保證神經(jīng)網(wǎng)絡(luò)每一層的輸入保持相同分布,通過ReLU激活函數(shù)增加神經(jīng)網(wǎng)絡(luò)各層之間的非線性關(guān)系;
步驟b1)通過混合深度卷積同時捕獲高分辨率模式和低分辨率模式和降低計算復(fù)雜度,批標(biāo)準(zhǔn)化層保證神經(jīng)網(wǎng)絡(luò)每一層的輸入保持相同分布,ReLU/Swish激活函數(shù)增加神經(jīng)網(wǎng)絡(luò)各層之間的非線性關(guān)系;
步驟c1)1×1卷積將高維特征映射到低維,批標(biāo)準(zhǔn)化層保證神經(jīng)網(wǎng)絡(luò)每一層的輸入保持相同分布;
步驟d1)重復(fù)上述步驟a1)、b1)、c1)5次,每重復(fù)上述步驟a1)、b1)、c1)一次,則形成所述輕量級骨干網(wǎng)絡(luò)模塊提取特征的一個階段,即共形成輕量級骨干網(wǎng)絡(luò)模塊提取特征的5個階段。
2.根據(jù)權(quán)利要求1所述的適用于智能視頻監(jiān)控的目標(biāo)檢測方法,其特征在于:所述的注意力機制模塊包含兩個子模塊,分別為通道注意力模塊和空間注意力模塊,兩個子模塊分別在通道和空間軸兩個維度上對特征圖進(jìn)行加權(quán),調(diào)整特征響應(yīng)值以強調(diào)重要信息和抑制非重要信息。
3.根據(jù)權(quán)利要求2所述的適用于智能視頻監(jiān)控的目標(biāo)檢測方法,其特征在于:所述的注意力機制模塊的建立方法如下:
輸入:F∈RH×W×C為所述的輕量級骨干網(wǎng)絡(luò)模塊提取特征的每一階段輸出的特征圖,H表示特征圖的高,W表示特征圖的寬,C表示特征圖的數(shù)量;
輸出:F″∈RH×W×C為注意力機制模塊調(diào)整后的特征圖,H表示特征圖的高,W表示特征圖的寬,C表示特征圖的數(shù)量;
步驟a2)通道注意力模塊通過平均池化和最大池化操作來聚合輸入特征圖的空間信息,然后將其饋入具有一個隱藏層的多層感知機,再使用逐元素求和來合并輸出的特征向量,產(chǎn)生通道注意力圖MC∈R1×1×C;
步驟b2)將步驟a2)輸出的通道注意力圖MC∈R1×1×C沿通道軸進(jìn)行平均池化和最大池化操作,然后進(jìn)行張量拼接并饋入7×7卷積,產(chǎn)生二維空間注意力圖MS∈RH×W×C;
步驟c2)在所述的輕量級骨干網(wǎng)絡(luò)模塊提取特征的每一階段后依次執(zhí)行上述步驟a2)和b2),即每重復(fù)步驟a2)、b2)一次,則形成注意力機制模塊調(diào)整特征圖的一個階段,依次為注意力機制模塊調(diào)整特征圖的第一階段、注意力機制模塊調(diào)整特征圖的第二階段、注意力機制模塊調(diào)整特征圖的第三階段、注意力機制模塊調(diào)整特征圖的第四階段、注意力機制模塊調(diào)整特征圖的第五階段。
4.根據(jù)權(quán)利要求3所述的適用于智能視頻監(jiān)控的目標(biāo)檢測方法,其特征在于:所述的多尺度預(yù)測模塊首先堆疊由卷積、批標(biāo)準(zhǔn)化層和Leaky?ReLU激活函數(shù)構(gòu)成的第二基本模塊,然后通過1×1卷積輸出初步檢測結(jié)果,最后使用非極大值抑制合并初步結(jié)果以輸出最終結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工業(yè)大學(xué)(深圳),未經(jīng)哈爾濱工業(yè)大學(xué)(深圳)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010984829.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 多級校內(nèi)監(jiān)控系統(tǒng)
- 多級校內(nèi)監(jiān)控系統(tǒng)
- 一種范圍廣、力度大的校內(nèi)監(jiān)控系統(tǒng)
- 一種監(jiān)控的方法及系統(tǒng)
- 設(shè)備的監(jiān)控方法、裝置、系統(tǒng)和空調(diào)
- 多級校內(nèi)監(jiān)控系統(tǒng)
- 設(shè)備監(jiān)控方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 風(fēng)險雷達(dá)預(yù)警的監(jiān)控方法及系統(tǒng)
- 區(qū)塊鏈網(wǎng)絡(luò)監(jiān)控系統(tǒng)、裝置及方法
- 基于機器視覺的車站客流安全智能監(jiān)控系統(tǒng)





