[發(fā)明專利]基于視頻的目標(biāo)檢測方法、裝置、設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201910360492.8 | 申請日: | 2019-04-30 |
| 公開(公告)號: | CN111860064B | 公開(公告)日: | 2023-10-20 |
| 發(fā)明(設(shè)計)人: | 石大虎;譚文明 | 申請(專利權(quán))人: | 杭州海康威視數(shù)字技術(shù)股份有限公司 |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06V10/80 |
| 代理公司: | 北京三高永信知識產(chǎn)權(quán)代理有限責(zé)任公司 11138 | 代理人: | 李珂珂 |
| 地址: | 310051 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 視頻 目標(biāo) 檢測 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
本申請公開了一種基于視頻的目標(biāo)檢測方法、裝置、設(shè)備及存儲介質(zhì),屬于目標(biāo)檢測技術(shù)領(lǐng)域。所述方法包括:獲取待檢測視頻中的連續(xù)N幀視頻圖像,該N為大于1的整數(shù);調(diào)用目標(biāo)檢測模型,該目標(biāo)檢測模型至少包括三維卷積層和目標(biāo)檢測層,該三維卷積層用于將該N幀視頻圖像的特征進行卷積融合,該目標(biāo)檢測層用于基于卷積融合后得到的目標(biāo)特征圖檢測出視頻圖像中的目標(biāo);將該N幀視頻圖像輸入至該目標(biāo)檢測模型中進行處理,輸出目標(biāo)檢測結(jié)果。本申請基于特征關(guān)聯(lián)后的目標(biāo)特征圖進行目標(biāo)檢測不僅可以保證檢測的準(zhǔn)確性,即避免漏檢和誤檢的情況,而且還可以避免需要人工設(shè)計不同的規(guī)則,提高了目標(biāo)檢測的適應(yīng)性。
技術(shù)領(lǐng)域
本申請涉及目標(biāo)檢測技術(shù)領(lǐng)域,特別涉及一種基于視頻的目標(biāo)檢測方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù)
目前,目標(biāo)檢測技術(shù)在視頻監(jiān)控等場景中得到廣泛應(yīng)用。在對視頻中的目標(biāo)進行檢測時,由于目標(biāo)運動使得尺寸、位置發(fā)生變化,從而可能造成一些視頻圖像中的目標(biāo)被漏檢或誤檢。
在相關(guān)技術(shù)中,為了減少漏檢和誤檢,對當(dāng)前視頻圖像進行檢測,得到當(dāng)前視頻圖像的中間檢測結(jié)果,然后通過人工設(shè)計的規(guī)則,利用前一幀視頻圖像的最終檢測結(jié)果對當(dāng)前視頻圖像的中間檢測結(jié)果進行融合匹配,以對該中間檢測結(jié)果進行修正,將修正后的結(jié)果確定為當(dāng)前視頻圖像的最終檢測結(jié)果。
然而,在上述實現(xiàn)方式中,當(dāng)涉及不同應(yīng)用場景時,一般需要人工設(shè)計不同的規(guī)則,使得目標(biāo)檢測方法的適應(yīng)性較差。
發(fā)明內(nèi)容
本申請實施例提供了一種基于視頻的目標(biāo)檢測方法、裝置、設(shè)備及存儲介質(zhì),可以解決相關(guān)技術(shù)中需要人工設(shè)計不同規(guī)則進行目標(biāo)檢測的問題。所述技術(shù)方案如下:
第一方面,提供了一種基于視頻的目標(biāo)檢測方法,所述方法包括:
獲取待檢測視頻中的連續(xù)N幀視頻圖像,所述N為大于1的整數(shù);
調(diào)用目標(biāo)檢測模型,所述目標(biāo)檢測模型至少包括三維卷積層和目標(biāo)檢測層,所述三維卷積層用于將所述N幀視頻圖像的特征進行卷積融合,所述目標(biāo)檢測層用于基于卷積融合后得到的目標(biāo)特征圖檢測出視頻圖像中的目標(biāo);
將所述N幀視頻圖像輸入至所述目標(biāo)檢測模型中進行處理,輸出目標(biāo)檢測結(jié)果。
可選地,所述目標(biāo)檢測模型包括的三維卷積層的總數(shù)量為多個,所述將所述N幀視頻圖像輸入至所述目標(biāo)檢測模型中進行處理,輸出目標(biāo)檢測結(jié)果,包括:
將所述N幀視頻圖像輸入至所述目標(biāo)檢測模型中;
依次通過多個三維卷積層對所述N幀視頻圖像進行卷積融合處理;
從所述多個三維卷積層的最后一個三維卷積層輸出的所有特征圖中確定所述目標(biāo)特征圖;
通過所述目標(biāo)檢測層對所述目標(biāo)特征圖進行目標(biāo)檢測處理,輸出所述目標(biāo)檢測結(jié)果。
可選地,所述目標(biāo)檢測模型還包括多個降采樣層,其中,所述多個三維卷積層中的每相鄰兩個三維卷積層之間包括至少一個降采樣層;
所述依次通過所述多個三維卷積層對所述N幀視頻圖像進行卷積融合處理,包括:
依次通過所述多個三維卷積層中的每個三維卷積層對所述N幀視頻圖像進行卷積融合,以及通過與所述每個三維卷積層連接的降采樣層對卷積融合處理后的特征圖進行降采樣處理。
可選地,所述多個三維卷積層中的前M個三維卷積層在時間維度上的卷積核的大小為1,所述多個三維卷積層中除所述前M個三維卷積層之外的其他三維卷積層在時間維度上的卷積核的大小大于1,所述M為大于或等于1且小于所述總數(shù)量的整數(shù)。
可選地,所述從所述多個三維卷積層的最后一個三維卷積層輸出的所有特征圖中確定所述目標(biāo)特征圖,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州海康威視數(shù)字技術(shù)股份有限公司,未經(jīng)杭州海康威視數(shù)字技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910360492.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





