[發明專利]基于局部區域搜索的視頻目標檢測方法有效
| 申請號: | 202011260898.8 | 申請日: | 2020-11-12 |
| 公開(公告)號: | CN112380970B | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 龔聲蓉;曾彪 | 申請(專利權)人: | 常熟理工學院 |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06V10/25;G06V10/82;G06K9/62;G06N3/04;G06T7/246;G06T7/73 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 張俊范 |
| 地址: | 215500 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 局部 區域 搜索 視頻 目標 檢測 方法 | ||
1.一種基于局部區域搜索的視頻目標檢測方法,其特征在于,依次包括以下步驟:
S1、首先將輸入視頻的第一幀標記為關鍵幀并使用單幀檢測器進行檢測,得到所述第一幀的圖像中所有目標的區域和類別;所述單幀檢測器進行檢測是將幀圖像輸入殘差網絡得到抽象特征,然后將所述抽象特征 輸入特征金字塔網絡,由頂層的特征與殘差網絡的各層的抽象特征進行融合得到不同尺度的特征信息,再將所述特征信息輸入區域生成網絡生成一系列的目標候選區域,由所述目標候選區域與所述特征信息進行感興趣區域池化操作得到各目標候選區域對應的區域特征,最后把所述區域特征調整到固定大小并由分類器進行分類完成檢測;
S2、從所述輸入視頻的第二幀開始,將每個目標在上一幀的位置映射到當前幀,并把映射的區域輸入到運動預測模塊進行檢測,得到目標的運動方向,根據所述運動方向信息對目標的位置進行微調,得到所述目標在當前幀的區域,所述目標的類別沿用上一幀的結果;所述運動預測模塊進行檢測是將所述映射的區域調整大小并經過若干卷積池化層提取特征得到兩個分支,一個所述分支為經過全連接層后生成多維度的目標運動方向向量,所述目標運動方向向量中數值最大的維度為目標運動方向;另一個所述分支得到預測結果的置信度,置信度越高,表示結果越準確;
S3、將步驟S2得到的目標的區域信息與上一幀的該目標的區域信息同時輸入到相似性檢測模塊,由相似性檢測模塊判斷兩個區域是否表示的是同一個目標,如果是同一個目標則跳過;如果不是同一個目標則將當前幀標記為關鍵幀,并使用單幀檢測器進行檢測目標的位置和類別;
S4、如果還有下一幀則返回步驟S2進行下一幀的檢測,否則檢測結束。
2.根據權利要求1所述的基于局部區域搜索的視頻目標檢測方法,其特征在于,所述運動預測模塊記錄未經過單幀檢測器進行檢測的非關鍵幀的幀序號,當當前幀的幀序號與記錄的所述非關鍵幀的幀序號構成連續的數列時,判斷所述數列的長度,如果長度超過閾值則將當前幀標記為關鍵幀,并使用單幀檢測器進行檢測目標的位置和類別,再進入步驟S4。
3.根據權利要求2所述的基于局部區域搜索的視頻目標檢測方法,其特征在于,所述步驟S3中,由所述相似性檢測模塊判斷不是同一個目標時,將當前幀的幀序號從所述運動預測模塊的記錄中去除。
4.根據權利要求1所述的基于局部區域搜索的視頻目標檢測方法,其特征在于,所述目標運動方向向量的維度分別表示向左、向左*2、向右、向右*2、向上、向上*2、向下、向下*2、不變、縮小、放大的運行方向。
5.根據權利要求1所述的基于局部區域搜索的視頻目標檢測方法,其特征在于,所述相似性檢測模塊判斷兩個區域是否表示的是同一個目標是將當前幀的所述映射的區域與上一幀的目標區域分別輸入孿生網絡的兩個完全相同的分支進行特征提取,對提取的特征計算歐式距離,當計算得到的歐式距離小于設定的相似閾值時為相似,表示為同一目標,否則為不相似,表示為不同目標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于常熟理工學院,未經常熟理工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011260898.8/1.html,轉載請聲明來源鉆瓜專利網。





