[發(fā)明專利]一種基于深度神經(jīng)網(wǎng)絡(luò)的無重疊區(qū)域行人跟蹤方法有效
| 申請?zhí)枺?/td> | 201810192601.5 | 申請日: | 2018-03-09 |
| 公開(公告)號: | CN108509859B | 公開(公告)日: | 2022-08-26 |
| 發(fā)明(設(shè)計)人: | 韓光;葛亞鳴;蘇晉鵬;李曉飛 | 申請(專利權(quán))人: | 南京郵電大學 |
| 主分類號: | G06V40/20 | 分類號: | G06V40/20;G06V10/84;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京蘇高專利商標事務(wù)所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 神經(jīng)網(wǎng)絡(luò) 重疊 區(qū)域 行人 跟蹤 方法 | ||
1.一種基于深度神經(jīng)網(wǎng)絡(luò)的無重疊區(qū)域行人跟蹤方法,其特征在于,該方法包括以下步驟:
(1)采用YOLO算法對監(jiān)控視頻圖像中當前行人目標進行檢測,分割行人目標圖片;
(2)使用卡爾曼算法對當前行人 檢測結(jié)果跟蹤預(yù)測;
(3)利用深度殘差網(wǎng)絡(luò)提取圖片的深度特征,所述圖片包括候選行人圖片和所述步驟(2)中的目標行人圖片,并存儲所述候選行人的圖片及其特征;所用深度殘差網(wǎng)絡(luò)采用ResNet-50模型作為主干網(wǎng)絡(luò),ResNet-50以殘差單元組成的卷積模塊為基本組成:
第一個卷積模塊Conv1:卷積核大小為7×7,輸出為64張?zhí)卣鲌D;
輸入數(shù)據(jù)下采樣層pool1:池化窗口大小為3×3,輸出為64張?zhí)卣鲌D;
第二個卷積模塊Conv2:包含3個殘差單元,每個殘差單元包含3個卷積層,卷積核大小分別為1×1,3×3和1×1,最終輸出256張?zhí)卣鲌D;
第三個卷積模塊Conv3:包含4個殘差單元,每個殘差單元包含3個卷積層,卷積核大小分別為1×1,3×3和1×1,最終輸出512張?zhí)卣鲌D;
第四個卷積模塊Conv4:包含6個殘差單元,每個殘差單元包含3個卷積層,卷積核大小分別為1×1,3×3和1×1,最終輸出1024張?zhí)卣鲌D;
第五個卷積模塊Conv5:包含3個殘差單元,每個殘差單元包含3個卷積層,卷積核大小分別為1×1,3×3和1×1,最終輸出2048張?zhí)卣鲌D;
輸出數(shù)據(jù)下采樣層pool5:池化窗口大小7×7,輸出為2048×1的向量,該向量即為對行人圖片提取出的深度特征f;
(4)計算目標行人特征與候選行人特征的相似度并排序,識別出所述目標行人;
所述步驟(4)包括:
(41)計算對每個跟蹤行人目標提取的深度特征fq與已離線儲存的候選行人圖片深度特征fgi之間的余弦相似度sim(fq,fgi),其中,fgi表示第i個候選行人圖片的深度特征:
(42)對余弦相似度sim(fq,fgi)從到從大到小進行排序;
(43)與目標行人圖片余弦相似度最大的候選行人圖片,其所屬的行人,即為本方法識別出的行人;設(shè)定余弦相似度閾值為0.75,即當識別出的最大余弦相似度低于該閾值時則判斷目標行人不屬于候選行人中的任意一名。
2.根據(jù)權(quán)利要求1所述的基于深度神經(jīng)網(wǎng)絡(luò)的無重疊區(qū)域行人跟蹤方法,其特征在于,所述步驟(2)包括:
(21)根據(jù)所述當前行人檢測結(jié)果和所述卡爾曼算法,預(yù)測所述當前行人在下一幀圖像中的位置,并將所述位置更新到預(yù)測框中;
(22)對檢測框和所述預(yù)測框的結(jié)果進行配對,計算所述檢測框和所述預(yù)測框之間的歐式距離;
(23)更新配對成功與配對未成功的預(yù)測情況。
3.根據(jù)權(quán)利要求2所述的基于深度神經(jīng)網(wǎng)絡(luò)的無重疊區(qū)域行人跟蹤方法,其特征在于,所述檢測框的顯示方法為:
采用YOLO檢測模型對輸入的所述監(jiān)控視頻的每一幀進行檢測,并將其設(shè)為只檢測行人且設(shè)置置信度閾值,只顯示所述置信度得分高于所述閾值的所述目標行人的檢測框。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學,未經(jīng)南京郵電大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810192601.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機存儲介質(zhì)
- 學習神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機設(shè)備
- 一種適應(yīng)目標數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





