[發(fā)明專利]基于深度學(xué)習(xí)的視覺(jué)多目標(biāo)跟蹤方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202010698618.5 | 申請(qǐng)日: | 2020-07-20 |
| 公開(kāi)(公告)號(hào): | CN111860504A | 公開(kāi)(公告)日: | 2020-10-30 |
| 發(fā)明(設(shè)計(jì))人: | 李輝;劉亞鵬;張淑軍;董燕;王傳旭;徐凌偉 | 申請(qǐng)(專利權(quán))人: | 青島科技大學(xué) |
| 主分類號(hào): | G06K9/32 | 分類號(hào): | G06K9/32;G06K9/62;G06T7/246;G06N3/04;G06N3/08 |
| 代理公司: | 青島聯(lián)智專利商標(biāo)事務(wù)所有限公司 37101 | 代理人: | 李升娟 |
| 地址: | 266061 山*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 深度 學(xué)習(xí) 視覺(jué) 多目標(biāo) 跟蹤 方法 裝置 | ||
1.一種基于深度學(xué)習(xí)的多目標(biāo)跟蹤方法,其特征在于,所述方法包括:
將視頻幀序列輸入到訓(xùn)練后的殘差網(wǎng)絡(luò)中;
將所述殘差網(wǎng)絡(luò)至少一個(gè)底層的輸出特征與該網(wǎng)絡(luò)最后一層的輸出特征融合,輸出殘差網(wǎng)絡(luò)融合特征圖;
將當(dāng)前視頻幀的所述殘差網(wǎng)絡(luò)融合特征圖分別與相鄰的前兩視頻幀的所述殘差網(wǎng)絡(luò)融合特征圖進(jìn)行相似性度量,獲得與所述前兩視頻幀對(duì)應(yīng)的注意力圖;
利用所述前兩視頻幀對(duì)應(yīng)的注意力圖對(duì)所述當(dāng)前視頻幀的所述殘差網(wǎng)絡(luò)融合特征圖作加權(quán)處理,輸出當(dāng)前視頻幀的空間增強(qiáng)特征圖;
將所述當(dāng)前視頻幀的空間增強(qiáng)特征圖輸入到訓(xùn)練后的LSTMs網(wǎng)絡(luò)中,輸出時(shí)空增強(qiáng)特征圖;
將所述時(shí)空增強(qiáng)特征圖輸入到訓(xùn)練后的RPN網(wǎng)絡(luò)中,輸出帶有區(qū)域建議的特征圖;
將所述帶有區(qū)域建議的特征圖輸入到訓(xùn)練后的目標(biāo)檢測(cè)器,輸出目標(biāo)檢測(cè)結(jié)果;將所述帶有區(qū)域建議的特征圖輸入到訓(xùn)練后的數(shù)據(jù)關(guān)聯(lián)頭,預(yù)測(cè)關(guān)聯(lián)矢量;
基于所述目標(biāo)檢測(cè)結(jié)果和所述關(guān)聯(lián)矢量進(jìn)行目標(biāo)跟蹤。
2.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多目標(biāo)跟蹤方法,其特征在于,將所述殘差網(wǎng)絡(luò)至少一個(gè)底層的輸出特征與該網(wǎng)絡(luò)最后一層的輸出特征融合,輸出殘差網(wǎng)絡(luò)融合特征圖,具體包括:
將所述殘差網(wǎng)絡(luò)第二層的輸出特征和第三層的輸出特征作為底層的輸出特征,與該網(wǎng)絡(luò)最后一層的輸出特征融合,輸出殘差網(wǎng)絡(luò)融合特征圖。
3.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的多目標(biāo)跟蹤方法,其特征在于,將當(dāng)前視頻幀的所述殘差網(wǎng)絡(luò)融合特征圖分別與相鄰的前兩視頻幀的所述殘差網(wǎng)絡(luò)融合特征圖進(jìn)行相似性度量,獲得與所述前兩視頻幀對(duì)應(yīng)的注意力圖;利用所述前兩視頻幀對(duì)應(yīng)注意力圖對(duì)所述當(dāng)前視頻幀的所述殘差網(wǎng)絡(luò)融合特征圖作加權(quán)處理,輸出當(dāng)前視頻幀的空間增強(qiáng)特征圖,具體包括:
將所述當(dāng)前視頻幀的所述殘差網(wǎng)絡(luò)融合特征圖分別與相鄰的前兩視頻幀的所述殘差網(wǎng)絡(luò)融合特征圖利用匹配網(wǎng)絡(luò)計(jì)算對(duì)應(yīng)位置之間的相似度,得到兩個(gè)相似度矩陣;
將兩個(gè)所述相似度矩陣分別轉(zhuǎn)換為指定尺寸的特征圖,將所述指定尺寸的特征圖經(jīng)卷積層處理,然后通過(guò)softmax分類器分別計(jì)算出與所述前兩視頻幀對(duì)應(yīng)的注意力圖;
將所述當(dāng)前視頻幀的所述殘差網(wǎng)絡(luò)融合特征圖轉(zhuǎn)換為所述指定尺寸的特征圖,利用所述前兩視頻幀對(duì)應(yīng)的注意力圖分別對(duì)所述當(dāng)前視頻幀的所述指定尺寸的特征圖作加權(quán)處理,輸出當(dāng)前視頻幀的空間增強(qiáng)特征圖。
4.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的視覺(jué)多目標(biāo)跟蹤方法,其特征在于,將所述帶有區(qū)域建議的特征圖輸入到訓(xùn)練后的目標(biāo)檢測(cè)器,輸出目標(biāo)檢測(cè)結(jié)果,具體包括:
將所述帶有區(qū)域建議的特征圖分別輸入到訓(xùn)練后的ROI分類器、邊界框回歸器和分割掩碼網(wǎng)絡(luò),輸出包括有目標(biāo)分類、分?jǐn)?shù)、預(yù)測(cè)邊界框以及分割掩碼的目標(biāo)檢測(cè)結(jié)果。
5.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的視覺(jué)多目標(biāo)跟蹤方法,其特征在于,在訓(xùn)練所述數(shù)據(jù)關(guān)聯(lián)頭的訓(xùn)練過(guò)程中,采用下述損失函數(shù)Lta修正預(yù)測(cè)結(jié)果:
;
其中,;batch為批處理圖片組,P為目標(biāo)數(shù)量,K為同一個(gè)目標(biāo)對(duì)應(yīng)的不同圖片的數(shù)量,a為batch中的任一張圖片,A為與a具有相同目標(biāo)的圖片集,B為與a不具有相同目標(biāo)的圖片集,p為與a距離最遠(yuǎn)的正樣本,n為與a距離最近的負(fù)樣本,α為閾值參數(shù),max表示最大值,min表示最小值,nonmax表示非最大值,nonmin表示非最小值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于青島科技大學(xué),未經(jīng)青島科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010698618.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





