[發(fā)明專(zhuān)利]一種層級(jí)孿生網(wǎng)絡(luò)的實(shí)時(shí)目標(biāo)跟蹤方法在審
| 申請(qǐng)?zhí)枺?/td> | 202211181027.6 | 申請(qǐng)日: | 2022-09-27 |
| 公開(kāi)(公告)號(hào): | CN115661195A | 公開(kāi)(公告)日: | 2023-01-31 |
| 發(fā)明(設(shè)計(jì))人: | 李曉靜 | 申請(qǐng)(專(zhuān)利權(quán))人: | 青島理工大學(xué) |
| 主分類(lèi)號(hào): | G06T7/246 | 分類(lèi)號(hào): | G06T7/246;G06V10/80;G06V10/75;G06V10/764;G06N3/04;G06N3/08 |
| 代理公司: | 濟(jì)南泉城專(zhuān)利商標(biāo)事務(wù)所 37218 | 代理人: | 張貴賓 |
| 地址: | 266525 山東*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 層級(jí) 孿生 網(wǎng)絡(luò) 實(shí)時(shí) 目標(biāo) 跟蹤 方法 | ||
1.一種層級(jí)孿生網(wǎng)絡(luò)的實(shí)時(shí)目標(biāo)跟蹤方法,其特征在于:包括以下步驟:
S1:將視頻幀序列的模板圖像和搜索圖像利用孿生子網(wǎng)絡(luò)進(jìn)行特征提取;
在視頻序列的初始幀中以目標(biāo)物體為中心裁剪出模板幀圖像z,并在當(dāng)前幀中裁剪出搜索幀圖像x,將模板幀圖像和搜索幀圖像分別送入到孿生子網(wǎng)絡(luò)中的模板分支和搜索分支進(jìn)行特征提取;
S2:構(gòu)建融合多級(jí)層次特征的金字塔特征融合模塊
利用步驟1中的孿生子網(wǎng)絡(luò),提取卷積三、四和五層的特征用于金字塔特征融合模塊,從而構(gòu)建了擁有不同層次信息的特征金字塔,三四五層卷積特征首先使用1×1的卷積操作降低通道數(shù),得到處理后的特征φ3(x),φ4(x)和φ5(x)以及φ3(z),φ4(z)和φ5(z),然后將處理后的特征通過(guò)自頂向下的方式與相應(yīng)的淺層特征進(jìn)行逐元素相加,最后利用3×3的卷積操作平滑融合后的不同層特征并學(xué)習(xí)語(yǔ)義相關(guān)性,通過(guò)逐級(jí)融合多級(jí)層次特征的金字塔特征融合模塊,可分別得到卷積三四五層的融合特征圖,以構(gòu)建更具有區(qū)分性的目標(biāo)表示;
S3:構(gòu)建層級(jí)位置感知預(yù)測(cè)模塊
位置感知預(yù)測(cè)模塊包括多個(gè)位置感知預(yù)測(cè)頭,每個(gè)位置感知預(yù)測(cè)頭包括兩個(gè)子任務(wù),一個(gè)是將目標(biāo)從背景中分類(lèi)出來(lái)的分類(lèi)分支,另一個(gè)是提供目標(biāo)框回歸的回歸分支;
對(duì)于單個(gè)位置感知預(yù)測(cè)頭,將步驟S2中由金字塔特征融合模塊獲得的搜索圖像x和模板圖像z的三四五層融合特征Φs(x)和Φs(z),復(fù)制為[φs(x)]cls,[φs(z)]cls,以及[Φs(x)]reg,[Φs(z)]reg到分類(lèi)分支和回歸分支;然后計(jì)算分類(lèi)特征圖和回歸特征圖其中★代表互相關(guān)操作,[Φs(x)]cls、[Φs(z)]cls分別代表搜索幀圖像x和模板幀圖像z得到的融合特征復(fù)制后的,用于分類(lèi)分支的特征圖,[Φs(x)]reg,[Φs(z)]reg分別代表由金字塔特征融合模塊獲得的搜索幀圖像x和模板幀圖像z的三四五層融合特征Φs(x)和Φs(z),復(fù)制的,用于回歸分支的特征圖;分別代表分類(lèi)特征圖和回歸特征圖;
由于單級(jí)預(yù)測(cè)頭在面對(duì)相似干擾或者較大目標(biāo)變化時(shí)可能導(dǎo)致跟蹤性能退化,因此使用多級(jí)預(yù)測(cè)頭構(gòu)成位置感知預(yù)測(cè)模塊以依次細(xì)化目標(biāo)位置和變化,由此可得到位置感知預(yù)測(cè)模塊的分類(lèi)分支和回歸分支的特征圖,和其中wcls和wreg分別代表分類(lèi)分支和回歸分支中每個(gè)預(yù)測(cè)頭的權(quán)重;
S4:模型訓(xùn)練與在線(xiàn)跟蹤
在模型訓(xùn)練中,使用大型數(shù)據(jù)集進(jìn)行端到端訓(xùn)練,集中裁剪模板圖像和搜索圖像訓(xùn)練對(duì),以訓(xùn)練層級(jí)孿生網(wǎng)絡(luò),訓(xùn)練時(shí)采用隨機(jī)梯度下降方法優(yōu)化網(wǎng)絡(luò)參數(shù),并逐漸減少所提的層級(jí)孿生網(wǎng)絡(luò)的整體損失,直到模型的性能不再提升;
在在線(xiàn)跟蹤中,給定待跟蹤的視頻序列,按照步驟1的方式獲取模板幀圖像并通過(guò)孿生子網(wǎng)絡(luò)提取模板特征,在隨后的序列幀中,根據(jù)前一幀的跟蹤結(jié)果提取搜索幀特征,獲取到模板幀和搜索幀圖像特征后送入到金字塔特征融合模塊分別獲得融合后的低層、中層和高層特征,將獲取到的融合特征分別對(duì)應(yīng)輸入到層級(jí)位置感知預(yù)測(cè)模塊的三個(gè)位置感知預(yù)測(cè)頭中,得到三個(gè)分類(lèi)特征圖和三個(gè)回歸特征圖;將三個(gè)分類(lèi)特征圖和三個(gè)回歸特征圖分別進(jìn)行加權(quán)融合,得到融合后的分類(lèi)結(jié)果和回歸結(jié)果,由此得到當(dāng)前幀的目標(biāo)結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種層級(jí)孿生網(wǎng)絡(luò)的實(shí)時(shí)目標(biāo)跟蹤方法,其特征在于:所述步驟S1中,模板幀圖像z大小為127×127×3,搜索幀圖像x大小為255×255×3。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于青島理工大學(xué),未經(jīng)青島理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211181027.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 內(nèi)容檢索裝置及內(nèi)容檢索方法
- 訪(fǎng)問(wèn)控制裝置和訪(fǎng)問(wèn)控制方法
- 一種基于安卓平臺(tái)的多級(jí)樹(shù)形菜單的實(shí)現(xiàn)方法
- 一種視圖層級(jí)優(yōu)化的方法及裝置
- 一種數(shù)據(jù)處理方法及系統(tǒng)
- 車(chē)用微控制器及其信號(hào)控制方法
- 車(chē)用微控制器
- 應(yīng)用程序的用戶(hù)界面UI信息處理方法、裝置及電子設(shè)備
- 評(píng)估指標(biāo)處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 數(shù)據(jù)存儲(chǔ)管理方法和裝置以及卷積計(jì)算硬件加速器
- 一種數(shù)控機(jī)床數(shù)字孿生建模方法
- 一種基于數(shù)字孿生模型的時(shí)序類(lèi)潛在問(wèn)題識(shí)別方法及系統(tǒng)
- 一種礦井?dāng)?shù)字孿生模型及其構(gòu)建方法
- 一種以統(tǒng)一形式樣機(jī)模型定義數(shù)字孿生體的方法及裝置
- 基于數(shù)字孿生體的醫(yī)療設(shè)備定位方法、系統(tǒng)和存儲(chǔ)介質(zhì)
- 一種基于機(jī)器視覺(jué)的數(shù)字孿生模型修正方法與系統(tǒng)
- 一種基于數(shù)字孿生的泵機(jī)組優(yōu)化運(yùn)行調(diào)節(jié)系統(tǒng)及方法
- 數(shù)字孿生模型的運(yùn)行方法、裝置和電子設(shè)備
- 一種組件式孿生計(jì)算方法及系統(tǒng)
- 一種基于數(shù)字孿生的空間在軌激光加工過(guò)程實(shí)時(shí)監(jiān)測(cè)方法
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線(xiàn)網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 實(shí)時(shí)解碼系統(tǒng)與實(shí)時(shí)解碼方法
- 實(shí)時(shí)穩(wěn)定
- 實(shí)時(shí)監(jiān)控裝置、實(shí)時(shí)監(jiān)控系統(tǒng)以及實(shí)時(shí)監(jiān)控方法
- 實(shí)時(shí)或準(zhǔn)實(shí)時(shí)流傳輸
- 實(shí)時(shí)或準(zhǔn)實(shí)時(shí)流傳輸
- 實(shí)時(shí)通信方法和實(shí)時(shí)通信系統(tǒng)
- 實(shí)時(shí)更新
- 實(shí)時(shí)內(nèi)核
- 用于通信網(wǎng)絡(luò)的網(wǎng)絡(luò)設(shè)備及相關(guān)方法
- 實(shí)時(shí)量化方法及實(shí)時(shí)量化系統(tǒng)





