[發(fā)明專利]一種基于孿生網(wǎng)絡(luò)的目標特定響應(yīng)注意力目標跟蹤方法有效
| 申請?zhí)枺?/td> | 202010081733.8 | 申請日: | 2020-02-06 |
| 公開(公告)號: | CN111291679B | 公開(公告)日: | 2022-05-27 |
| 發(fā)明(設(shè)計)人: | 王菡子;趙鵬輝;陳昊升;梁艷杰;嚴嚴 | 申請(專利權(quán))人: | 廈門大學(xué) |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06V10/774;G06V10/82;G06N3/04 |
| 代理公司: | 廈門南強之路專利事務(wù)所(普通合伙) 35200 | 代理人: | 馬應(yīng)森 |
| 地址: | 361005 *** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 孿生 網(wǎng)絡(luò) 目標 特定 響應(yīng) 注意力 跟蹤 方法 | ||
1.一種基于孿生網(wǎng)絡(luò)的目標特定響應(yīng)注意力目標跟蹤方法,其特征在于包括以下步驟:
1)給定一段視頻序列,其中第一幀包含已標記的目標,定義目標模板區(qū)域Z以及目標搜索區(qū)域X,目標模板區(qū)域Z在第一幀中基于給定標記截取后保持不變,目標搜索區(qū)域X是在當前要測試的視頻幀中獲取,利用上一幀得到的目標位置截取比目標模板區(qū)域Z更大的圖像塊;
2)將步驟1)所述目標模板區(qū)域和目標搜索區(qū)域輸入到全卷積孿生網(wǎng)絡(luò),得到目標模板區(qū)域Z的CNN特征Fz和目標搜索區(qū)域X的CNN特征Fx;
3)將步驟2)所得CNN特征Fx和Fz輸入到目標特定響應(yīng)的注意力模型,得到由注意力機制加權(quán)的多通道的響應(yīng)圖Smulti,對響應(yīng)圖Smulti進行逐通道的求和得到最終的響應(yīng)圖S,將響應(yīng)圖S中響應(yīng)值最大的位置確定為目標初始位置;
所述得到最終的響應(yīng)圖S的具體步驟為:
(1)對目標搜索區(qū)域X和目標模板區(qū)域Z的CNN特征Fx和Fz進行逐通道的互相關(guān)操作,得到多通道的響應(yīng)圖,表示為:
Smulti=Corrcw(Fx,Fz);
(2)將Fx輸入注意力網(wǎng)絡(luò)H(·),得到通道的注意力權(quán)重ω,注意力網(wǎng)絡(luò)由一個全局均值池化和一個三層的多層感知機構(gòu)成,表示為:
ω=H(Fx)
(3)將計算得到的通道的注意力權(quán)重ω,加權(quán)到多通道的響應(yīng)圖Smulti上,得到加權(quán)的多通道響應(yīng)圖然后將與Smulti相加構(gòu)成殘差的結(jié)構(gòu),再按通道求和得到最終的響應(yīng)圖Sfinal,整個過程表示為下式:
4)以步驟1)中上一幀得到的目標位置為中心,對目標搜索區(qū)域構(gòu)建搜索尺度金字塔,對尺度金字塔中每個估計尺度的搜索區(qū)域都執(zhí)行步驟3),選用響應(yīng)值最高的目標搜索區(qū)域的尺度作為當前幀對應(yīng)的尺度,將目標位置和尺度結(jié)合即得到目標的實際大小和位置,從而實現(xiàn)目標跟蹤;
5)訓(xùn)練模型:模型的訓(xùn)練獨立于跟蹤過程,采用離線訓(xùn)練好模型后,將訓(xùn)練好的模型用于跟蹤步驟。
2.如權(quán)利要求1所述一種基于孿生網(wǎng)絡(luò)的目標特定響應(yīng)注意力目標跟蹤方法,其特征在于在步驟1)中,目標搜索區(qū)域X是在當前要測試的視頻幀中獲取的具體步驟如下:
1.1在初始幀根據(jù)真實的有效值截取出來的目標模板區(qū)域,目標模板區(qū)域截取的大小比實際目標稍大些,用來捕捉一些語義信息,目標模板區(qū)域截取的大小按以下公式計算:
其中,c是(wz+hz)/2,wz表示目標模板區(qū)域Z的寬,hz表示目標模板區(qū)域Z的高,然后將截取的模板圖像塊重新調(diào)整為125×125的大小,將調(diào)整尺度scale=125/Sz保存,用于計算搜索區(qū)域的截取大小;
1.2關(guān)于搜索區(qū)域重新調(diào)整大小是255×255,為保證搜索區(qū)域的目標尺度和模板的尺度保持一致,搜索區(qū)域的實際截取大小為:Sx=255/scale。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門大學(xué),未經(jīng)廈門大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010081733.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種數(shù)控機床數(shù)字孿生建模方法
- 一種基于數(shù)字孿生模型的時序類潛在問題識別方法及系統(tǒng)
- 一種礦井數(shù)字孿生模型及其構(gòu)建方法
- 一種以統(tǒng)一形式樣機模型定義數(shù)字孿生體的方法及裝置
- 基于數(shù)字孿生體的醫(yī)療設(shè)備定位方法、系統(tǒng)和存儲介質(zhì)
- 一種基于機器視覺的數(shù)字孿生模型修正方法與系統(tǒng)
- 一種基于數(shù)字孿生的泵機組優(yōu)化運行調(diào)節(jié)系統(tǒng)及方法
- 數(shù)字孿生模型的運行方法、裝置和電子設(shè)備
- 一種組件式孿生計算方法及系統(tǒng)
- 一種基于數(shù)字孿生的空間在軌激光加工過程實時監(jiān)測方法
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





