[發明專利]一種結合殘差注意力和上下文信息的目標跟蹤算法在審
| 申請號: | 201811124724.1 | 申請日: | 2018-09-26 |
| 公開(公告)號: | CN109493364A | 公開(公告)日: | 2019-03-19 |
| 發明(設計)人: | 李偉生;詹紫微 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06T7/246 | 分類號: | G06T7/246;G06N3/04;G06N3/08 |
| 代理公司: | 重慶市恒信知識產權代理有限公司 50102 | 代理人: | 劉小紅;陳棟梁 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 殘差 特征圖 卷積 目標跟蹤算法 注意力 上下文信息 跟蹤目標 預測當前幀 跟蹤算法 目標遮擋 視頻序列 提取特征 坐標位置 多輸出 連接層 魯棒性 網絡層 右下角 響應 準確率 算法 網絡 輸出 跟蹤 | ||
1.一種結合殘差注意力和上下文信息的目標跟蹤算法,其特征在于,包括以下步驟:
S1、將已經標注好的第一幀跟蹤目標區域,上一幀已經預測的跟蹤目標區域和當前幀的搜索區域同時傳到卷積層,得到第一幀的卷積特征圖、上一幀的卷積特征圖及當前幀的卷積特征圖;
S2、將第一幀的卷積特征圖送到殘差注意力網絡經過五層卷積操作得到殘差特征圖;
S3、將第一幀的卷積特征圖和殘差特征圖進行乘積操作得到殘差響應特征圖;
S4、將第一幀的殘差特征響應圖、上一幀和當前幀的卷積特征圖傳到全連接層,通過全連接層將卷積層二維的特征圖轉成一維的向量,通過全連接層來學習第一幀,上一幀和當前幀三者之間的時空關系;
S5、將全連接層的結果輸出到輸出層得到最后的跟蹤結果。
2.根據權利要求1所述的一種結合殘差注意力和上下文信息的目標跟蹤算法,其特征在于,所述步驟S1的卷積層是使用的CaffeNet深度學習網絡的前五層卷積層,使用CaffNet在Imagenet圖片數據集分類訓練的參數模型來初始化網絡參數。
3.根據權利要求1或2所述的一種結合殘差注意力和上下文信息的目標跟蹤算法,其特征在于,所述步驟S2的殘差注意力網絡主要是由5層卷積層組成,分別有兩層下采樣,一層1*1的卷積層,還有兩層上采樣。第一幀目標區域通過殘差網絡之后可以得到第一幀的殘差特征圖。
4.根據權利要求3所述的一種結合殘差注意力和上下文信息的目標跟蹤算法,其特征在于,所述步驟S3將得到的殘差特征圖Mi,c(x)和第一幀的卷積特征圖Fi,c(x)進行元素乘積操作,得到第一幀跟蹤目標的殘差特征響應圖Mi,c(x)*Fi,c(x)。
5.根據權利要求4所述的一種結合殘差注意力和上下文信息的目標跟蹤算法,其特征在于,所述S4將第一幀的殘差特征響應圖、上一幀和當前幀的卷積特征圖傳到全連接層,通過全連接層將卷積層二維的特征圖轉成一維的向量,通過全連接層來學習第一幀,上一幀和當前幀三者之間的時空關系。
6.根據權利要求5所述的一種結合殘差注意力和上下文信息的目標跟蹤算法,其特征在于,所述步驟S5的輸出層本質上是由全連接層組成,輸出通道數為4,4分別代表跟蹤目標的左上角和右下角在當前幀的坐標值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811124724.1/1.html,轉載請聲明來源鉆瓜專利網。





