[發明專利]一種目標跟蹤狀態模型訓練方法及裝置在審
| 申請號: | 201710039530.0 | 申請日: | 2017-01-19 |
| 公開(公告)號: | CN106874856A | 公開(公告)日: | 2017-06-20 |
| 發明(設計)人: | 譙帥;彭莉;張如高 | 申請(專利權)人: | 博康智能信息技術有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京三聚陽光知識產權代理有限公司11250 | 代理人: | 陳博旸 |
| 地址: | 100192 北京市海淀區西小口路66號*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 目標 跟蹤 狀態 模型 訓練 方法 裝置 | ||
1.一種目標跟蹤狀態模型訓練方法,其特征在于,包括:
獲取視頻序列中目標在不同狀態下的已知軌跡信息和所述目標的跟蹤狀態模型;
利用所述跟蹤狀態模型跟蹤所述視頻序列中的目標,得到所述跟蹤狀態模型在不同狀態下輸出的軌跡信息;
從所述跟蹤狀態模型在不同狀態下輸出的軌跡信息中,選擇一個狀態下的軌跡信息;
根據所述一個狀態下的軌跡信息和相應狀態的所述已知軌跡信息,判斷所述目標的跟蹤狀態是否正確;
當所述目標的跟蹤狀態不正確時,更新所述跟蹤狀態模型。
2.根據權利要求1所述的方法,其特征在于,所述從所述跟蹤狀態模型在不同狀態下輸出的軌跡信息中,選擇一個狀態下的軌跡信息,包括:
確定目標狀態;
計算幀間相似性;
根據所述目標狀態和所述幀間相似性,計算獎勵值;
根據所述獎勵值,選擇具有最大獎勵值的軌跡;
根據最大獎勵值輸出所述最大獎勵值對應的軌跡信息。
3.根據權利要求2所述的方法,其特征在于,所述確定目標狀態,包括:
根據所述跟蹤狀態模型在不同狀態下輸出的軌跡信息,確定目標狀態。
4.根據權利要求2所述的方法,其特征在于,所述計算幀間相似性,包括:利用式(1)計算幀間相似性:
f(s)=Wφ(s)+b(1)
式(1)中,s表示目標狀態,φ(s)表示目標狀態的向量,W和b為權重。
5.根據權利要求2所述的方法,其特征在于,所述根據所述目標狀態和所述幀間相似性,計算獎勵值,包括:利用式(2)計算獎勵值:
R(s,a)=y(a)(Wφ(s)+b)(2)
式(2)中,a表示跟蹤動作,y(a)表示跟蹤動作a對應的權重系數。
6.一種目標跟蹤狀態模型訓練裝置,其特征在于,包括:
獲取單元,用于獲取視頻序列中目標在不同狀態下的已知軌跡信息和所述目標的跟蹤狀態模型;
輸出單元,用于利用所述跟蹤狀態模型跟蹤所述視頻序列中的目標,得到所述跟蹤狀態模型在不同狀態下輸出的軌跡信息;
選擇單元,用于從所述跟蹤狀態模型在不同狀態下輸出的軌跡信息中,選擇一個狀態下的軌跡信息;
判斷單元,用于根據所述一個狀態下的軌跡信息和相應狀態的所述已知軌跡信息,判斷所述目標的跟蹤狀態是否正確;
更新單元,用于當所述目標的跟蹤狀態不正確時,更新所述跟蹤狀態模型。
7.根據權利要求6所述的裝置,其特征在于,所述選擇單元包括:
狀態確定子單元,用于確定目標狀態;
相似性計算子單元,用于計算幀間相似性;
獎勵值計算子單元,用于根據所述目標狀態和所述幀間相似性,計算獎勵值;
選擇子單元,用于根據所述獎勵值,選擇具有最大獎勵值的軌跡;
輸出子單元,用于根據最大獎勵值輸出所述最大獎勵值對應的軌跡信息。
8.根據權利要求7所述的裝置,其特征在于,所述確定目標狀態,包括:
根據所述跟蹤狀態模型在不同狀態下輸出的軌跡信息,確定目標狀態。
9.根據權利要求7所述的裝置,其特征在于,所述計算幀間相似性,包括:利用式(1)計算幀間相似性:
f(s)=Wφ(s)+b(1)
式(1)中,s表示目標狀態,φ(s)表示目標狀態的向量,W和b為權重。
10.根據權利要求7所述的裝置,其特征在于,所述根據所述目標狀態和所述幀間相似性,計算獎勵值,包括:利用式(2)計算獎勵值:
R(s,a)=y(a)(Wφ(s)+b)(2)
式(2)中,a表示跟蹤動作,y(a)表示跟蹤動作a對應的權重系數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于博康智能信息技術有限公司,未經博康智能信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710039530.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:頭肩區域定位方法及裝置
- 下一篇:一種基于視頻分析的活體判別方法及系統





