[發明專利]一種基于深度學習和強化學習的行人重識別方法及系統有效
| 申請號: | 201611199109.8 | 申請日: | 2016-12-22 |
| 公開(公告)號: | CN106709449B | 公開(公告)日: | 2020-04-21 |
| 發明(設計)人: | 王澤楷;趙瑞;徐靜 | 申請(專利權)人: | 深圳市深網視界科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京卓唐知識產權代理有限公司 11541 | 代理人: | 龔潔 |
| 地址: | 518000 廣東省深圳市南山區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 強化 行人 識別 方法 系統 | ||
1.一種基于深度學習和強化學習的行人重識別方法,其特征在于,包括如下步驟:
接收視頻獲取行人圖片,根據行人圖片獲取行人坐標信息,通過光流算法和行人坐標信息計算不同幀圖片中同一行人的運動方向得到行人朝向信息,并在標注行人身份信息后得到行人訓練數據集,行人訓練數據集包含行人的朝向信息和身份標簽;
以行人訓練數據集為基礎,利用多任務學習方法構建并訓練深度神經網絡,獲得行人朝向和身份識別的雙任務模型;
按照朝向設置決策基,根據不同決策基的組合設定決策類別,按照朝向設置決策基,并根據預設的強化學習模型對決策空間中決策類別進行訓練計算最優決策模型;
接收待識別行人圖片,調用雙任務模型獲得該行人的朝向信息后,調用最優決策模型獲得最優決策,查詢行人庫輸出對該行人識別的檢索結果。
2.根據權利要求1所述的基于深度學習和強化學習的行人重識別方法,其特征在于,所述利用多任務學習方法構建深度神經網包括分別構建數據輸入層、卷積層、批規范化層、非線性層、池化層、全連接層和softmax損耗層,其中,
數據輸入層,用于接收行人圖片,對行人圖片進行預處理;
卷積層,用于提取對預處理后的行人圖片的圖像特征;
批規范化層,用于對圖像特征進行規劃化處理;
非線性層,用于圖像特征或規范化處理的圖像特征進行非線性變換;
池化層,用于將圖像特征與行人進行映射操作;
全連接層,用于對圖像特征進行線性變換;
softmax損耗層,用于計算預測類別和標簽類別的誤差。
3.根據權利要求1所述的基于深度學習和強化學習的行人重識別方
法,其特征在于,所述按照朝向設置決策基,根據不同決策基的組合設定決策類別,將所有的決策類別建立為決策空間,并根據預設的強化學習模型對決策空間中決策類別進行訓練計算最優決策模型包括
選擇決策基組成新的決策;
根據行人朝向訓練行人朝向數據集,獲取行人朝向匹配權重,根據匹配權重確定新的決策的種類;
利用強化學習算法函數對新的決策的種類進行訓練,獲取最優決策模型。
4.根據權利要求3所述的基于深度學習和強化學習的行人重識別方法,其特征在于,所述利用強化學習算法函數對決策種類計算訓練,獲取最優決策模型包括
選擇新的決策計算同一行人的行人圖片與預設的行人重識別庫的相似度,判斷相似度是否大于閾值T;
如果相似度大于閾值T,計算該行人圖片的回報值R,統計該行人圖片的累積回報值V(S);
最大化折算累積回報函數對累積回報值V(S)進行計算獲取最優決策模型。
5.根據權利要求4所述的基于深度學習和強化學習的行人重識別方
法,其特征在于,
V(S)=R1+γR2+γ2R3+...,其中,γ為衰減項;R1代表第一張行人圖片與行人重識別庫匹配中得到的相似度大于閾值T;R2代表第二張行人圖片與行人重識別庫匹配中得到的相似度大于閾值T;R3代表第三張行人圖片與行人重識別庫匹配中得到的相似度大于閾值T;S為匹配相似度;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市深網視界科技有限公司,未經深圳市深網視界科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611199109.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種廢潤滑油制作拉絲粉方法
- 下一篇:壓裂參數優選方法





