[發明專利]目標對象的屬性識別方法及裝置有效
| 申請號: | 201710983033.6 | 申請日: | 2017-10-19 |
| 公開(公告)號: | CN107704838B | 公開(公告)日: | 2020-09-25 |
| 發明(設計)人: | 肖琦琦;張弛 | 申請(專利權)人: | 北京曠視科技有限公司;北京邁格威科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N3/08 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 宋南 |
| 地址: | 100000 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 對象 屬性 識別 方法 裝置 | ||
1.一種目標對象的屬性識別方法,其特征在于,所述方法采用識別網絡執行,所述識別網絡包括特征提取網絡,以及分別與所述特征提取網絡相連的行人再識別網絡、行人姿態識別網絡和行人屬性識別網絡;所述識別網絡的參數由所述行人再識別網絡、所述行人姿態識別網絡和所述行人屬性識別網絡基于共享所述特征提取網絡的方式聯合訓練得到;
所述方法包括:
所述特征提取網絡提取所述目標對象的特征信息;
所述行人屬性識別網絡基于所述特征信息,確定所述目標對象的屬性;
所述方法還包括:基于共享所述特征提取網絡的方式對所述行人再識別網絡、所述行人姿態識別網絡和所述行人屬性識別網絡聯合訓練,直至所述識別網絡的總損失函數值收斂至預設值,將所述總損失函數值收斂至預設值時對應的參數作為識別網絡的參數;
所述基于共享所述特征提取網絡的方式對所述行人再識別網絡、所述行人姿態識別網絡和所述行人屬性識別網絡聯合訓練的步驟包括:將訓練圖片輸入至所述特征提取網絡,以使所述特征提取網絡生成所述訓練圖片的特征圖;將所述特征圖輸入至所述行人再識別網絡,計算得到第一損失函數值;將所述特征圖輸入至所述行人姿態識別網絡,計算得到第二損失函數值;將所述特征圖輸入至所述行人屬性識別網絡,計算得到第三損失函數值;根據所述第一損失函數值、所述第二損失函數值和所述第三損失函數值,確定總損失函數值;基于所述總損失函數值,通過反向傳播算法對所述識別網絡的參數進行訓練。
2.根據權利要求1所述的方法,其特征在于,所述將訓練圖片輸入至所述特征提取網絡的步驟,包括:
從含有行人身份標簽的第一數據集挑選三張圖片,從含有行人骨架標簽的第二數據集挑選一張圖片,以及從含有行人屬性標簽的第三數據集挑選一張圖片,將挑選的圖片作為訓練圖片;其中,從所述第一數據集挑選的三張圖片分別為參考圖片、正樣本圖片和負樣本圖片。
3.根據權利要求2所述的方法,其特征在于,所述將所述特征圖輸入至所述行人再識別網絡,計算得到第一損失函數值的步驟,包括:
將所述參考圖片、所述正樣本圖片和所述負樣本圖片分別對應的特征圖輸入至所述行人再識別網絡;
通過三元組損失函數計算得到第一損失函數值。
4.根據權利要求2所述的方法,其特征在于,所述將所述特征圖輸入至所述行人姿態識別網絡,計算得到第二損失函數值的步驟,包括:
將所述第二數據集挑選的圖片對應的特征圖輸入至包括有M個骨架點對應分支的所述行人姿態識別網絡,計算得到第二損失函數值;其中,所述第二損失函數值包括M個所述分支分別對應的損失函數值。
5.根據權利要求2所述的方法,其特征在于,所述將所述特征圖輸入至所述行人屬性識別網絡,計算得到第三損失函數值的步驟,包括:
將所述第三數據集挑選的圖片對應的特征圖輸入至包括有N個屬性對應子網絡的所述行人屬性識別網絡,計算得到第三損失函數值;其中,所述第三損失函數值包括N個所述屬性對應子網絡分別對應的損失函數值;每個屬性對應子網絡還分別連接有屬性分類器。
6.根據權利要求1所述的方法,其特征在于,根據所述第一損失函數值、所述第二損失函數值和所述第三損失函數值,確定總損失函數值的步驟,包括:
將所述第一損失函數值、所述第二損失函數值和所述第三損失函數值按照預設的權重比例求和,得到總損失函數值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京曠視科技有限公司;北京邁格威科技有限公司,未經北京曠視科技有限公司;北京邁格威科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710983033.6/1.html,轉載請聲明來源鉆瓜專利網。





