[發(fā)明專利]目標對象的屬性識別方法及裝置有效
| 申請?zhí)枺?/td> | 201710983033.6 | 申請日: | 2017-10-19 |
| 公開(公告)號: | CN107704838B | 公開(公告)日: | 2020-09-25 |
| 發(fā)明(設計)人: | 肖琦琦;張弛 | 申請(專利權)人: | 北京曠視科技有限公司;北京邁格威科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N3/08 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 宋南 |
| 地址: | 100000 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 對象 屬性 識別 方法 裝置 | ||
本發(fā)明提供了一種目標對象的屬性識別方法及裝置,涉及圖像識別技術領域,該方法采用識別網絡執(zhí)行,該識別網絡包括特征提取網絡,以及分別與特征提取網絡相連的行人再識別網絡、行人姿態(tài)識別網絡和行人屬性識別網絡;識別網絡的參數由行人再識別網絡、行人姿態(tài)識別網絡和行人屬性識別網絡基于共享特征提取網絡的方式聯(lián)合訓練得到;該方法包括:特征提取網絡提取目標對象的特征信息;行人屬性識別網絡基于該特征信息,確定目標對象的屬性。本發(fā)明可以使行人屬性識別網絡通過與行人再識別網絡、行人姿態(tài)識別網絡共享特征提取網絡的方式而獲取到更為豐富全面的特征信息,從而有效提升了屬性識別的準確性和魯棒性。
技術領域
本發(fā)明涉及圖像識別技術領域,尤其是涉及一種目標對象的屬性識別方法及裝置。
背景技術
行人屬性識別技術能夠識別出圖片中行人的屬性信息;其中,行人的屬性信息可以包括性別、年齡、衣服顏色、是否背包等。行人屬性識別技術通常采用的方法是:用SVM(support vector machine,支撐向量機)或者卷積神經網絡訓練若干二分類分類器來判斷當前的目標是否有某個屬性,或者確定一共需要判斷哪些屬性后,訓練一個多分類分類器來判斷這些屬性。然而,發(fā)明人在研究過程中發(fā)現,利用上述常規(guī)方法進行的行人屬性識別的過程中,容易受諸如人體姿態(tài)變化、人體部分遮擋等不利于屬性識別的因素干擾,魯棒性較差;此外,還存在數據缺乏等問題,都會導致行人屬性識別的準確性較低。
發(fā)明內容
有鑒于此,本發(fā)明的目的在于提供一種目標對象的屬性識別方法及裝置,能夠提升行人屬性識別的準確性和魯棒性。
為了實現上述目的,本發(fā)明實施例采用的技術方案如下:
第一方面,本發(fā)明實施例提供了一種目標對象的屬性識別方法,所述方法采用識別網絡執(zhí)行,所述識別網絡包括特征提取網絡,以及分別與所述特征提取網絡相連的行人再識別網絡、行人姿態(tài)識別網絡和行人屬性識別網絡;所述識別網絡的參數由所述行人再識別網絡、所述行人姿態(tài)識別網絡和所述行人屬性識別網絡基于共享所述特征提取網絡的方式聯(lián)合訓練得到;所述方法包括:所述特征提取網絡提取所述目標對象的特征信息;所述行人屬性識別網絡基于所述特征信息,確定所述目標對象的屬性。
進一步,本發(fā)明實施例提供了第一方面的第二種可能的實施方式,其中,所述方法還包括:基于共享特征提取網絡的方式對所述行人再識別網絡、所述行人姿態(tài)識別網絡和所述行人屬性識別網絡聯(lián)合訓練,直至所述識別網絡的總損失函數值收斂至預設值,將所述總損失函數值收斂至預設值時對應的參數作為識別網絡的參數。
進一步,本發(fā)明實施例提供了第一方面的第三種可能的實施方式,其中,所述基于共享所述特征提取網絡的方式對所述行人再識別網絡、所述行人姿態(tài)識別網絡和所述行人屬性識別網絡聯(lián)合訓練的步驟包括:將訓練圖片輸入至所述特征提取網絡,以使所述特征提取網絡生成所述訓練圖片的特征圖;將所述特征圖輸入至所述行人再識別網絡,計算得到第一損失函數值;將所述特征圖輸入至所述行人姿態(tài)識別網絡,計算得到第二損失函數值;將所述特征圖輸入至所述行人屬性識別網絡,計算得到第三損失函數值;根據所述第一損失函數值、所述第二損失函數值和所述第三損失函數值,確定總損失函數值;基于所述總損失函數值,通過反向傳播算法對所述識別網絡的參數進行訓練。
進一步,本發(fā)明實施例提供了第一方面的第四種可能的實施方式,其中,所述將訓練圖片輸入至所述特征提取網絡的步驟,包括:從含有行人身份標簽的第一數據集挑選三張圖片,從含有行人骨架標簽的第二數據集挑選一張圖片,以及從含有行人屬性標簽的第三數據集挑選一張圖片,將挑選的圖片作為訓練圖片;其中,從所述第一數據集挑選的三張圖片分別為參考圖片、正樣本圖片和負樣本圖片。
進一步,本發(fā)明實施例提供了第一方面的第五種可能的實施方式,其中,所述將所述特征圖輸入至所述行人再識別網絡,計算得到第一損失函數值的步驟,包括:將所述參考圖片、所述正樣本圖片和所述負樣本圖片分別對應的特征圖輸入至所述行人再識別網絡;通過三元組損失函數計算得到第一損失函數值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京曠視科技有限公司;北京邁格威科技有限公司,未經北京曠視科技有限公司;北京邁格威科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710983033.6/2.html,轉載請聲明來源鉆瓜專利網。





