[發(fā)明專利]端對端行人檢測及屬性識別的方法、系統(tǒng)、介質及終端有效
| 申請?zhí)枺?/td> | 202010772244.7 | 申請日: | 2020-08-04 |
| 公開(公告)號: | CN112036249B | 公開(公告)日: | 2023-01-03 |
| 發(fā)明(設計)人: | 袁德勝;游浩泉;馬衛(wèi)民;成西鋒;林治強;黨毅飛;崔龍;李偉超;王海濤 | 申請(專利權)人: | 匯納科技股份有限公司 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/774;G06V10/764;G06V10/82;G06N3/04 |
| 代理公司: | 上海光華專利事務所(普通合伙) 31219 | 代理人: | 徐秋平 |
| 地址: | 201203 上海市浦東新區(qū)*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 行人 檢測 屬性 識別 方法 系統(tǒng) 介質 終端 | ||
1.一種端對端行人檢測及屬性識別的方法,其特征在于,包括以下步驟:
獲取第一行人圖像數據集;
搭建行人檢測及屬性識別模型;所述行人檢測及屬性識別模型包括檢測網絡和屬性預測分支;其中,所述檢測網絡用于輸出行人檢測框;所述屬性預測分支用于輸出對應所述行人檢測框的屬性;
利用所述第一行人圖像數據集對所述檢測網絡進行訓練,獲取訓練好的檢測網絡;
獲取第二行人圖像數據集;所述獲取第一行人圖像數據集和所述獲取第二行人圖像數據集相互獨立,且所述第一行人圖像數據集和所述第二行人圖像數據集不受限于為同一數據集;
利用所述第二行人圖像數據集對所述屬性預測分支進行訓練,獲取訓練好的屬性預測分支,以基于訓練好的檢測網絡和訓練好的屬性預測分支實現行人檢測及屬性識別;
還包括:在對所述屬性預測分支進行訓練前,凍結所述檢測網絡;所述利用所述第一行人圖像數據集對所述檢測網絡進行訓練與所述利用所述第二行人圖像數據集對所述屬性預測分支進行訓練相互獨立。
2.根據權利要求1所述的端對端行人檢測及屬性識別的方法,其特征在于,獲取第一行人圖像數據集包括以下步驟:
從互聯網開源獲取目標檢測數據;
從所述目標檢測數據中提取進行了行人標注的行人圖像作為所述第一行人圖像數據集。
3.根據權利要求1所述的端對端行人檢測及屬性識別的方法,其特征在于,所述檢測網絡輸出所述行人檢測框包括以下步驟:
對所述第一行人圖像數據集中的行人圖像進行特征提取,獲取行人特征圖;
基于所述行人特征圖進行目標預測,以獲取所述行人檢測框。
4.根據權利要求1所述的端對端行人檢測及屬性識別的方法,其特征在于,所述第二行人圖像數據集中的行人圖像均預先進行了行人標注,標注內容包括:行人標注框及對應所述行人標注框的至少一屬性。
5.根據權利要求4所述的端對端行人檢測及屬性識別的方法,其特征在于,通過損失函數對所述屬性預測分支進行迭代訓練;所述損失函數的計算方法包括以下步驟:
對于所述行人標注框,計算所述行人標注框與所有所述行人檢測框的重疊交并比值,并將重疊交并比值最大的行人檢測框作為對應所述行人標注框的行人候選框;
計算所述行人候選框的屬性分類損失;損失函數的計算公式為:
其中,Lossattr表示所述屬性分類損失;S2表示所述行人候選框的大小;表示網格單元i的第j個錨點框負責該框的預測,即為所述行人候選框;attr_num為屬性個數;c表示屬性中的其中一類;為一屬性類別對應的二分類交叉熵;表示網格單元i的第j個錨點框預測樣本是正例的概率;表示樣本標簽。
6.根據權利要求1所述的端對端行人檢測及屬性識別的方法,其特征在于,所述屬性包括性別和/或遮擋程度。
7.一種端對端行人檢測及屬性識別的系統(tǒng),其特征在于,包括:第一獲取模塊、模型搭建模塊、第一訓練模塊、第二獲取模塊及第二訓練模塊;
所述第一獲取模塊用于獲取第一行人圖像數據集;
所述模型搭建模塊用于搭建行人檢測及屬性識別模型;所述行人檢測及屬性識別模型包括檢測網絡和屬性預測分支;其中,所述檢測網絡用于輸出行人檢測框;所述屬性預測分支用于輸出對應所述行人檢測框的屬性;
所述第一訓練模塊用于利用所述第一行人圖像數據集對所述檢測網絡進行訓練,獲取訓練好的檢測網絡;
所述第二獲取模塊用于獲取第二行人圖像數據集;所述獲取第一行人圖像數據集和所述獲取第二行人圖像數據集相互獨立,且所述第一行人圖像數據集和所述第二行人圖像數據集不受限于為同一數據集;
所述第二訓練模塊用于利用所述第二行人圖像數據集對所述屬性預測分支進行訓練,獲取訓練好的屬性預測分支,以基于訓練好的檢測網絡和訓練好的屬性預測分支實現行人檢測及屬性識別;還包括:在對所述屬性預測分支進行訓練前,凍結所述檢測網絡;所述利用所述第一行人圖像數據集對所述檢測網絡進行訓練與所述利用所述第二行人圖像數據集對所述屬性預測分支進行訓練相互獨立。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于匯納科技股份有限公司,未經匯納科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010772244.7/1.html,轉載請聲明來源鉆瓜專利網。





