[發明專利]模型訓練方法、行人再識別方法、裝置和電子設備有效
| 申請號: | 202110372249.5 | 申請日: | 2021-04-07 |
| 公開(公告)號: | CN112861825B | 公開(公告)日: | 2023-07-04 |
| 發明(設計)人: | 王之港;王健;孫昊;丁二銳 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/80;G06V10/74;G06V10/774 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 單冠飛 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 行人 識別 裝置 電子設備 | ||
本公開提供了模型訓練方法、行人再識別方法、裝置和電子設備,涉及人工智能領域,具體為計算機視覺和深度學習技術,可用于智慧城市場景下。具體實現方案為:利用第一編碼器對樣本數據集中的第一行人圖像和第二行人圖像進行特征提取,得到第一行人圖像的圖像特征和第二行人圖像的圖像特征;對第一行人圖像的圖像特征和第二行人圖像的圖像特征進行融合,得到融合特征;利用第一解碼器對融合特征進行特征解碼,得到第三行人圖像;將第三行人圖像確定為第一行人圖像的負樣本圖像,并利用第一行人圖像及負樣本圖像將第一預設模型訓練至收斂,得到行人再識別模型。利用本公開實施例可以提升模型區分外表相似但身份不同的行人的效果。
技術領域
本公開涉及人工智能領域,具體為計算機視覺和深度學習技術,可用于智慧城市場景下。
背景技術
行人再識別也被稱為行人重識別,是利用計算機視覺技術判斷圖像或者視頻序列中是否存在特定行人的技術。通常,可以利用大量樣本圖像對行人再識別模型進行有監督訓練或無監督訓練,利用訓練至收斂的模型完成行人再識別任務。收斂的模型的性能依賴于樣本圖像的質量和難易程度。一般來說,模型能夠對外表明顯不同的行人進行區分,但難以區分外表相似但身份不同的行人。
發明內容
本公開提供了一種模型訓練方法、行人再識別方法、裝置和電子設備。
根據本公開的一方面,提供了一種模型訓練方法,包括:
利用第一編碼器對樣本數據集中的第一行人圖像和第二行人圖像進行特征提取,得到第一行人圖像的圖像特征和第二行人圖像的圖像特征;
對第一行人圖像的圖像特征和第二行人圖像的圖像特征進行融合,得到融合特征;
利用第一解碼器對融合特征進行特征解碼,得到第三行人圖像;
將第三行人圖像確定為第一行人圖像的負樣本圖像,并利用第一行人圖像及負樣本圖像將第一預設模型訓練至收斂,得到行人再識別模型。
根據本公開的另一方面,提供了一種行人再識別方法,包括:
利用行人再識別模型對目標圖像以及候選行人圖像分別進行特征提取,得到目標圖像的行人特征以及候選行人圖像的行人特征;其中,行人再識別模型是根據本公開任意實施例提供的模型訓練方法得到的;
基于目標圖像的行人特征以及候選行人圖像的行人特征,確定目標圖像與候選行人圖像之間的相似度;
在相似度符合預設條件的情況下,將候選行人圖像確定為目標圖像的相關圖像。
根據本公開的另一方面,提供了一種模型訓練裝置,包括:
第一編碼模塊,用于利用第一編碼器對樣本數據集中的第一行人圖像和第二行人圖像進行特征提取,得到第一行人圖像的圖像特征和第二行人圖像的圖像特征;
融合模塊,用于對第一行人圖像的圖像特征和第二行人圖像的圖像特征進行融合,得到融合特征;
第一解碼模塊,用于利用第一解碼器對融合特征進行特征解碼,得到第三行人圖像;
第一訓練模塊,用于將第三行人圖像確定為第一行人圖像的負樣本圖像,并利用第一行人圖像及所述負樣本圖像將第一預設模型訓練至收斂,得到行人再識別模型。
根據本公開的另一方面,提供了一種行人再識別裝置,包括:
第二提取模塊,用于利用行人再識別模型對目標圖像以及候選行人圖像分別進行特征提取,得到目標圖像的行人特征以及候選行人圖像的行人特征;其中,行人再識別模型是根據本公開任意實施例提供的模型訓練方法得到的;
第三相似度模塊,用于基于目標圖像的行人特征以及候選行人圖像的行人特征,確定目標圖像與候選行人圖像之間的相似度;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110372249.5/2.html,轉載請聲明來源鉆瓜專利網。





