[發(fā)明專利]模型訓(xùn)練方法、行人再識別方法、裝置和電子設(shè)備有效
| 申請?zhí)枺?/td> | 202110372249.5 | 申請日: | 2021-04-07 |
| 公開(公告)號: | CN112861825B | 公開(公告)日: | 2023-07-04 |
| 發(fā)明(設(shè)計(jì))人: | 王之港;王健;孫昊;丁二銳 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/80;G06V10/74;G06V10/774 |
| 代理公司: | 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 單冠飛 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 模型 訓(xùn)練 方法 行人 識別 裝置 電子設(shè)備 | ||
1.一種模型訓(xùn)練方法,包括:
利用第一編碼器對樣本數(shù)據(jù)集中的第一行人圖像和第二行人圖像進(jìn)行特征提取,得到所述第一行人圖像的圖像特征和所述第二行人圖像的圖像特征;
對所述第一行人圖像的圖像特征和所述第二行人圖像的圖像特征進(jìn)行融合,得到融合特征;
利用第一解碼器對所述融合特征進(jìn)行特征解碼,得到第三行人圖像;
將所述第三行人圖像確定為所述第一行人圖像的負(fù)樣本圖像,并利用所述第一行人圖像及所述負(fù)樣本圖像將第一預(yù)設(shè)模型訓(xùn)練至收斂,得到行人再識別模型;
基于所述第一行人圖像與所述負(fù)樣本圖像,確定第一相似度;
基于所述樣本數(shù)據(jù)集中除所述第一行人圖像以外的至少一個(gè)行人圖像,確定所述第一行人圖像與所述至少一個(gè)行人圖像分別對應(yīng)的至少一個(gè)第二相似度;
基于所述第一相似度、所述至少一個(gè)第二相似度以及對抗損失函數(shù),更新所述第一編碼器以及所述第一解碼器;
所述對抗損失函數(shù)用于約束所述第一相似度大于所述至少一個(gè)第二相似度中的任一個(gè)。
2.根據(jù)權(quán)利要求1所述的方法,其中,獲取所述第一編碼器和所述第一解碼器的方式包括:
利用第二編碼器對所述樣本數(shù)據(jù)集中的第i個(gè)行人圖像進(jìn)行特征提取,得到所述第i個(gè)行人圖像的圖像特征;其中,i為大于等于1的正整數(shù);
利用第二解碼器對所述第i個(gè)行人圖像的圖像特征進(jìn)行特征解碼,得到生成圖像;
基于所述第i個(gè)行人圖像與所述生成圖像之間的相似度以及重構(gòu)損失函數(shù),更新所述第二編碼器和所述第二解碼器;
在所述第二編碼器和所述第二解碼器符合收斂條件的情況下,將所述第二編碼器確定為所述第一編碼器并將所述第二解碼器確定為所述第一解碼器。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述基于所述第i個(gè)行人圖像與所述生成圖像之間的相似度以及重構(gòu)損失函數(shù),更新所述第二編碼器和所述第二解碼器,包括:
基于所述第i個(gè)行人圖像和所述生成圖像之間的相似度以及所述重構(gòu)損失函數(shù),計(jì)算所述重構(gòu)損失函數(shù)的函數(shù)值;
利用真實(shí)度判別器確定所述生成圖像的真實(shí)度;
根據(jù)所述重構(gòu)損失函數(shù)的函數(shù)值以及所述生成圖像的真實(shí)度,更新所述第二編碼器和所述第二解碼器。
4.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的方法,其中,獲取所述第一預(yù)設(shè)模型的方式包括:
利用第二預(yù)設(shè)模型對樣本數(shù)據(jù)集中的每個(gè)行人圖像進(jìn)行特征提取,得到所述每個(gè)行人圖像的行人特征;
基于所述行人特征對所述樣本數(shù)據(jù)集中的各個(gè)行人圖像進(jìn)行聚類,得到與至少兩個(gè)類簇標(biāo)簽分別對應(yīng)的至少兩個(gè)類簇;其中,所述至少兩個(gè)類簇中的每個(gè)類簇均包括至少一個(gè)行人圖像;
基于所述樣本數(shù)據(jù)集中的每個(gè)行人圖像以及所述每個(gè)行人圖像所對應(yīng)的類簇標(biāo)簽,將所述第二預(yù)設(shè)模型訓(xùn)練至收斂,得到所述第一預(yù)設(shè)模型。
5.根據(jù)權(quán)利要求4所述的方法,其中,所述第一行人圖像與所述第二行人圖像為所述至少兩個(gè)類簇中的不同類簇中的行人圖像。
6.一種行人再識別方法,包括:
利用行人再識別模型對目標(biāo)圖像以及候選行人圖像分別進(jìn)行特征提取,得到所述目標(biāo)圖像的行人特征以及所述候選行人圖像的行人特征;其中,所述行人再識別模型是根據(jù)權(quán)利要求1-5中任一項(xiàng)所述的模型訓(xùn)練方法得到的;
基于所述目標(biāo)圖像的行人特征以及所述候選行人圖像的行人特征,確定所述目標(biāo)圖像與所述候選行人圖像之間的相似度;
在所述相似度符合預(yù)設(shè)條件的情況下,將所述候選行人圖像確定為所述目標(biāo)圖像的相關(guān)圖像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110372249.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





