[發(fā)明專利]一種基于多粒度特征表示和域自適應(yīng)學(xué)習(xí)的無監(jiān)督行人重識別方法在審
| 申請?zhí)枺?/td> | 202110258611.6 | 申請日: | 2021-03-09 |
| 公開(公告)號: | CN113052017A | 公開(公告)日: | 2021-06-29 |
| 發(fā)明(設(shè)計)人: | 付利華;杜宇斌;陳人杰;王丹;陳輝 | 申請(專利權(quán))人: | 北京工業(yè)大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京思海天達知識產(chǎn)權(quán)代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 粒度 特征 表示 自適應(yīng) 學(xué)習(xí) 監(jiān)督 行人 識別 方法 | ||
1.一種基于多粒度特征提取和域自適應(yīng)學(xué)習(xí)的無監(jiān)督行人重識別方法,融合不同粒度特征表示,深入挖掘目標域潛在判別信息,包括以下步驟:
步驟1)將行人圖像輸入多粒度特征提取模塊,該模塊把池化后的行人特征劃分為不同粒度大小,不同粒度的特征首尾相連得到具有更豐富判別信息的多粒度特征表示;
步驟2)將源域的行人圖像經(jīng)過多粒度特征提取模塊得到的多粒度特征輸入源域分類模塊進行分類學(xué)習(xí),計算具有行人標簽的源域分類損失,使模型獲得源域行人的判別信息并為域自適應(yīng)學(xué)習(xí)模塊提供源域的行人判別知識;
步驟3)將目標域無標簽的行人圖像經(jīng)過多粒度特征提取模塊得到的多粒度特征輸入域自適應(yīng)模塊,基于從源域中獲得的判別知識,考慮目標域與源域之間的差異對模型進行適應(yīng)性學(xué)習(xí),充分挖掘目標數(shù)據(jù)集中潛在的判別信息;
步驟4)將源域分類損失與域自適應(yīng)損失的加權(quán)和作為總損失訓(xùn)練整個模型;
步驟5)測試階段,目標域的行人圖像經(jīng)過多粒度特征提取模塊,得到不同粒度的行人特征后,將其首尾連接作為最終的多粒度行人特征表示,通過計算查詢圖像與圖像庫中圖像的相似度,返回重識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種基于多粒度特征提取和域自適應(yīng)的無監(jiān)督行人重識別方法,其特征在于所述步驟1)的多粒度特征提取模塊,獲得具有豐富外觀信息的特征表示,具體為:
1.1)首先將源域與目標域的行人圖像分別輸入backbone得到初始行人特征圖,然后將輸出的特征圖分別在水平方向上劃分為兩個和三個大小相等的局部區(qū)域,作為粒度為2和3的局部特征圖,并保留兩個初始特征圖作為不同粒度的全局特征圖;經(jīng)過全局和局部的最大池化操作,得到四個不同大小的特征向量P2_g,P2,P3和P3_g,最后,將P2,P3分別從水平方向上均等劃分為局部特征:P2_0,P2_1和P3_0,P3_1,P3_2;P2_g和P3_g表示行人圖像的全局特征,以彌補局部特征所缺失的全局判別信息;
1.2)經(jīng)過對特征圖進行不同粒度的劃分,共得到P2_g,P2_0,P2_1,P3_g,P3_0,P3_1和P3_2等七個大小為2048×1×1的特征向量;在訓(xùn)練階段,將對應(yīng)源數(shù)據(jù)集行人圖像的特征向量輸入源域分類模塊進行有標簽的分類學(xué)習(xí);對應(yīng)目標數(shù)據(jù)集行人圖像的特征向量則進一步經(jīng)過Reduction操作,將其維度降為:256×1×1,并輸入域自適應(yīng)模塊進行目標域的自適應(yīng)學(xué)習(xí)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京工業(yè)大學(xué),未經(jīng)北京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110258611.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





