[發明專利]一種行人重識別方法有效
| 申請號: | 201910403777.5 | 申請日: | 2019-05-15 |
| 公開(公告)號: | CN110110689B | 公開(公告)日: | 2023-05-26 |
| 發明(設計)人: | 張云洲;劉雙偉;齊林;朱尚棟;徐文娟 | 申請(專利權)人: | 東北大學 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/08 |
| 代理公司: | 北京易捷勝知識產權代理有限公司 11613 | 代理人: | 韓國勝 |
| 地址: | 110169 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 行人 識別 方法 | ||
1.一種行人重識別方法,其特征在于,其包括:
從多個圖片中提取得到行人CNN特征圖,包括:
從訓練數據集中隨機選擇所述多個圖片;
將所述多個圖片輸入到ResNet50模型的多個不同語義層進行提取,得到多個通道的特征圖;
利用通道注意力模塊對所述多個通道的特征圖進行處理,得到經通道處理的特征圖;
利用空間注意力模塊對所述經通道處理的特征圖在不同位置的空間上下文信息進行處理,得到所述行人CNN特征圖;采用對抗擦除學習的方式模仿對所述行人CNN特征圖的判別性區域被遮擋的情形進行模型訓練,得到訓練模型,包括:
將所述行人CNN特征圖分別輸入到主分類器和輔分類器進行分類訓練,從所述主分類器和所述輔分類器輸出行人類別專屬的特征圖;
所述輔分類器為resnet50的基礎上增加的輔助分類器;
所述主分類器與所述輔分類器包含相同數量的卷積層和全局平均池化層,且所述卷積層的通道的數目與所述訓練數據集中行人類別的數目相同,所述行人類別專屬的特征圖的每一通道代表行人圖像屬于不同類別時的身體響應熱度圖;在所述輔分類器進行部分擦除,得到擦除后特征圖;
所述在所述輔分類器進行部分擦除包括:
將所述身體響應熱度圖中熱度圖數值高于設定的對抗擦除閾值的區域確定為判別性區域;
對所述輔分類器輸出的所述行人類別專屬的特征圖中對應所述判別性區域的部分通過響應值被取代為0的對抗方式被擦除掉;
對所述主分類器輸出的所述行人類別專屬的特征圖與所述輔分類器輸出的所述擦除后特征圖,分別通過損失函數進行計算,得到損失值;
根據所述損失值對所述訓練模型進行參數更新;
利用所述訓練模型結合目標行人圖像和待識別行人圖像進行行人重識別,得到行人重識別結果。
2.如權利要求1所述的行人重識別方法,其特征在于,所述利用通道注意力模塊對所述多個通道的特征圖進行處理,得到經通道處理的特征圖包括:
根據所述多個通道的特征圖中的每一通道的特征圖,得到通道特征描述子;
對所述通道特征描述子通過激活函數運算,得到通道注意力特征圖;
將所述通道注意力特征圖與所述特征圖聚合的特征圖相乘,得到所述經通道處理的特征圖。
3.如權利要求2所述的行人重識別方法,其特征在于,所述特征描述子包括所述多個通道的統計值,所述特征描述子為:
每一通道的統計值為:
其中N為通道的數量,n為通道的編號,A和B分別為所述特征圖的長和寬;
所述通道注意力特征圖為:
e=σ(W2δ(W1(s)))
其中σ,δ分別代表Sigmod激活函數和ReLU激活函數,是第一全連接層Fc1的權重,是第二全連接層Fc2的權重,r是衰減的倍數。
4.如權利要求1所述的行人重識別方法,其特征在于,所述利用空間注意力模塊對所述經通道處理的特征圖在不同位置的空間上下文信息進行處理,得到所述行人CNN特征圖包括:
對所述經通道處理的特征圖進行1×1的卷積運算,得到第一空間信息特征圖T和第二空間信息特征圖U;
將所述第一空間信息特征圖T的轉置與所述第二空間信息特征圖U進行矩陣乘法運算,得到空間注意力特征圖;
對所述經通道處理的特征圖進行1×1的卷積運算,得到第三空間信息特征圖V;
將所述第三空間信息特征圖V與所述空間注意力特征圖的轉置進行矩陣乘法運算,得到經空間處理的特征圖;
根據所述通道處理和所述空間處理得到所述行人CNN特征圖。
5.如權利要求2所述的行人重識別方法,其特征在于,所述利用所述訓練模型結合目標行人圖像和待識別行人圖像進行行人重識別,得到行人重識別結果包括:
根據所述目標行人圖像和所述待識別行人圖像輸入到所述訓練模型中進行訓練,分別得到對應的深度特征;
根據所述目標行人圖像的深度特征與所述待識別行人圖像的深度特征計算余弦距離;
根據余弦距離的大小確定所述目標行人圖像和所述待識別行人圖像之間的相似度,其中相似度最大的待識別行人圖像為所述行人重識別結果。
6.如權利要求5所述的行人重識別方法,其特征在于,根據所述目標行人圖像的深度特征與所述待識別行人圖像的深度特征計算余弦距離的計算公式為:
其中feat1為所述目標行人圖像的深度特征,feat2為所述待識別行人圖像的深度特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910403777.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種信息分析方法及系統
- 下一篇:一種目標行人追蹤方法、裝置、設備及存儲介質





