[發明專利]一種基于標簽不確定性和人體組件模型的行人再識別方法有效
| 申請號: | 201910072934.9 | 申請日: | 2019-01-25 |
| 公開(公告)號: | CN109829414B | 公開(公告)日: | 2020-11-24 |
| 發明(設計)人: | 何穎;丁長興;王侃 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 標簽 不確定性 人體 組件 模型 行人 識別 方法 | ||
1.一種基于標簽不確定性和人體組件模型的行人再識別方法,其特征在于,具體步驟包括:
(1)構建基于人體組件的深度神經網絡模型;
(2)對構建的深度神經網絡模型進行初始化,并根據構建的深度神經網絡結構訓練得到另一個深度神經網絡模型;
所述步驟(2)中,訓練后得到的另一個深度神經網絡模型用于提取稠密型向量,提取方法為:各自從一個已訓練好的深度神經網絡模型的P個對應組件的分類層中提取,得到P個稠密型向量;
(3)對初始化后的深度神經網絡模型進行訓練并更新網絡中的參數;
所述步驟(3)包括:
(3-1)采用softmax函數對得到的稠密型向量進行歸一化處理,再與行人圖像原始one-hot標簽進行線性組合后作為待訓練模型圖像的輸入標簽;
(3-2)針對不同的局部組件,設置不同權重;
所述步驟(3-2)中權重設置為:偏重于行人圖像中間局部組件損失的計算,將靠上和靠下的局部組件損失計算的權重逐漸減小;
(3-3)針對每一個樣本設置閾值,對于損失值小于樣本閾值的樣本,忽略其對損失函數的貢獻,即將損失設置為零;
(3-4)采用隨機梯度下降法對局部組件的包含sigmoid函數的交叉熵損失函數的加權和求最優解,從而進行深度神經網絡參數的更新;
(4)采用訓練好的深度神經網絡對目標行人圖像及行人圖像庫中的行人圖像分別進行特征提取;
(5)對提取得到的特征進行余弦相似度計算并排序,得到識別結果。
2.根據權利要求1所述的一種基于標簽不確定性和人體組件模型的行人再識別方法,其特征在于,所述步驟(1)中,以ResNet-50網絡為基礎結構進行修改調整,構建基于人體組件的P個分類任務的深度神經網絡模型。
3.根據權利要求2所述的一種基于標簽不確定性和人體組件模型的行人再識別方法,其特征在于,所述深度神經網絡構建方法為:在ResNet-50網絡中剔除掉輸出維度為1000的全連接層,將layer4中降采樣率stride=2修改為stride=1;在池化層后劃分為P個部分,每個部分均包含N個神經元的全連接層、批量歸一化層和Dropout層,最后接上分類全連接層。
4.根據權利要求1所述的一種基于標簽不確定性和人體組件模型的行人再識別方法,其特征在于,所述步驟(2)中,采用在行人再識別的常用數據集Market-1501中預訓練后的分類模型的參數對構建的深度神經網絡模型進行初始化。
5.根據權利要求1所述的一種基于標簽不確定性和人體組件模型的行人再識別方法,其特征在于,所述步驟(3-1)中的線性組合公式為:
其中,表示得到的稠密型向量,表示行人圖像的原始one-hot標簽,alpha表示超參數。
6.根據權利要求1所述的一種基于標簽不確定性和人體組件模型的行人再識別方法,其特征在于,采用隨機梯度下降法計算時,包含sigmoid函數的交叉熵損失函數的表達式為:
其中,K表示一個批量中輸入行人圖像的個數,i表示輸入行人圖像的編號,yi表示第i張行人圖像的輸入標簽,xi表示通過深度神經網絡分類的概率結果,σ表示sigmoid函數。
7.根據權利要求1所述的一種基于標簽不確定性和人體組件模型的行人再識別方法,其特征在于,所述步驟(4)中特征提取過程為:將目標行人圖像及行人圖像庫中的行人圖像輸入訓練后得到的深度神經網絡中,各自在P個部分中選擇輸出維度為2048的全連接層,分別提取該層的特征向量,并將每部分的特征進行拼接,形成最終的特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910072934.9/1.html,轉載請聲明來源鉆瓜專利網。





