[發(fā)明專利]基于權(quán)重多樣性正則化的行人重識別方法及其應(yīng)用有效
| 申請?zhí)枺?/td> | 202010790733.5 | 申請日: | 2020-08-07 |
| 公開(公告)號: | CN111931641B | 公開(公告)日: | 2023-08-22 |
| 發(fā)明(設(shè)計)人: | 鄧圣衡;王鵬飛;丁長興;李弘洋;黃家榮;陳柏伶;郭思聰 | 申請(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/44;G06V10/82;G06N3/0464;G06N3/08;G06V20/52 |
| 代理公司: | 廣州市華學(xué)知識產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 權(quán)重 多樣性 正則 行人 識別 方法 及其 應(yīng)用 | ||
1.一種基于權(quán)重多樣性正則化的行人重識別方法,其特征在于,包括下述步驟:
構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),包括Resnet50網(wǎng)絡(luò)、卷積層以及全連接神經(jīng)網(wǎng)絡(luò),并初始化卷積神經(jīng)網(wǎng)絡(luò)參數(shù);
圖像預(yù)處理,得到卷積神經(jīng)網(wǎng)絡(luò)的輸入張量;
采用交叉熵?fù)p失函數(shù)和三元組損失函數(shù)的同時采用權(quán)重多樣性損失函數(shù)控制卷積神經(jīng)網(wǎng)絡(luò)中卷積層的權(quán)重互不相同,完成權(quán)重多樣性正則化;
三元組損失函數(shù)表示為:
交叉熵?fù)p失函數(shù)表示為:
權(quán)重多樣性損失函數(shù)表示為:
其中,d表示兩者之間的距離,P(yi)表示圖像樣本的真實分布,表示卷積神經(jīng)網(wǎng)絡(luò)輸出樣本的預(yù)測分布,n表示卷積層個數(shù),wi表示每一個卷積層的權(quán)重,xi表示第i類圖像特征,xj表示第j類圖像特征,xa表示第a類圖像特征;
卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練,提取圖像中行人不同的局部特征,對每一個行人的局部特征級聯(lián)成為卷積神經(jīng)網(wǎng)絡(luò)輸出的特征向量,將提取到的所有行人特征向量進(jìn)行距離度量,完成行人重識別;
所述卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的具體步驟包括:
卷積神經(jīng)網(wǎng)絡(luò)的卷積層輸出行人圖像局部特征向量,將行人圖像局部特征向量級聯(lián)得到輸出的特征向量,將所有行人的輸出特征向量計算三元組損失值,加和取平均值得到第一損失值L1;
卷積神經(jīng)網(wǎng)絡(luò)的全連接神經(jīng)網(wǎng)絡(luò)輸出ID預(yù)測值,對多個ID預(yù)測值分別計算交叉熵?fù)p失值,加和取平均得到第二損失值L2;
卷積層輸出各自的權(quán)重信息,對多個權(quán)重信息計算權(quán)重多樣性損失值,加和取平均得到第三損失值L3;
計算總損失值L:L=L1+L2+L3;
采用adam優(yōu)化器進(jìn)行優(yōu)化,采用梯度下降的方式對損失值求導(dǎo),更新網(wǎng)絡(luò)參數(shù)。
2.根據(jù)權(quán)利要求1所述的基于權(quán)重多樣性正則化的行人重識別方法,其特征在于,所述卷積神經(jīng)網(wǎng)絡(luò)包括:Resnet50網(wǎng)絡(luò)、6個卷積層以及6個全連接神經(jīng)網(wǎng)絡(luò),將Resnet50網(wǎng)絡(luò)移除下采樣。
3.根據(jù)權(quán)利要求1所述的基于權(quán)重多樣性正則化的行人重識別方法,其特征在于,所述圖像預(yù)處理具體步驟包括:
將圖像隨機(jī)裁剪并進(jìn)行設(shè)定概率的水平翻轉(zhuǎn),將隨機(jī)翻轉(zhuǎn)后的圖像進(jìn)行歸一化處理得到三維張量,隨機(jī)將三維張量中的部分區(qū)域設(shè)置為圖像均值,然后進(jìn)行隨機(jī)色彩抖動處理,得到卷積神經(jīng)網(wǎng)絡(luò)的輸入張量。
4.根據(jù)權(quán)利要求1所述的基于權(quán)重多樣性正則化的行人重識別方法,其特征在于,所述將提取到的所有行人特征向量進(jìn)行距離度量,具體步驟包括:
將行人特征向量與公開數(shù)據(jù)集中的行人特征向量進(jìn)行余弦距離計算,對計算得到的余弦距離進(jìn)行排序,余弦距離最近的特征向量所對應(yīng)的行人圖像ID即為匹配結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010790733.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 權(quán)重調(diào)整模塊與權(quán)重調(diào)整方法
- 網(wǎng)頁主題的分類方法及裝置
- 接收裝置
- 基于權(quán)重濾波的視頻去噪裝置及方法
- 權(quán)重數(shù)據(jù)存儲方法和基于該方法的神經(jīng)網(wǎng)絡(luò)處理器
- 危害因素的權(quán)重因子的確定方法、裝置及存儲介質(zhì)
- 用于優(yōu)化神經(jīng)網(wǎng)絡(luò)的方法
- 處理器
- 用于對深度神經(jīng)網(wǎng)絡(luò)的權(quán)重進(jìn)行轉(zhuǎn)換的方法和系統(tǒng)
- 神經(jīng)網(wǎng)絡(luò)的量化方法、裝置、服務(wù)器和存儲介質(zhì)





