[發(fā)明專利]基于權重多樣性正則化的行人重識別方法及其應用有效
| 申請?zhí)枺?/td> | 202010790733.5 | 申請日: | 2020-08-07 |
| 公開(公告)號: | CN111931641B | 公開(公告)日: | 2023-08-22 |
| 發(fā)明(設計)人: | 鄧圣衡;王鵬飛;丁長興;李弘洋;黃家榮;陳柏伶;郭思聰 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/44;G06V10/82;G06N3/0464;G06N3/08;G06V20/52 |
| 代理公司: | 廣州市華學知識產(chǎn)權代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 權重 多樣性 正則 行人 識別 方法 及其 應用 | ||
本發(fā)明公開了一種基于權重多樣性正則化的行人重識別方法及其應用,該方法步驟包括:構建卷積神經(jīng)網(wǎng)絡并初始化卷積神經(jīng)網(wǎng)絡參數(shù);圖像預處理得到卷積神經(jīng)網(wǎng)絡的輸入張量;采用交叉熵損失函數(shù)和三元組損失函數(shù)的同時采用權重多樣性損失函數(shù)控制卷積神經(jīng)網(wǎng)絡中卷積層的權重互不相同,完成權重多樣性正則化;卷積神經(jīng)網(wǎng)絡訓練,提取圖像中行人不同的局部特征,對每一個行人的局部特征級聯(lián)成為卷積神經(jīng)網(wǎng)絡輸出的特征向量,將提取到的所有行人特征向量進行距離度量,完成行人重識別。本發(fā)明提取得到的局部特征更加細致且具有更加豐富的特征數(shù)量,具有區(qū)分性更大的行人圖像語義信息,實現(xiàn)了權重多樣性正則化效果,提高了行人重識別任務的準確率。
技術領域
本發(fā)明涉及計算機視覺技術領域,具體涉及一種基于權重多樣性正則化的行人重識別方法及其應用。
背景技術
隨著大數(shù)據(jù)時代的到來,算力資源得到不斷提升,基于深度神經(jīng)網(wǎng)絡的計算機視覺技術的飛速發(fā)展與進步,行人視頻監(jiān)控因其可以提高公共安全水平和保障人民的人身財產(chǎn)安全,顯得尤為重要。由于傳統(tǒng)行人視頻監(jiān)控需要用到大量人力資源且效率低下,基于計算機視覺技術的行人重識別技術成為了非常有挑戰(zhàn)性和研究價值的研究領域。與傳統(tǒng)基于手工設計特征的行人重識別技術不同,基于深度神經(jīng)網(wǎng)絡的行人重識別技術基于梯度下降原理對網(wǎng)絡參數(shù)進行優(yōu)化,可以比傳統(tǒng)方法提取出泛化能力更強的行人圖像特征,大幅增加了行人重識別的準確率。
現(xiàn)有的行人重識別方法通常基于深度學習,利用了卷積神經(jīng)網(wǎng)絡提取輸入網(wǎng)絡的行人圖像特征,使用交叉熵損失函數(shù)和三元組損失函數(shù)訓練網(wǎng)絡,將訓練好的網(wǎng)絡用于提取圖像特征,將提取的特征進行距離度量,即特征之間的匹配,從而達到行人重識別的目的。但使用這些方法訓練的網(wǎng)絡并不能十分有效地提取行人圖像特征,網(wǎng)絡依然將注意力集中在整體的全局特征上而未考慮局部特征,而局部特征與全局特征相比,不僅具有區(qū)分性更大的行人圖像語義信息,且局部特征更能滿足細粒度程度大的行人重識別任務對網(wǎng)絡提取的特征要求,故網(wǎng)絡提取的全局特征魯棒性不如局部特征,在進行行人之間特征匹配時性能較差。
發(fā)明內容
為了克服現(xiàn)有技術存在的缺陷與不足,針對現(xiàn)有基于深度學習的行人重識別方法無法很好利用行人局部特征,容易出現(xiàn)過擬合現(xiàn)象的缺陷,本發(fā)明提出一種基于權重多樣性正則化的行人重識別方法,采用權重多樣性正則化方法實現(xiàn)網(wǎng)絡權重多樣性,使得網(wǎng)絡深層中存在若干權重多樣的卷積層,迫使網(wǎng)絡提取不同的局部人體特征,對網(wǎng)絡起到正則化的效果,避免過擬合現(xiàn)象的發(fā)生,從而達到提高行人重識別準確率的效果。
本發(fā)明的第二目的在提供一種基于權重多樣性正則化的行人重識別系統(tǒng)。
本發(fā)明的第三目的在于提供一種存儲介質。
本發(fā)明的第四目的在于提供一種計算設備。
為了達到上述目的,本發(fā)明采用以下技術方案:
本發(fā)明提供一種基于權重多樣性正則化的行人重識別方法,包括下述步驟:
構建卷積神經(jīng)網(wǎng)絡,包括Resnet50網(wǎng)絡、卷積層以及全連接神經(jīng)網(wǎng)絡,并初始化卷積神經(jīng)網(wǎng)絡參數(shù);
圖像預處理,得到卷積神經(jīng)網(wǎng)絡的輸入張量;
采用交叉熵損失函數(shù)和三元組損失函數(shù)的同時采用權重多樣性損失函數(shù)控制卷積神經(jīng)網(wǎng)絡中卷積層的權重互不相同,完成權重多樣性正則化;
卷積神經(jīng)網(wǎng)絡訓練,提取圖像中行人不同的局部特征,對每一個行人的局部特征級聯(lián)成為卷積神經(jīng)網(wǎng)絡輸出的特征向量,將提取到的所有行人特征向量進行距離度量,完成行人重識別。
作為優(yōu)選的技術方案,所述卷積神經(jīng)網(wǎng)絡包括:Resnet50網(wǎng)絡、6個卷積層以及6個全連接神經(jīng)網(wǎng)絡,將Resnet50網(wǎng)絡移除下采樣。
作為優(yōu)選的技術方案,所述圖像預處理具體步驟包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經(jīng)華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010790733.5/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





