[發(fā)明專利]一種基于自激勵判別性特征學(xué)習(xí)的行人重識別方法有效
| 申請?zhí)枺?/td> | 201910348620.7 | 申請日: | 2019-04-28 |
| 公開(公告)號: | CN110163117B | 公開(公告)日: | 2021-03-05 |
| 發(fā)明(設(shè)計)人: | 魏振勇;魏龍;蔡登;金仲明;余正旭;黃建強;華先勝;何曉飛 | 申請(專利權(quán))人: | 浙江大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 杭州天勤知識產(chǎn)權(quán)代理有限公司 33224 | 代理人: | 胡紅娟 |
| 地址: | 310013 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 激勵 判別 特征 學(xué)習(xí) 行人 識別 方法 | ||
本發(fā)明公開了一種基于自激勵判別性特征學(xué)習(xí)的行人重識別方法,包括:(1)選取一個行人重識別網(wǎng)絡(luò),在該原始網(wǎng)絡(luò)上添加一個負分支;(2)在訓(xùn)練階段,原始網(wǎng)絡(luò)產(chǎn)生分類損失函數(shù),原始網(wǎng)絡(luò)和負分支之間產(chǎn)生對抗損失函數(shù)和互斥響應(yīng)項,一起構(gòu)成目標(biāo)函數(shù),并利用隨機梯度下降方法對整個網(wǎng)絡(luò)進行優(yōu)化;(3)在測試階段,移除負分支,只保留原始網(wǎng)絡(luò)在分類器之前的部分,作為訓(xùn)練好的網(wǎng)絡(luò)模型,并輸入行人圖片進行抽取特征向量測試;(4)在行人檢索階段,利用訓(xùn)練好的網(wǎng)絡(luò)模型抽取圖片庫中每張圖片的特征向量,選擇與待查詢行人圖片的特征向量相似度最高的圖片的身份作為最終識別結(jié)果。利用本發(fā)明,可以提升現(xiàn)有行人重識別網(wǎng)絡(luò)的效果。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機視覺和模式分類領(lǐng)域,具體涉及一種基于自激勵判別性特征學(xué)習(xí)的行人重識別方法。
背景技術(shù)
近年來,隨著公眾場合大量監(jiān)控攝像頭的出現(xiàn),行人重識別技術(shù)受到越來越多的關(guān)注。行人重識別技術(shù)的目標(biāo)是進行跨攝像頭行人查找,即給定某個攝像頭拍攝到的一張行人圖片,從其他攝像頭中查找和這張圖片屬于同一身份的圖片。行人重識別在遺失人員查找、嫌犯追蹤等方面有著廣泛應(yīng)用。近年來,行人重識別技術(shù)發(fā)展迅速,但是距離應(yīng)用到實際場景仍有不小的距離,難度由諸多方面引起:不同攝像頭下光照變化、人的姿態(tài)變化、相互遮擋以及雜亂背景干擾等。
行人重識別技術(shù)分為兩個階段:第一個階段是抽取判別性行人特征,第二個階段是利用抽取到的特征向量在圖片庫里進行最近鄰檢索,其中行人特征的抽取質(zhì)量對行人重識別的準(zhǔn)確度有著決定性影響。近年來,深度學(xué)習(xí)技術(shù)的快速發(fā)展為行人重識別技術(shù)帶來了巨大的機遇。目前主流的圖片分類網(wǎng)絡(luò)已經(jīng)可以在行人重識別任務(wù)上取得不錯的結(jié)果,例如Kaiming He等人在2016年CVPR會議上發(fā)表的論文《Deep Residual Learning forImage Recognition》中提出的ResNet,以及Gao Huang等人在2017年CVPR會議上發(fā)表的論文《Densely Connected Convolutional Networks》中提出的DenseNet等。借助于這些基礎(chǔ)網(wǎng)絡(luò),很多行人特征抽取網(wǎng)絡(luò)涌現(xiàn)出來。
在本發(fā)明之前,絕大多數(shù)行人重識別技術(shù)需要重新設(shè)計新的網(wǎng)絡(luò)結(jié)構(gòu),不同的網(wǎng)絡(luò)側(cè)重于抽取不同方面或者部位的行人特征。總體而言,這些技術(shù)可以歸為兩大類:第一類是強化對判別性信息提取有正面作用的區(qū)域或者特征,第二類是弱化對判別性特征提取產(chǎn)生干擾作用的信息影響。第一類方法包括基于人體部位特征提取的網(wǎng)絡(luò)、基于多尺度特征融合的網(wǎng)絡(luò)等。在這類方法當(dāng)中,Wang Guanshu等人在2018年ACM Multimedia會議上發(fā)表的《Learning discriminative features with multiple granularities for personre-identification》論文中提出了MGN網(wǎng)絡(luò),它既是基于人體部位,又是多尺度特征融合的網(wǎng)絡(luò),目前是行人重識別領(lǐng)域的領(lǐng)先技術(shù)。第二類方法側(cè)重于消除行人圖片中負面信息對特征抽取的影響,例如消除背景區(qū)域的噪聲、降低行人姿態(tài)變化的影響等。這兩類方法都需要對已有網(wǎng)絡(luò)在結(jié)構(gòu)上進行改進,以達到相應(yīng)的特征學(xué)習(xí)效果。
除了設(shè)計新的網(wǎng)絡(luò)結(jié)構(gòu),另外一個提升行人重識別技術(shù)的途徑是提升已有網(wǎng)絡(luò)結(jié)構(gòu)的識別準(zhǔn)確度,即在保持現(xiàn)有的行人特征提取網(wǎng)絡(luò)結(jié)構(gòu)不變的條件下,通過更好的訓(xùn)練和優(yōu)化技術(shù),將它們的性能提升到一個更好的水平。在本發(fā)明之前,已有的網(wǎng)絡(luò)結(jié)構(gòu)通常采用SGD或者Adam等通用的梯度下降方式進行優(yōu)化,幾乎不存在針對行人重識別網(wǎng)絡(luò)的專門優(yōu)化技術(shù)。這使得現(xiàn)有行人特征學(xué)習(xí)網(wǎng)絡(luò)的潛力沒有得到充分挖掘,它們可能達到的最佳性能也是未知的。因此,本發(fā)明的技術(shù)從這一角度考慮,來提升現(xiàn)有行人重識別網(wǎng)絡(luò)的效果。
發(fā)明內(nèi)容
本發(fā)明提供了一種基于自激勵判別性特征學(xué)習(xí)的行人重識別方法,很好地解決了現(xiàn)有行人特征學(xué)習(xí)網(wǎng)絡(luò)優(yōu)化不充分的問題,在已有的模型結(jié)構(gòu)基礎(chǔ)上取得了比傳統(tǒng)網(wǎng)絡(luò)優(yōu)化方法更好的效果。
一種基于自激勵判別性特征學(xué)習(xí)的行人重識別方法,包括以下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910348620.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





