[發(fā)明專利]一種保留平移不變性的行人重識別方法、裝置及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010605632.6 | 申請日: | 2020-06-29 |
| 公開(公告)號: | CN111783624B | 公開(公告)日: | 2023-03-24 |
| 發(fā)明(設(shè)計)人: | 林修明;吳鴻偉;林淑強(qiáng);張永光;藍(lán)坤宏;魏煒途 | 申請(專利權(quán))人: | 廈門市美亞柏科信息股份有限公司 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 廈門福貝知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 35235 | 代理人: | 陳遠(yuǎn)洋 |
| 地址: | 361000 福建省廈門市思明*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 保留 平移 不變性 行人 識別 方法 裝置 存儲 介質(zhì) | ||
本發(fā)明提出了一種保留平移不變性的行人重識別方法、裝置及存儲介質(zhì),該方法包括:訓(xùn)練步驟,使用樣本集對卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練獲得訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)模型,其中,所述神經(jīng)網(wǎng)絡(luò)的模型的下采樣層由步長為1的最大池化層、步長為2的平均池化層依次連接組成,或者由步長為1的卷積層、ReLU激活函數(shù)層和步長為2的平均池化層依次連接組成;行人重識別步驟,使用訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)模型對攝像頭獲取的圖像進(jìn)行行人重識別獲得識別結(jié)果。本發(fā)明對卷積神經(jīng)網(wǎng)絡(luò)的下采樣層的結(jié)構(gòu)進(jìn)行了修改,僅使用平均池化層進(jìn)行下采樣操作,不會破壞整個網(wǎng)絡(luò)的平移不變性,提高了行人重識別的準(zhǔn)確性,且針對修改后的網(wǎng)絡(luò)結(jié)構(gòu)提出了樣本集及損失函數(shù)的具體修改方法。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,具體涉及一種保留平移不變性的行人重識別方法、裝置及存儲介質(zhì)。
背景技術(shù)
隨著社會和科技的進(jìn)步,人臉識別越來越成為一項可依賴的安防技術(shù)。但是對于現(xiàn)今大部分?jǐn)z像頭而言,其分辨率往往不能達(dá)到人臉識別系統(tǒng)的要求,故可以應(yīng)用于現(xiàn)有監(jiān)控系統(tǒng)的行人重識別技術(shù)是極有必要的。行人重識別(Person re-identification)是利用圖像處理技術(shù)來判定某一攝像頭下的行人是否出現(xiàn)在其他攝像頭中,從而可以描繪行人的活動路徑,實現(xiàn)跨鏡頭追蹤的目的。現(xiàn)階段行人重識別常用方法主要有表征學(xué)習(xí)、度量學(xué)習(xí)、基于局部特征或視頻序列等方法。
CNN(卷積神經(jīng)網(wǎng)絡(luò))架構(gòu)由于采用多種下采樣策略(最大池化、步長卷積等)導(dǎo)致網(wǎng)絡(luò)最后提取到的圖像特征丟失了平移不變性。而完整的行人重識別系統(tǒng)往往還需要疊加行人檢測模型(通常為CNN架構(gòu))以摳取背景圖中的行人圖片,若行人重識別網(wǎng)絡(luò)不具有良好的平移不變性,將受到行人檢測模型的影響從而限制了整個系統(tǒng)的識別性能。
發(fā)明內(nèi)容
本發(fā)明針對上述現(xiàn)有技術(shù)中一個或多個技術(shù)缺陷,提出了如下技術(shù)方案。
一種保留平移不變性的行人重識別方法,該方法包括:
訓(xùn)練步驟,使用樣本集對卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練獲得訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)模型,其中,所述神經(jīng)網(wǎng)絡(luò)的模型的下采樣層由步長為1的最大池化層、步長為2的平均池化層依次連接組成,或者由步長為1的卷積層、ReLU激活函數(shù)層和步長為2的平均池化層依次連接組成;
行人重識別步驟,使用訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)模型對攝像頭獲取的圖像進(jìn)行行人重識別獲得識別結(jié)果。
更進(jìn)一步地,所述卷積神經(jīng)網(wǎng)絡(luò)模型包括全局特征識別部分和局部特征識別部分。
更進(jìn)一步地,對所述樣本集中使用的三元組樣本添加隨機(jī)平移增強(qiáng)策略處理,所述三元組樣本增強(qiáng)策略為:每個三元組由標(biāo)準(zhǔn)樣本、正樣本和負(fù)樣本組成,以概率P1選取三元組中的某一樣本對其進(jìn)行隨機(jī)平移調(diào)整,所述隨機(jī)平移調(diào)整以概率P2對該樣本隨機(jī)平移m個像素。
更進(jìn)一步地,所述全局特征識別部分和局部特征識別部分使用的損失函數(shù)為Lsoftmax、Ltrihard和Lcenter。
更進(jìn)一步地,對損失函數(shù)為Lsoftmax、Ltrihard和Lcenter進(jìn)行加權(quán)計算,得到全局特征識別部分和局部特征識別部分的總損失函數(shù)Ltotal:
Ltotal=Lsoftmax+γtLtrihard+γcLcenter,其中,γt、γc為權(quán)重。
本發(fā)明還提出了一種保留平移不變性的行人重識別裝置,該裝置包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門市美亞柏科信息股份有限公司,未經(jīng)廈門市美亞柏科信息股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010605632.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





