[發(fā)明專利]一種保留平移不變性的行人重識(shí)別方法、裝置及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202010605632.6 | 申請(qǐng)日: | 2020-06-29 |
| 公開(kāi)(公告)號(hào): | CN111783624B | 公開(kāi)(公告)日: | 2023-03-24 |
| 發(fā)明(設(shè)計(jì))人: | 林修明;吳鴻偉;林淑強(qiáng);張永光;藍(lán)坤宏;魏煒途 | 申請(qǐng)(專利權(quán))人: | 廈門(mén)市美亞柏科信息股份有限公司 |
| 主分類號(hào): | G06V40/10 | 分類號(hào): | G06V40/10;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 廈門(mén)福貝知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 35235 | 代理人: | 陳遠(yuǎn)洋 |
| 地址: | 361000 福建省廈門(mén)市思明*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 保留 平移 不變性 行人 識(shí)別 方法 裝置 存儲(chǔ) 介質(zhì) | ||
本發(fā)明提出了一種保留平移不變性的行人重識(shí)別方法、裝置及存儲(chǔ)介質(zhì),該方法包括:訓(xùn)練步驟,使用樣本集對(duì)卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練獲得訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)模型,其中,所述神經(jīng)網(wǎng)絡(luò)的模型的下采樣層由步長(zhǎng)為1的最大池化層、步長(zhǎng)為2的平均池化層依次連接組成,或者由步長(zhǎng)為1的卷積層、ReLU激活函數(shù)層和步長(zhǎng)為2的平均池化層依次連接組成;行人重識(shí)別步驟,使用訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)攝像頭獲取的圖像進(jìn)行行人重識(shí)別獲得識(shí)別結(jié)果。本發(fā)明對(duì)卷積神經(jīng)網(wǎng)絡(luò)的下采樣層的結(jié)構(gòu)進(jìn)行了修改,僅使用平均池化層進(jìn)行下采樣操作,不會(huì)破壞整個(gè)網(wǎng)絡(luò)的平移不變性,提高了行人重識(shí)別的準(zhǔn)確性,且針對(duì)修改后的網(wǎng)絡(luò)結(jié)構(gòu)提出了樣本集及損失函數(shù)的具體修改方法。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,具體涉及一種保留平移不變性的行人重識(shí)別方法、裝置及存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著社會(huì)和科技的進(jìn)步,人臉識(shí)別越來(lái)越成為一項(xiàng)可依賴的安防技術(shù)。但是對(duì)于現(xiàn)今大部分?jǐn)z像頭而言,其分辨率往往不能達(dá)到人臉識(shí)別系統(tǒng)的要求,故可以應(yīng)用于現(xiàn)有監(jiān)控系統(tǒng)的行人重識(shí)別技術(shù)是極有必要的。行人重識(shí)別(Person re-identification)是利用圖像處理技術(shù)來(lái)判定某一攝像頭下的行人是否出現(xiàn)在其他攝像頭中,從而可以描繪行人的活動(dòng)路徑,實(shí)現(xiàn)跨鏡頭追蹤的目的。現(xiàn)階段行人重識(shí)別常用方法主要有表征學(xué)習(xí)、度量學(xué)習(xí)、基于局部特征或視頻序列等方法。
CNN(卷積神經(jīng)網(wǎng)絡(luò))架構(gòu)由于采用多種下采樣策略(最大池化、步長(zhǎng)卷積等)導(dǎo)致網(wǎng)絡(luò)最后提取到的圖像特征丟失了平移不變性。而完整的行人重識(shí)別系統(tǒng)往往還需要疊加行人檢測(cè)模型(通常為CNN架構(gòu))以摳取背景圖中的行人圖片,若行人重識(shí)別網(wǎng)絡(luò)不具有良好的平移不變性,將受到行人檢測(cè)模型的影響從而限制了整個(gè)系統(tǒng)的識(shí)別性能。
發(fā)明內(nèi)容
本發(fā)明針對(duì)上述現(xiàn)有技術(shù)中一個(gè)或多個(gè)技術(shù)缺陷,提出了如下技術(shù)方案。
一種保留平移不變性的行人重識(shí)別方法,該方法包括:
訓(xùn)練步驟,使用樣本集對(duì)卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練獲得訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)模型,其中,所述神經(jīng)網(wǎng)絡(luò)的模型的下采樣層由步長(zhǎng)為1的最大池化層、步長(zhǎng)為2的平均池化層依次連接組成,或者由步長(zhǎng)為1的卷積層、ReLU激活函數(shù)層和步長(zhǎng)為2的平均池化層依次連接組成;
行人重識(shí)別步驟,使用訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)攝像頭獲取的圖像進(jìn)行行人重識(shí)別獲得識(shí)別結(jié)果。
更進(jìn)一步地,所述卷積神經(jīng)網(wǎng)絡(luò)模型包括全局特征識(shí)別部分和局部特征識(shí)別部分。
更進(jìn)一步地,對(duì)所述樣本集中使用的三元組樣本添加隨機(jī)平移增強(qiáng)策略處理,所述三元組樣本增強(qiáng)策略為:每個(gè)三元組由標(biāo)準(zhǔn)樣本、正樣本和負(fù)樣本組成,以概率P1選取三元組中的某一樣本對(duì)其進(jìn)行隨機(jī)平移調(diào)整,所述隨機(jī)平移調(diào)整以概率P2對(duì)該樣本隨機(jī)平移m個(gè)像素。
更進(jìn)一步地,所述全局特征識(shí)別部分和局部特征識(shí)別部分使用的損失函數(shù)為L(zhǎng)softmax、Ltrihard和Lcenter。
更進(jìn)一步地,對(duì)損失函數(shù)為L(zhǎng)softmax、Ltrihard和Lcenter進(jìn)行加權(quán)計(jì)算,得到全局特征識(shí)別部分和局部特征識(shí)別部分的總損失函數(shù)Ltotal:
Ltotal=Lsoftmax+γtLtrihard+γcLcenter,其中,γt、γc為權(quán)重。
本發(fā)明還提出了一種保留平移不變性的行人重識(shí)別裝置,該裝置包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門(mén)市美亞柏科信息股份有限公司,未經(jīng)廈門(mén)市美亞柏科信息股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010605632.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 行人畫(huà)像的生成及基于畫(huà)像的行人識(shí)別
- 一種輔助駕駛方法、裝置、車載終端及車輛
- 行人跟蹤方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于行人重識(shí)別的跨鏡頭的行人檢索方法
- 行人重識(shí)別方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 行人重識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于深度條件隨機(jī)場(chǎng)的行人重識(shí)別方法和系統(tǒng)
- 行人跟蹤的方法、行人跟蹤裝置以及行人跟蹤系統(tǒng)
- 一種實(shí)時(shí)行人檢測(cè)與重識(shí)別方法及裝置
- 一種行人屬性識(shí)別方法、裝置及電子設(shè)備





