[發(fā)明專利]行人重識(shí)別網(wǎng)絡(luò)的訓(xùn)練及基于其的行人重識(shí)別有效
| 申請(qǐng)?zhí)枺?/td> | 201710906719.5 | 申請(qǐng)日: | 2017-09-29 |
| 公開(公告)號(hào): | CN108875487B | 公開(公告)日: | 2021-06-15 |
| 發(fā)明(設(shè)計(jì))人: | 羅浩;張弛 | 申請(qǐng)(專利權(quán))人: | 北京曠視科技有限公司;北京邁格威科技有限公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/62 |
| 代理公司: | 北京市磐華律師事務(wù)所 11336 | 代理人: | 高偉;卜璐璐 |
| 地址: | 100190 北京*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 行人 識(shí)別 網(wǎng)絡(luò) 訓(xùn)練 基于 | ||
本發(fā)明提供了行人重識(shí)別網(wǎng)絡(luò)的訓(xùn)練及基于其的行人重識(shí)別的方法、裝置、系統(tǒng)和存儲(chǔ)介質(zhì),所述行人重識(shí)別網(wǎng)絡(luò)的訓(xùn)練方法包括:利用分類損失對(duì)基準(zhǔn)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練;以及聯(lián)合分類損失和五元組損失對(duì)經(jīng)預(yù)訓(xùn)練的基準(zhǔn)網(wǎng)絡(luò)進(jìn)行調(diào)優(yōu)以得到行人重識(shí)別網(wǎng)絡(luò)。根據(jù)本發(fā)明實(shí)施例的行人重識(shí)別網(wǎng)絡(luò)的訓(xùn)練方法、裝置、系統(tǒng)和存儲(chǔ)介質(zhì)聯(lián)合分類損失和距離損失進(jìn)行訓(xùn)練,能夠加快訓(xùn)練過程并提高精度;此外,在距離損失環(huán)節(jié)中采用五元組方法,相比于傳統(tǒng)的三元組、改進(jìn)三元組和四元組方法,能夠顯著縮短訓(xùn)練時(shí)間,并且進(jìn)一步提高精度。
技術(shù)領(lǐng)域
本發(fā)明涉及行人重識(shí)別技術(shù)領(lǐng)域,更具體地涉及一種行人重識(shí)別網(wǎng)絡(luò)的訓(xùn)練及基于其的行人重識(shí)別方法、裝置、系統(tǒng)和存儲(chǔ)介質(zhì)。
背景技術(shù)
行人重識(shí)別也稱行人再識(shí)別,是利用計(jì)算機(jī)視覺技術(shù)判斷圖像或者視頻序列中是否存在特定行人的技術(shù)。給定一個(gè)監(jiān)控行人圖像,檢索跨設(shè)備下的該行人圖像。旨在彌補(bǔ)目前固定的攝像頭的視覺局限,并可與行人檢測(cè)/行人跟蹤技術(shù)相結(jié)合,可廣泛應(yīng)用于智能視頻監(jiān)控、智能安保等領(lǐng)域。
現(xiàn)有的行人重識(shí)別方法根據(jù)訓(xùn)練思想可以分成兩種做法:第一種是把每個(gè)行人作為一個(gè)類別,將行人重識(shí)別轉(zhuǎn)化為圖像分類問題;第二種是提取每張行人圖片的特征,計(jì)算兩種圖片特征的距離,通過最小化同一個(gè)人之間圖片特征的距離和最大化不同行人之間圖片特征的距離來(lái)訓(xùn)練一個(gè)提取特征的網(wǎng)絡(luò)模型,目前的方法包括三元組、改進(jìn)三元組以及四元組。
然而,基于分類損失訓(xùn)練的模型在精度方面很難達(dá)到一個(gè)很高的水平,而基于距離損失訓(xùn)練的模型雖然精度通常會(huì)優(yōu)于前者,但是網(wǎng)絡(luò)訓(xùn)練時(shí)間卻非常長(zhǎng)。
發(fā)明內(nèi)容
針對(duì)上述問題,本發(fā)明提出了一種關(guān)于行人重識(shí)別網(wǎng)絡(luò)的訓(xùn)練的方案,其結(jié)合兩種方法的優(yōu)點(diǎn),通過聯(lián)合分類損失和距離損失來(lái)加快訓(xùn)練過程并提高精度。下面簡(jiǎn)要描述本發(fā)明提出的關(guān)于行人重識(shí)別網(wǎng)絡(luò)的訓(xùn)練的方案,更多細(xì)節(jié)將在后續(xù)結(jié)合附圖在具體實(shí)施方式中加以描述。
根據(jù)本發(fā)明一方面,提供了一種行人重識(shí)別網(wǎng)絡(luò)的訓(xùn)練方法,所述訓(xùn)練方法包括:利用分類損失對(duì)基準(zhǔn)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練;以及聯(lián)合分類損失和五元組損失對(duì)經(jīng)預(yù)訓(xùn)練的基準(zhǔn)網(wǎng)絡(luò)進(jìn)行調(diào)優(yōu)以得到行人重識(shí)別網(wǎng)絡(luò)。
在本發(fā)明的一個(gè)實(shí)施例中,所述利用分類損失對(duì)基準(zhǔn)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練包括:將樣本圖片輸入到所述基準(zhǔn)網(wǎng)絡(luò);將所述基準(zhǔn)網(wǎng)絡(luò)針對(duì)所述樣本圖片輸出的預(yù)測(cè)向量與所述樣本圖片的標(biāo)簽向量進(jìn)行比較以得到分類損失;基于所述分類損失調(diào)整所述基準(zhǔn)網(wǎng)絡(luò)的參數(shù);以及反復(fù)進(jìn)行上述步驟,直到分類準(zhǔn)確度和分類損失基本不再變化。
在本發(fā)明的一個(gè)實(shí)施例中,所述基準(zhǔn)網(wǎng)絡(luò)為殘差網(wǎng)絡(luò)。
在本發(fā)明的一個(gè)實(shí)施例中,在將所述樣本圖片輸入到所述基準(zhǔn)網(wǎng)絡(luò)之前,對(duì)所述樣本圖片實(shí)施預(yù)處理操作。
在本發(fā)明的一個(gè)實(shí)施例中,所述聯(lián)合分類損失和五元組損失對(duì)經(jīng)預(yù)訓(xùn)練的基準(zhǔn)網(wǎng)絡(luò)進(jìn)行調(diào)優(yōu)包括:按預(yù)定要求和順序輸入五元組的五張樣本圖片;基于所述基準(zhǔn)網(wǎng)絡(luò)針對(duì)每張所述樣本圖片輸出的預(yù)測(cè)向量計(jì)算分類損失;基于所述基準(zhǔn)網(wǎng)絡(luò)針對(duì)所述五張樣本圖片輸出的特征向量計(jì)算五元組損失;以及基于所計(jì)算的分類損失和所計(jì)算的五元組損失計(jì)算最終的損失以作為所述行人重識(shí)別網(wǎng)絡(luò)的損失。
在本發(fā)明的一個(gè)實(shí)施例中,所述所計(jì)算的分類損失為所述五張樣本圖片的分類損失的平均值。
在本發(fā)明的一個(gè)實(shí)施例中,所述五元組損失定義為:
lqt=d(正樣本1,正樣本2)-d(負(fù)樣本1,負(fù)樣本21)+d(負(fù)樣本21,負(fù)樣本22)-d(負(fù)樣本1,正樣本2)+a
其中,lqt為五元組損失;正樣本1、正樣本2、負(fù)樣本1、負(fù)樣本21以及負(fù)樣本22為所述五張樣本圖片,且正樣本1和正樣本2為第一行人的兩張不同圖片,負(fù)樣本1為第二行人的圖片,負(fù)樣本21和負(fù)樣本22為第三行人的兩張不同圖片;d為兩張圖片的特征向量之間的距離;a為根據(jù)需求設(shè)置的常數(shù)參數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京曠視科技有限公司;北京邁格威科技有限公司,未經(jīng)北京曠視科技有限公司;北京邁格威科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710906719.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:目標(biāo)對(duì)象識(shí)別方法、裝置、系統(tǒng)和計(jì)算機(jī)可讀介質(zhì)
- 下一篇:對(duì)象跟蹤方法、對(duì)象跟蹤裝置以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 行人畫像的生成及基于畫像的行人識(shí)別
- 一種輔助駕駛方法、裝置、車載終端及車輛
- 行人跟蹤方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于行人重識(shí)別的跨鏡頭的行人檢索方法
- 行人重識(shí)別方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 行人重識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于深度條件隨機(jī)場(chǎng)的行人重識(shí)別方法和系統(tǒng)
- 行人跟蹤的方法、行人跟蹤裝置以及行人跟蹤系統(tǒng)
- 一種實(shí)時(shí)行人檢測(cè)與重識(shí)別方法及裝置
- 一種行人屬性識(shí)別方法、裝置及電子設(shè)備
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





