[發(fā)明專利]基于姿態(tài)估計(jì)與視點(diǎn)機(jī)制融合的行人再識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 201910287259.1 | 申請(qǐng)日: | 2019-04-08 |
| 公開(公告)號(hào): | CN110008913A | 公開(公告)日: | 2019-07-12 |
| 發(fā)明(設(shè)計(jì))人: | 徐曾春;裴嘉震;胡平 | 申請(qǐng)(專利權(quán))人: | 南京工業(yè)大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/62 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 211816 江蘇*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 關(guān)鍵區(qū)域 機(jī)制融合 相機(jī)拍攝 姿態(tài)估計(jì) 視點(diǎn) 圖像 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 語(yǔ)義 結(jié)構(gòu)信息 局部特征 區(qū)域特征 全局特征 身體區(qū)域 視點(diǎn)位置 特征融合 行人身體 行人數(shù)據(jù) 姿勢(shì)估計(jì) 對(duì)齊 關(guān)鍵點(diǎn) 子網(wǎng)絡(luò) 加載 刑偵 遮擋 匹配 姿勢(shì) 側(cè)面 合并 拍攝 融合 預(yù)測(cè) 網(wǎng)絡(luò) 幫助 | ||
1.基于姿態(tài)估計(jì)與視點(diǎn)機(jī)制融合的行人再識(shí)別方法,其特征在于,所述方法包括以下步驟:
步驟一:行人再識(shí)別數(shù)據(jù)集采集,獲取行人再識(shí)別公開數(shù)據(jù)集,區(qū)分訓(xùn)練集與測(cè)試集,進(jìn)入步驟二;
步驟二:行人再識(shí)別數(shù)據(jù)集訓(xùn)練,將行人再識(shí)別公開數(shù)據(jù)集的訓(xùn)練集作為深度卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練集,最終得到行人再識(shí)別模型進(jìn)行進(jìn)入步驟三;
步驟三:特征提取與融合,根據(jù)步驟二,得到的行人再識(shí)別模型,對(duì)查詢圖像與庫(kù)圖像提取網(wǎng)絡(luò)中的全局特征與局部特征,將一張圖像輸入網(wǎng)絡(luò)后,通過特征嵌入網(wǎng)絡(luò)與特征融合網(wǎng)絡(luò)最終獲得一個(gè)2048維向量特征進(jìn)入步驟四;
步驟四:再識(shí)別分析,根據(jù)步驟三獲得的2048維特征向量,計(jì)算查詢圖像特征與待查詢圖像特征之間的歐幾里得距離,將該距離由小到大排序,排名較前的圖像較大可能與查詢圖像為同一行人,并利用CMC累積匹配曲線中的RANK1,RANK5,RANK10,RANK20與平均精度mAP作為算法性能的評(píng)價(jià)指標(biāo)。
2.根據(jù)權(quán)利要求1所述的基于姿態(tài)估計(jì)與視點(diǎn)機(jī)制融合的行人再識(shí)別方法,其特征在于,步驟一中所述得到行人再識(shí)別數(shù)據(jù)集方法包括以下步驟:
步驟一:獲取廣泛使用的行人再識(shí)別數(shù)據(jù)集CHUK 03,Market-1501,與DukeMTMC-reID數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),將CHUK03中的第三組的100個(gè)行人圖像作為測(cè)試集,剩余1367個(gè)行人的圖像作為訓(xùn)練集,Market1501訓(xùn)練集有751人,包含12,936張圖像;測(cè)試集有750人,包含19,732張圖像;訓(xùn)練集有702個(gè)行人的16522張圖像,測(cè)試集有702個(gè)行人的17661張圖像。
3.根據(jù)權(quán)利要求1所述的基于姿態(tài)估計(jì)與視點(diǎn)機(jī)制融合的行人再識(shí)別方法,其特征在于,步驟二所述的卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練包括以下步驟:
步驟一:訓(xùn)練過程中,輸入圖像進(jìn)入我們的卷積神經(jīng)網(wǎng)絡(luò),進(jìn)行特征提取,深度卷積神經(jīng)網(wǎng)絡(luò)框架由特征嵌入網(wǎng)絡(luò)與特征融合網(wǎng)絡(luò)組成,其主干網(wǎng)絡(luò)為Resnet50;
步驟二:考慮訓(xùn)練過程中的損失函數(shù),我們采用三個(gè)Softmax loss作為L(zhǎng)oss函數(shù),分別為全局損失,融合損失,局部損失,統(tǒng)一用以下公式作為損失函數(shù):
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京工業(yè)大學(xué),未經(jīng)南京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910287259.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 標(biāo)簽信息產(chǎn)生裝置,標(biāo)簽信息產(chǎn)生方法和記錄媒體
- 三維模型處理方法和裝置
- 一種圖像處理方法及裝置
- 客運(yùn)樞紐關(guān)鍵區(qū)域安全風(fēng)險(xiǎn)及承載能力自動(dòng)評(píng)估方法
- 關(guān)鍵層破斷區(qū)域確定方法
- 一種局部超薄鏤空雙層FPC產(chǎn)品及其制作方法
- 一種地圖構(gòu)建方法和自行走設(shè)備
- 一種臉部亮度計(jì)算方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 圖像的采樣方法、裝置及電子設(shè)備
- 援救區(qū)域的3D拓?fù)涞貓D構(gòu)建方法、系統(tǒng)以及存儲(chǔ)介質(zhì)
- 確定不同調(diào)控機(jī)制對(duì)調(diào)節(jié)編碼基因貢獻(xiàn)的方法
- 一種融合通信方法和裝置
- 一種基于注意力機(jī)制和特征強(qiáng)化融合的中文文本分類方法
- 一種融合網(wǎng)絡(luò)和雙通道注意力機(jī)制的街景圖像分割方法
- 一種基于注意力機(jī)制的多分支特征融合遙感場(chǎng)景圖像分類方法
- 基于注意力機(jī)制的圖像語(yǔ)義分割特征融合方法
- 一種基于注意力機(jī)制的特征融合方法
- 基于多注意力機(jī)制融合的行為識(shí)別裝置、方法和存儲(chǔ)介質(zhì)
- 基于注意力機(jī)制的多特征融合心電信號(hào)分類模型建模方法
- 融合視覺常識(shí)和增強(qiáng)多層全局特征的圖像描述生成方法
- 姿態(tài)估計(jì)方法和裝置
- 對(duì)象姿態(tài)估計(jì)的方法、裝置及電子設(shè)備
- 人臉姿態(tài)估計(jì)方法、裝置、終端及存儲(chǔ)介質(zhì)
- 人體姿態(tài)估計(jì)方法及設(shè)備
- 用于估計(jì)對(duì)象的姿勢(shì)和姿態(tài)信息的系統(tǒng)和方法
- 微納衛(wèi)星姿態(tài)估計(jì)方法
- 三維人體姿態(tài)估計(jì)方法、裝置、設(shè)備及介質(zhì)
- 模型訓(xùn)練方法、姿態(tài)估計(jì)方法、裝置及電子設(shè)備
- 人體姿態(tài)估計(jì)方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種視頻中人體姿態(tài)估計(jì)與跟蹤方法及系統(tǒng)





