[發(fā)明專利]一種融合隨機批掩膜和多尺度表征學(xué)習(xí)的行人重識別方法有效
| 申請?zhí)枺?/td> | 202010076639.3 | 申請日: | 2020-01-23 |
| 公開(公告)號: | CN111259850B | 公開(公告)日: | 2022-12-16 |
| 發(fā)明(設(shè)計)人: | 黃德雙;伍永 | 申請(專利權(quán))人: | 同濟大學(xué) |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/774;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 上海科盛知識產(chǎn)權(quán)代理有限公司 31225 | 代理人: | 葉敏華 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 融合 隨機 批掩膜 尺度 表征 學(xué)習(xí) 行人 識別 方法 | ||
本發(fā)明涉及一種融合隨機批掩膜和多尺度表征學(xué)習(xí)的行人重識別方法,包括:構(gòu)建行人重識別訓(xùn)練網(wǎng)絡(luò);按照預(yù)設(shè)訓(xùn)練參數(shù)進行網(wǎng)絡(luò)超參數(shù)調(diào)節(jié),得到學(xué)習(xí)網(wǎng)絡(luò);屏蔽多尺度表征學(xué)習(xí)和隨機批掩膜分支,得到測試網(wǎng)絡(luò),將測試集輸入測試網(wǎng)絡(luò)后得到對應(yīng)測試識別結(jié)果;判斷測試識別結(jié)果準確率是否大于或等于預(yù)設(shè)值,若判斷為是,則將實際數(shù)據(jù)集輸入學(xué)習(xí)網(wǎng)絡(luò),否則重新訓(xùn)練網(wǎng)絡(luò);最后屏蔽多尺度表征學(xué)習(xí)和隨機批掩膜分支,得到應(yīng)用網(wǎng)絡(luò),將查詢圖像輸入應(yīng)用網(wǎng)絡(luò)后得到對應(yīng)的識別結(jié)果。與現(xiàn)有技術(shù)相比,本發(fā)明使用隨機批掩膜策略、多尺度表征學(xué)習(xí)以及損失函數(shù)聯(lián)合訓(xùn)練,能夠捕獲行人圖像更細節(jié)性的判別力特征,并提取到局部的重要的被抑制的特征。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機模式識別圖像處理技術(shù)領(lǐng)域,尤其是涉及一種融合隨機批掩膜和多尺度表征學(xué)習(xí)的行人重識別方法。
背景技術(shù)
行人重識別(Person Re-identification,PReID)是利用計算機視覺技術(shù)判斷圖像或者視頻序列中是否存在特定行人的技術(shù),廣泛被認為是一個圖像檢索的子問題,在給定一個監(jiān)控行人圖像后,能夠自動檢索跨設(shè)備下的該行人圖像。目前,城市里用于公共治安領(lǐng)域的攝像頭已經(jīng)大量部署,幾乎到了幾十米到幾百米一個覆蓋的程度,盡管如此,不同的攝像頭之間仍然存在無法覆蓋的區(qū)域。行人重識別的目標(biāo)就是要確定一個攝像頭下發(fā)現(xiàn)的目標(biāo),在離開攝像頭的視野后去哪了,這有點像視頻搜索,就是在其他的攝像頭采集到的視頻中找到目標(biāo),行人重識別的任務(wù)就是在無重復(fù)視域的不同攝像機采集的行人圖像或是視頻樣本之間建立連接關(guān)系的處理過程,即識別出不同位置的攝像機在不同時刻拍攝的行人是否為同一人。
現(xiàn)有的行人重識別研究是基于數(shù)據(jù)集的,就是通過架設(shè)幾個攝像頭,采集行人圖像,然后人工標(biāo)注或自動標(biāo)注。這些圖像一部分用于訓(xùn)練和學(xué)習(xí),一部分用于識別。為了提高識別精度,識別算法主要分為兩部分,一部分是提取更好的圖像特征,另一部分是為了更有效的計算比對不同特征之間的距離。
在提取圖像特征時,傳統(tǒng)方式多利用深度學(xué)習(xí)模型,基于卷積神經(jīng)網(wǎng)絡(luò)自動學(xué)習(xí)特征,并利用注意力機制來提取特征,但這種方式通常只著重提取圖像中的面部特征或其他突出特征,對于手部或腳步等局部被抑制的特征,則不進行提取,導(dǎo)致這些局部被抑制的重要細節(jié)性特征無法被有效提取到,也就不能保證后續(xù)識別的準確率。
發(fā)明內(nèi)容
本發(fā)明的目的就是為了克服上述現(xiàn)有技術(shù)存在的缺陷而提供一種融合隨機批掩膜和多尺度表征學(xué)習(xí)的行人重識別方法。
本發(fā)明的目的可以通過以下技術(shù)方案來實現(xiàn):一種融合隨機批掩膜和多尺度表征學(xué)習(xí)的行人重識別方法,包括以下步驟:
S1、獲取基準數(shù)據(jù)集,并對基準數(shù)據(jù)集進行數(shù)據(jù)擴充;
S2、將數(shù)據(jù)擴充之后的基準數(shù)據(jù)集分為訓(xùn)練集和測試集;
S3、基于ResNet50卷積神經(jīng)網(wǎng)絡(luò),構(gòu)建包含依次連接的注意力學(xué)習(xí)模塊、特征提取模塊和識別輸出模塊的行人重識別訓(xùn)練網(wǎng)絡(luò),其中,特征提取模塊包括特征處理分支、多尺度表征學(xué)習(xí)分支和隨機批掩膜分支,所述特征處理分支包括全局平均池化和批歸一化處理;
S4、將訓(xùn)練集輸入行人重識別訓(xùn)練網(wǎng)絡(luò),按照預(yù)設(shè)訓(xùn)練參數(shù)進行網(wǎng)絡(luò)超參數(shù)調(diào)節(jié),得到行人重識別學(xué)習(xí)網(wǎng)絡(luò);
S5、屏蔽行人重識別學(xué)習(xí)網(wǎng)絡(luò)中特征提取模塊的多尺度表征學(xué)習(xí)分支和隨機批掩膜分支,得到行人重識別測試網(wǎng)絡(luò),將測試集輸入行人重識別測試網(wǎng)絡(luò),輸出對應(yīng)的測試識別結(jié)果;
S6、計算測試識別結(jié)果的準確率,判斷識別結(jié)果準確率是否大于或等于預(yù)設(shè)值,若判斷為是,則執(zhí)行步驟S7,否則返回步驟S4;
S7、獲取實際數(shù)據(jù)集,并將實際數(shù)據(jù)集輸入行人重識別學(xué)習(xí)網(wǎng)絡(luò),以學(xué)習(xí)實際數(shù)據(jù)集對應(yīng)的圖像特征;
S8、屏蔽行人重識別學(xué)習(xí)網(wǎng)絡(luò)中特征提取模塊的多尺度表征學(xué)習(xí)分支和隨機批掩膜分支,得到行人重識別應(yīng)用網(wǎng)絡(luò),將查詢圖像輸入行人重識別應(yīng)用網(wǎng)絡(luò),輸出該查詢對象對應(yīng)的識別結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于同濟大學(xué),未經(jīng)同濟大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010076639.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





