[發(fā)明專利]一種基于置信學習的行人重識別方法、裝置及存儲介質有效
| 申請?zhí)枺?/td> | 202010549958.1 | 申請日: | 2020-06-16 |
| 公開(公告)號: | CN111783568B | 公開(公告)日: | 2022-07-15 |
| 發(fā)明(設計)人: | 林修明;辛錚;趙文霞;林淑強;陳濤濤;鄢小征;魏超 | 申請(專利權)人: | 廈門市美亞柏科信息股份有限公司 |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06V40/10;G06V10/774;G06V10/74;G06K9/62 |
| 代理公司: | 廈門福貝知識產(chǎn)權代理事務所(普通合伙) 35235 | 代理人: | 陳遠洋 |
| 地址: | 361000 福建省廈門市思明*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 置信 學習 行人 識別 方法 裝置 存儲 介質 | ||
本發(fā)明提出了一種基于置信學習的行人重識別方法、裝置及存儲介質,該方法包括:從視頻圖像資源庫的獲取N張行人圖像,從中隨機選取M張行人圖像作為查詢圖像,其余作為查詢底庫;使用行人重識別模型從中篩選一定數(shù)目的行人圖像保存在一候選訓練集,并該數(shù)目的行人圖像標記一個新的人員id;將候選訓練集與原始訓練集合并得到合并訓練集,并使用置信訓練尋找合并訓練集的標簽誤差后進行校驗,然后對行人重識別模型進行重新訓練得到重訓練后的行人重識別模型后進行線上更新以進行行人重識別。本發(fā)明利用置信學習及現(xiàn)有行人重識別系統(tǒng)清洗監(jiān)控系統(tǒng)下的海量視頻數(shù)據(jù),從而提供更多的可用訓練數(shù)據(jù),有效地提高了行人重識別系統(tǒng)的泛化性能及準確率。
技術領域
本發(fā)明涉及人工智能技術領域,具體涉及一種基于置信學習的行人重識別方法、裝置及存儲介質。
背景技術
隨著社會和科技的進步,人臉識別越來越成為一項可依賴的安防技術。但是對于現(xiàn)今大部分攝像頭而言,其分辨率往往不能達到人臉識別系統(tǒng)的要求,故可以應用于現(xiàn)有監(jiān)控系統(tǒng)的行人重識別技術是極有必要的。行人重識別(Person re-identification)是利用圖像處理技術來判定某一攝像頭下的行人是否出現(xiàn)在其他攝像頭中,從而可以描繪行人的活動路徑,實現(xiàn)跨鏡頭追蹤的目的。現(xiàn)階段行人重識別常用方法主要有表征學習、度量學習、基于局部特征或視頻序列等方法。
行人和人臉一樣具有結構,但是不同于人臉,行人的結構往往更加復雜。在實際應用場景中可能存在無正臉、配飾不一、姿態(tài)變化及遮擋、攝像頭的拍攝角度、室內外環(huán)境的變化、白天與黑夜的光線差異、季節(jié)穿搭(冬天進入室內可能會脫掉外套)等等不利條件和干擾因素。與此同時,不同于人臉可以到互聯(lián)網(wǎng)直接爬取名人的圖片,行人重識別由于其任務的特殊性,其訓練數(shù)據(jù)集采集標記難度更高,現(xiàn)有的數(shù)據(jù)集往往只能達到幾萬的級別,這也阻礙了行人重識別技術進一步走向實用化,即現(xiàn)有的訓練集數(shù)量不足,另一方面,現(xiàn)有的監(jiān)控系統(tǒng)下存在海量的無標簽數(shù)據(jù)難以利用,無法作為行人重識別的訓練集使用。
發(fā)明內容
本發(fā)明針對上述現(xiàn)有技術中一個或多個技術缺陷,提出了如下技術方案。
一種基于置信學習的行人重識別方法,該方法包括:
預處理步驟,從視頻圖像資源庫的獲取N張行人圖像,從所述N張行人圖像隨機選取M張行人圖像作為查詢圖像,N-M張行人圖像作為查詢底庫;
篩選步驟,使用行人重識別模型對所述M張行人圖像中的每張行人圖像在查詢底庫進行查詢匹配,如果查詢底庫中存在與該張行人圖像相似度大于第一閾值的圖像的數(shù)目大于第二閾值時,則將該數(shù)目的行人圖像保存在一候選訓練集,并將該數(shù)目的行人圖像標記一個新的人員id;
置信訓練步驟,當所述候選訓練集的id的數(shù)目與所述行人重識別模型的原始訓練集數(shù)目的比例達到第三閾值時,將所述候選訓練集與所述原始訓練集合并得到合并訓練集,并使用置信訓練尋找合并訓練集的標簽誤差;
重訓練步驟,基于所述標簽誤差對所述合并訓練集進行校驗,使用校驗后的合并訓練集對所述行人重識別模型進行重新訓練得到重訓練后的行人重識別模型;
識別步驟,將所述重訓練后的行人重識別模型進行線上更新以進行行人重識別。
更進一步地,所述從視頻圖像資源庫的獲取N張行人圖像的操作為:通過行人檢測模型對視頻圖像資源庫中的每條視頻進行檢測,如果所述視頻中一幀或多幀中存在行人,則將該一幀或多幀中的行人圖像進行摳取,所述視頻處理完畢后獲得N張行人圖像。
更進一步地,所述相似度為余弦相似度,所述第一閾值為0.9,所述第二閾值為10,所述第三閾值為0.2。
更進一步地,所述使用置信訓練尋找合并訓練集的標簽誤差的過程為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門市美亞柏科信息股份有限公司,未經(jīng)廈門市美亞柏科信息股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010549958.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





