[發明專利]一種基于神經網絡無監督對比學習的高效行人重識別方法有效
| 申請號: | 202010364742.8 | 申請日: | 2020-04-30 |
| 公開(公告)號: | CN111611880B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 顏成鋼;徐同坤;殷建;孫垚棋;張繼勇;張勇東 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/08 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 神經網絡 監督 對比 學習 高效 行人 識別 方法 | ||
本發明公開了一種基于神經網絡無監督對比學習的高效行人重識別方法。本發明步驟:步驟1:準備行人重識別模型訓練的數據集;步驟2:選擇具有較強特征提取能力的卷積神經網絡作為無監督對比學習模型的主干網絡,無監督對比學習模型中的對比學習以特征向量為出發點,即對無監督對比學習模型提取的特征向量進行約束,按照損失函數的方式,利用優化器和反向傳播的原理實現對無監督對比學習模型的網絡參數的修正;步驟3:將訓練圖片的特征向量存入緩存區;步驟4:通過量化指標進行量化評估。本發明使用有標數據和無標數據同時訓練,即保障模型較高的準確度,實現模型易訓練的特點,又能有較好的模型擴展性,對新環境的新樣本有更好的擴展性。
技術領域
本發明涉及智能安防業務涵蓋社會安保、人員監控、反恐維穩等領域,提供一種基于神經網絡無監督對比學習的高效行人重識別方法。一種場景適應能力強、跨攝像頭多角度、識別精度高的普適性行人識別方法。
背景技術
行人重識別技術是視頻追蹤的一個重要實驗技術,通過對多個攝像頭中行人圖片的提取進行同一人在不同姿態、不同角度、不同環境下的識別和匹配技術。該技術能夠根據行人的穿著、體態、發型等信息認知行人,同時該技術可以作為人臉識別技術的重要補充,可以對無法獲取清晰拍攝人臉的行人進行跨攝像頭連續跟蹤,增強數據的時空連續性。行人重識別技術利用計算機視覺技術判斷圖像或者視頻序列中是否存在特定行人。廣泛被認為是一個圖像檢索的子問題。給定一個監控行人圖像,檢索跨設備下的該行人圖像。
目前行人檢測的算法如DPM(Deformable?part?model可形變部件模型)和FastRCNN已經可以實現在一個圖像中圈出行人的目標,即自動標注,不需要人工去標注了,那么行人重識別任務就是要找到最可能匹配待識別目標的候選。目前的行人再識別研究是基于數據集的,就是通過架設幾個攝像頭,采集行人圖像,然后人工標注或自動標注。這些圖像一部分用于訓練,一部分用于識別。目前受到相機拍攝角度、圖片成像質量、環境光線變化、人體姿態變化、目標遮擋和訓練數據集不夠等問題,目前的識別率還達不到可以應用的要求。
傳統的行人重識別方法是采用有監督的訓練方法,即使用人工收集和標記的行人訓練集進行訓練,因為訓練集的圖片是有限的場景下的有限數量的采集,并不能完全符合實際生活中的所有場景,訓練的行人重識別模型對與訓練集相同情境下的圖片具有良好的檢測和識別精度,但是對其他情景下的圖片卻沒有很好的識別精度。所以傳統有監督學習下訓練的模型缺少對實際生活場景的普適性。
如果需要在新的場景下讓行人重識別模型得到較好的結果,需要對新場景進行行人圖片的采集、人工標注以及模型重新訓練,這其中代價最高就是行人圖片的標注,這個需要耗費大量的人力物力,也是目前有監督學習下行人重識別技術沒法落地應用的主要障礙。本發明是采用無監督學習方法進行圖片特征表述學習的技術,不需要大量的人工數據標注,只需要提供新環境下足夠的行人抓取照片即可。
傳統的使用監督學習的方式需要進行足夠的新環境魯棒性和穩定性測試,需要大量的人力物力去測試系統和模型的有效運行性,在模型和系統實際上線運行之前,需要足夠的時間去測試,檢驗模型在新場景下是否具有足夠的穩定性和準確性。采用有監督方法訓練的模型存在著不穩定性,在實際使用中存在極大的風險,這也是制約目前行人重識別技術落地的重要因素。
行人重識別的技術受環境因素影響巨大,系統穩定運行的風險也很大,特別是有監督訓練的模型普適性不強,容易被攻擊造成系統無法正常運行。在現實中,攻擊者可以換裝衣服和帽子、光照強度變化、遮擋身體部分等實現對行人重識別系統的攻擊。
發明內容
本發明的目的是針對現有技術的不足,提出一種基于神經網絡無監督對比學習的高效行人重識別方法。一種使用對比學習方式的普適性行人重識別方法。本發明可以快速高效的實現行人在不同場景下的識別和檢測。
本發明根據無監督學習領域的對比學習方法,利用無監督不需要標注數據的特點,使用神經網絡進行對比學習,利用更多的無標簽的行人圖片,去提高神經網絡的特征表達和特征提取能力。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010364742.8/2.html,轉載請聲明來源鉆瓜專利網。





