[發明專利]基于三元組聚焦損失函數的行人再識別方法在審
| 申請號: | 201810738336.6 | 申請日: | 2018-07-06 |
| 公開(公告)號: | CN109190446A | 公開(公告)日: | 2019-01-11 |
| 發明(設計)人: | 張世周;張艷寧;張琦;夏勇 | 申請(專利權)人: | 西北工業大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 西北工業大學專利中心 61204 | 代理人: | 常威威 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聚焦損失 三元組 特征提取 網絡模型 圖像 計算特征向量 圖像數據集 分組 大小判斷 模型訓練 歐式距離 識別性能 損失函數 行人識別 訓練數據 收斂性 樣本 數據庫 網絡 聚焦 查詢 | ||
本發明提供了一種基于三元組聚焦損失函數的行人再識別方法。首先,對輸入的圖像數據集進行分組,并選擇用于特征提取的網絡模型,設置其損失函數為三元組聚焦損失函數;然后,利用分組訓練數據對網絡進行訓練,得到訓練好的網絡模型;最后,利用訓練好的網絡分別對數據庫中的圖像和待查詢行人圖像進行特征提取,計算特征向量間的歐式距離,根據距離大小判斷識別結果。利用本發明方法,可以使難樣本更聚焦,模型訓練收斂性更好,行人識別精確度更高,識別性能更好。
技術領域
本發明屬計算機視覺技術領域,具體涉及一種基于三元組聚焦損失函數的行人再識別方法。
背景技術
跨攝像頭的行人再識別技術已經成為圖像識別領域的熱點,其綜合運用了機器學習、人工智能、視覺計算等多方面的技術,主要應用于刑偵、圖像檢索等方面。行人再識別技術的主要目的是檢索一個攝像頭中出現的行人是否曾經出現在其它攝像頭中,即將一個行人的特征與其他行人的特征作比較,判斷是否為同一個行人。目前的基本處理方式是先對圖像進行特征提取,然后將測試集中的圖像特征與訓練集中的圖像特征進行匹配,看有沒有相似的圖像出現。在實際的監控視頻應用中,則先提取出一個攝像頭中行人的圖像特征,然后再與其它攝像頭中的圖像特征進行篩選比較,即利用行人再識別行人。當然,在識別過程中,由于監控視頻分辨率低、不同攝像頭光照角度變化、行人動作姿勢不同、遮擋等問題可能會影響識別正確率。
此外,還有研究行人的特征表示方法,通過提取更具有魯棒性的鑒別特征來識別行人。Alexander Hermans等人在文獻“In defense of the triplet loss for personre-identification,arXiv preprint arXiv:1703.07737,2017.”中使用距離來進行度量計算,以同一個行人之間的距離小于不同行人之間的距離來進行行人判別。Schroff F等人在文獻“FaceNet:A unified embedding for face recognition and clustering[C],IEEE Conference on Computer Vision and Pattern Recognition.IEEE ComputerSociety,2015:815-823”中提出FaceNet方法,該方法直接對圖像到歐式平面上的點的映射進行學習,其中,兩幅圖像特征所對應歐式空間上的點的距離直接對應著兩幅圖像是否相似,利用點之間的距離來判別臉部的相似性。這些方法在訓練數據收斂中對簡單樣本(即易于區分的樣本)和難樣本(即難于區分的樣本)進行了同樣的處理,而實際模型訓練中難樣本能夠對訓練過程提供更多有用的信息,且對數據收斂具有更大的作用,所以這些方法淹沒了難樣本的重要性,沒有發揮難樣本在訓練數據模型中的更大作用。
發明內容
為了克服現有技術的不足,本發明提供一種基于三元組聚焦損失函數的行人再識別方法。首先,對輸入的圖像數據集進行分組,并選擇用于特征提取的網絡模型,設置其損失函數為三元組聚焦損失函數;然后,利用分組訓練數據對網絡進行訓練,得到訓練好的網絡模型;最后,利用訓練好的網絡分別對數據庫中的圖像和待查詢行人圖像進行特征提取,計算特征向量間的歐式距離,根據距離大小判斷識別結果。利用本發明方法,可以使難樣本更聚焦,模型訓練收斂性更好,行人識別精確度更高,識別性能更好。
一種基于三元組聚焦損失函數的行人再識別方法,其特征在于步驟如下:
步驟1:假設訓練數據集中有N幅圖像,將圖像分組,每組訓練數據隨機挑選P個不同的行人,每個行人隨機選K幅不同的圖像,即一組訓練數據包含P×K幅圖像,對于每組訓練數據中的每一幅圖像,其本身為原樣本,和原樣本是相同行人的圖像為正樣本,和原樣本是不同行人的圖像為負樣本,原樣本、正樣本和負樣本共同構成一個三元組;其中,P的取值范圍為25-35,K的取值范圍為2-5。
步驟2:選擇殘差網絡Resnet50為用于特征提取的卷積神經網絡,并設置網絡的損失函數為以下三元組聚焦損失函數:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810738336.6/2.html,轉載請聲明來源鉆瓜專利網。





