[發(fā)明專利]基于三元組卷積神經(jīng)網(wǎng)絡的行人再識別方法有效
| 申請?zhí)枺?/td> | 201811469383.1 | 申請日: | 2018-11-28 |
| 公開(公告)號: | CN109635695B | 公開(公告)日: | 2022-11-08 |
| 發(fā)明(設計)人: | 王林;楊樂 | 申請(專利權)人: | 西安理工大學 |
| 主分類號: | G06V20/52 | 分類號: | G06V20/52;G06V10/82;G06N3/04 |
| 代理公司: | 西安弘理專利事務所 61214 | 代理人: | 胡燕恒 |
| 地址: | 710048*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 三元 卷積 神經(jīng)網(wǎng)絡 行人 識別 方法 | ||
本發(fā)明基于三元組卷積神經(jīng)網(wǎng)絡的行人再識別方法:步驟1、形成一個小批量樣本;步驟2、輸出每個行人圖像的全局特征和局部特征;步驟3、計算小批量樣本中每兩個行人圖像全局特征之間的距離、對應身體部位的局部特征之間的距離;步驟4、形成P×K對三元組樣本;步驟5、利用Log?logistic函數(shù)代替鉸鏈函數(shù)改進三元組卷積神經(jīng)網(wǎng)絡損失函數(shù);步驟6、得到訓練好的三元組卷積神經(jīng)網(wǎng)絡;步驟7、利用訓練好的三元組卷積神經(jīng)網(wǎng)絡識別目標行人圖像,并結合置信度測量機制來進一步避免目標行人圖像和待識別行人圖像之間的誤匹配。本發(fā)明一種基于三元組卷積神經(jīng)網(wǎng)絡的行人再識別方法,能夠準確進行行人再識別,避免不同行人之間的誤匹配。
技術領域
本發(fā)明屬于計算機視覺技術領域,具體涉及一種基于三元組卷積神經(jīng)網(wǎng)絡的行人再識別方法。
背景技術
行人再識別是圖像處理和模式識別研究的重要領域之一。所謂行人再識別是指:將某個特定的被搜索行人作為搜索源,在其他的沒有重復視線的攝像頭所采集到的視頻圖像里自動地找到這一搜索源。當有情況發(fā)生時,目標對象一定會在多個攝像頭以及不同場景中移動,如何識別出在不同攝像頭下出現(xiàn)的同一個人,并繪制出該目標走過的路徑,是行人再識別所研究的重點。
雖然行人再識別技術在視頻控制、智能交通、多媒體檢索等領域有著廣泛的應用前景,但行人外觀易受遮擋、視角以及光照條件的影響,同時視頻圖像存在分辨率低、亮度變換的干擾的問題,因此呈現(xiàn)出很大的類內差異。而且不同的行人有可能因為所穿的衣服顏色相同,身形很相似,很容易被誤認為是同一個人。人的外觀形體既具有剛性的特性,也具有柔性的特征,很容易因所穿的衣服、視角、尺度等的影響,因此,目前行人再識別仍然存在著巨大的應用挑戰(zhàn)。
現(xiàn)有的基于深度學習的行人再識別方法雖然取得了一定的效果,但是研究的焦點一直圍繞如何設計新穎的網(wǎng)絡識別架構,或如何學習有效的相似性度量函數(shù),而卷積神經(jīng)網(wǎng)絡與度量學習的結合并沒有受到廣泛的關注。三元組損失函數(shù)通過將特征學習和相似性度量合并到一個統(tǒng)一的框架中,使網(wǎng)絡根據(jù)最終的任務學習有辨識力的特征,不需要附加特定的層而可達到與設計新穎的網(wǎng)絡識別架構相提并論的效果。然而,若直接將該方法應用于行人再識別中,將會出現(xiàn)以下兩大弊端:1)傳統(tǒng)三元組損失函數(shù)中的間隔參數(shù)需要事先指定,訓練中無法自適應特征學習過程中值域的變化,缺乏靈活性,不利于改善行人再識別性能;2)數(shù)據(jù)集中相似樣本較多,往往會出現(xiàn)負樣本比正樣本更匹配測試圖像的情況,對表觀特征較相似的不同行人會出現(xiàn)誤匹配的現(xiàn)象。
發(fā)明內容
本發(fā)明的目的在于提供一種基于三元組卷積神經(jīng)網(wǎng)絡的行人再識別方法,能夠準確進行行人再識別,避免不同行人之間的誤匹配。
本發(fā)明所采用的技術方案是,基于三元組卷積神經(jīng)網(wǎng)絡的行人再識別方法,具體按照以下步驟實施:
步驟1、在行人數(shù)據(jù)集圖像中隨機采樣P個行人,并從每個行人中隨機選擇K個圖像,形成具有P×K個圖像的一個小批量樣本;
步驟2、將經(jīng)步驟1得到的小批量樣本依次輸入至三元組卷積神經(jīng)網(wǎng)絡中,輸出小批量樣本中每個行人圖像的全局特征和局部特征;
步驟3、利用歐氏距離公式計算經(jīng)步驟1得到的小批量樣本中每兩個行人圖像全局特征之間的距離并確定全局特征之間的相似性,通過引入最短路徑損失計算小批量樣本中每兩個行人圖像之間對應身體部位的局部特征之間的距離,對齊每兩個行人圖像之間對應身體部位的局部特征;
步驟4、利用步驟3得到的每兩個行人圖像全局特征之間的相似性結合小批量難樣本挖掘策略,在步驟1得到的具有P×K個圖像的一個小批量樣本中形成P×K對三元組樣本;
步驟5、利用Log-logistic函數(shù)代替鉸鏈函數(shù)改進三元組卷積神經(jīng)網(wǎng)絡損失函數(shù),得到改進后的三元組卷積神經(jīng)網(wǎng)絡損失函數(shù);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安理工大學,未經(jīng)西安理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811469383.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡轉換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡
- 神經(jīng)網(wǎng)絡的生成方法、生成裝置和電子設備
- 一種舌診方法、裝置、計算設備及計算機存儲介質
- 學習神經(jīng)網(wǎng)絡結構
- 脈沖神經(jīng)網(wǎng)絡轉換方法及相關轉換芯片
- 圖像處理方法、裝置、可讀存儲介質和計算機設備
- 一種適應目標數(shù)據(jù)集的網(wǎng)絡模型微調方法、系統(tǒng)、終端和存儲介質
- 用于重構人工神經(jīng)網(wǎng)絡的處理器及其操作方法、電氣設備
- 一種圖像神經(jīng)網(wǎng)絡結構的優(yōu)化方法及裝置





