[發明專利]基于深度學習和距離度量學習的人員再識別方法在審
| 申請號: | 201810157658.1 | 申請日: | 2018-02-24 |
| 公開(公告)號: | CN108345860A | 公開(公告)日: | 2018-07-31 |
| 發明(設計)人: | 李弼程;趙永威;朱彩英;陳良浩 | 申請(專利權)人: | 江蘇測聯空間大數據應用研究中心有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 215000 江蘇省蘇州市高*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 距離度量 學習 視覺詞典 圖像 卷積神經網絡 誤差反向傳播 行人目標檢測 對視頻數據 準確度 語義 本質屬性 度量空間 視頻圖像 圖像表達 線性SVM 分類器 稀疏性 選擇行 最優化 向量 微調 視頻 監督 分組 檢測 網絡 | ||
本發明涉及識別方法領域,尤其是基于深度學習和距離度量學習的人員再識別方法。該識別方法包括:(1)采用基于卷積神經網絡的行人目標檢測方對視頻數據進行處理,檢測出視頻中的行人目標;(2)利用非監督RBM網絡采用自底向上的方式對行人目標的初始特征進行編碼得到兼具稀疏性和選擇行的視覺詞典;(3)利用誤差反向傳播對初始視覺詞典進行有監督微調,獲取視頻圖像新的圖像表達方式,也即是圖像深度學習表示向量;(4)采用特征分組與特征值最優化的距離度量學習方法,獲取更加接近真實語義的度量空間,并采用線性SVM分類器對行人目標進行識別。本發明能夠更加準確的表達圖像本質屬性,從而很好地提升行人再識別準確度。
技術領域
本發明涉及識別方法領域,尤其是基于深度學習和距離度量學習的人員再 識別方法。
背景技術
近年來,隨著視頻監控系統大量建設與應用,使其在打擊犯罪、維護穩定 實踐中發揮著越來越重要的作用。當前大多數監控系統采用實時拍攝和人工監 視的形式,這要求監控人員時刻注意監控畫面,仔細分辨視頻中的事件,而這 顯然是不現實的,何況人工查看的方式存在大量的疏漏和主觀誤差??紤]到日 益增長的監控視頻規模,這種方式所需的人力成本也將難以承受,而且效率低 下。因此,急需方便快捷的方法來替代現有的人工主導的監控體系。強烈的現 實需求和計算機相關技術的進步,催生了行人再識別技術(Person Re-identification),該技術也成為了當前視頻智能監控領域中一個極具有挑戰性的問題,其主要任務是完成跨攝像頭的行人搜索與識別。行人再識別技術 主要是通過視覺比對的方式將視場不重疊的多個攝像機所拍攝到的屬于同一個 行人的圖像或者視頻片段關聯起來的技術。
特征提取是人員再識別技術的核心步驟,特征的好壞直接影響著識別結果 的準確與否,因此,需要我們研究如何提取能夠準確表達人體結構性信息的特 征。深度學習的興起和發展為圖像特征表達提供了新的技術手段,但存在著解 釋性差、模型復雜度高、計算強度高等問題。而視覺詞袋模型則能夠有效地進 行中層語義建模,將圖像底層特征映射至視覺單詞上,建立了跨越“語義鴻溝” 的橋梁,那么如何將深度學習網絡強大的自學習能力用于生成兼具稀疏性和選 擇性的視覺詞典,同時對深度學習網絡進行優化是本發明解決的一個關鍵問題。
在完成行人圖像特征提取之后,需要使用訓練好的分類器或者距離度量完 成跨攝像機的圖片相似度匹配,對查詢圖像進行身份判定。然而,現有的相似 性度量模型的泛化能力不強,另一個問題就是研究一種區分性更好的度量空間, 使特征空間和語義空間相一致,進一步提升行人再識別的性能。
發明內容
本發明要解決的技術問題是:為了解決現有的現有的相似性度量模型的泛 化能力不強,且行人再識別性能差的不足,本發明提供了一種基于深度學習和 距離度量學習的人員再識別方法,通過深度學習和距離度量學習,較好地提高 了視覺詞典的稀疏性和選擇性,提取的特征能夠更加準確的表達圖像本質屬性, 從而很好地提升行人再識別準確度。
本發明解決其技術問題所采用的技術方案是:
一種基于深度學習和距離度量學習的人員再識別方法,包括以下步驟:
(1)采用基于卷積神經網絡的行人目標檢測方對視頻數據進行處理,檢測 出視頻中的行人目標;
(2)利用非監督RBM網絡采用自底向上的方式對行人目標的初始特征進行 編碼得到兼具稀疏性和選擇行的視覺詞典;
(3)利用誤差反向傳播對初始視覺詞典進行有監督微調,獲取視頻圖像新 的圖像表達方式,也即是圖像深度學習表示向量;
(4)采用特征分組與特征值最優化的距離度量學習方法,獲取更加接近真 實語義的度量空間,并采用線性SVM分類器對行人目標進行識別。
具體地,所述采用基于卷積神經網絡的行人目標檢測方法,分為模型訓練 階段和目標檢測階段:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇測聯空間大數據應用研究中心有限公司,未經江蘇測聯空間大數據應用研究中心有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810157658.1/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





