[發明專利]基于深度學習和距離度量學習的人員再識別方法在審
| 申請號: | 201810157658.1 | 申請日: | 2018-02-24 |
| 公開(公告)號: | CN108345860A | 公開(公告)日: | 2018-07-31 |
| 發明(設計)人: | 李弼程;趙永威;朱彩英;陳良浩 | 申請(專利權)人: | 江蘇測聯空間大數據應用研究中心有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 215000 江蘇省蘇州市高*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 距離度量 學習 視覺詞典 圖像 卷積神經網絡 誤差反向傳播 行人目標檢測 對視頻數據 準確度 語義 本質屬性 度量空間 視頻圖像 圖像表達 線性SVM 分類器 稀疏性 選擇行 最優化 向量 微調 視頻 監督 分組 檢測 網絡 | ||
1.一種基于深度學習和距離度量學習的人員再識別方法,其特征是,包括以下步驟:
(1)采用基于卷積神經網絡的行人目標檢測方對視頻數據進行處理,檢測出視頻中的行人目標;
(2)利用非監督RBM網絡采用自底向上的方式對行人目標的初始特征進行編碼得到兼具稀疏性和選擇行的視覺詞典;
(3)利用誤差反向傳播對初始視覺詞典進行有監督微調,獲取視頻圖像新的圖像表達方式,也即是圖像深度學習表示向量;
(4)采用特征分組與特征值最優化的距離度量學習方法,獲取更加接近真實語義的度量空間,并采用線性SVM分類器對行人目標進行識別。
2.根據權利要求1所述的基于深度學習和距離度量學習的人員再識別方法,其特征在于:所述采用基于卷積神經網絡的行人目標檢測方法,分為模型訓練階段和目標檢測階段:
(1)在模型訓練階段中,首先通過選擇不同角度及外表顏色的樣本措施增大樣本的多樣性,然后將這些樣本重新調整至統一的分辨率,再增強樣本的對比度,最后通過嘗試不同的CNN模型參數訓練模型,獲得檢測性能較好的參數組合;
(2)在運動目標檢測階段,首先直接對整幅圖像做卷積計算來提取圖像特征,然后采用并行計算方法將圖像分割為同樣大小的小塊圖像,然后使用訓練好的CNN模型同時對這些小塊圖像進行計算,使用背景建模算法提取每一幀圖像中可能存在運動目標的區域,使用非最大值抑制算法將不同尺度下的檢測結果進行優化,獲得目標的準確位置。
3.根據權利要求1所述的基于深度學習和距離度量學習的人員再識別方法,其特征在于:在網絡的訓練過程中,所述RBM的隱層與顯層間之間是通過條件概率分布相關聯的,顯層層和隱層的條件概率為:
公式一:
公式二:
xi,zj分別代表特征層和編碼層,也即是RBM中的顯層與隱層;ωij為特征層xi與編碼層之間的連接權重系數,給定權重系數矩陣ω和隱層偏置向量b,輸入層特征x就可以編碼為視覺詞典z,相應的給出ω和顯層偏置矩陣c就可以由視覺詞典z重構出特征x;對于RBM中一組給定的輸入層和編碼層(x,z),其能量函數可計算如下:
公式三:
基于能量函數,可得到(x,z)的聯合概率分布函數:
公式四:
進而得到聯合分布的邊緣分布——特征輸入節點的概率分布,即:
公式五:
而RBM網絡訓練的目的就是使p(x)的值最大化,為此,對公式五求其梯度得,
公式六:
其中,<xizj>dist表示在分布dist下的期望,<xizj>data是指訓練數據集經驗概率分布下的期望值,而<xizj>model指該模型下概率分布的期望值,可由蒙特卡羅馬爾可夫鏈(Monte-Carlo Markov chain,MCMC)方法來得到模型樣例:
公式七:
通過CD算法對RBM進行快速學習,加快參數的收斂,可得到權值wij的更新量為:
公式八:Δωij=ε(<xizj>data-<xizj>model)
其中ε為學習速率,通過CD算法,就可以得到不斷更新的參數,一直到參數收斂,得到初始的視覺詞典。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇測聯空間大數據應用研究中心有限公司,未經江蘇測聯空間大數據應用研究中心有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810157658.1/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





