[發明專利]基于深度學習編碼模型的人員再識別方法在審
| 申請號: | 201710080498.0 | 申請日: | 2017-02-15 |
| 公開(公告)號: | CN106778921A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 趙永威;譚佩耀;胡畏;李博 | 申請(專利權)人: | 張烜 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 710000 陜西省*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 編碼 模型 人員 識別 方法 | ||
1.一種基于深度學習編碼模型的人員再識別方法,其特征在于,包括以下步驟:
首先,利用非監督RBM網絡采用自底向上的方式對提取的初始SIFT特征進行編碼得到視覺詞典;
其次,采用自頂向下的方式為整個網絡參數進行有監督微調;
然后,就是利用誤差反向傳播對初始視覺詞典進行有監督微調,獲取視頻圖像新的圖像表達方式,也就是圖像深度學習表示向量;
最后,利用圖像深度學習表示向量訓練線性SVM分類器用以對行人進行分類識別。
2.根據權利要求1所述的基于深度學習編碼模型的人員再識別方法,其特征在于,具體包括以下步驟:
首先,提取訓練圖像庫的SIFT特征;
其次,結合SIFT特征的空間信息,將鄰近的SIFT特征作為RBM的輸入,通過CD快速算法訓練RBM,得到隱藏層特征;
然后,鄰近的隱藏層特征作為下一層RBM的輸入,得到輸出詞典;
ω1和ω2作為RBM的連接權重,RBM具有一個顯見層,一個隱層,但是在RBM中,同層的神經元之間是無連接的,這樣學習使得過程更簡單。
3.根據權利要求2所述的基于深度學習編碼模型的人員再識別方法,其特征在于:在網絡的訓練過程中,RBM的隱層與顯層之間是通過條件概率分布相關聯的,顯層和隱層的條件概率為:
其中,xi,zj分別代表特征層和編碼層,也就是RBM中的顯層與隱層;ωij為特征層xi與編碼層之間的連接權重系數,給定權重系數矩陣ω和隱層偏置向量b,輸入層特征x就可以編碼為視覺詞典z,相應的給出ω和顯層偏置矩陣c就可以由視覺詞典z重構出特征x。對于RBM中一組給定的輸入層和編碼層(x,z),其能量函數可計算如下:
基于能量函數,可得到(x,z)的聯合概率分布函數:
進而得到聯合分布的邊緣分布——特征輸入節點的概率分布,即:
而RBM網絡訓練的目的就是使p(x)的值最大化,為此,對式(5)求其梯度得:
其中,<xizj>dist表示在分布dist下的期望,<xizj>data是指訓練數據集經驗概率分布下的期望值,而<xizj>model指該模型下概率分布的期望值,通常可由蒙特卡羅馬爾可夫鏈方法來得到模型樣例:
通過CD算法對RBM進行快速學習,加快參數的收斂,可得到權值wij的更新量為:
Δωij=ε(<xizj>data-<xizj>model) (8)
其中ε為學習速率,通過CD算法,就可以得到不斷更新的參數,一直到參數收斂,得到初始的視覺詞典。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于張烜,未經張烜許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710080498.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種輸電線路檢修設備
- 下一篇:一種適合高維特征的鞋印新類別檢測方法





