[發明專利]基于非對稱映射半耦合字典對的低分辨率行人重學習方法有效
| 申請號: | 201910324340.2 | 申請日: | 2019-04-22 |
| 公開(公告)號: | CN110032984B | 公開(公告)日: | 2020-01-31 |
| 發明(設計)人: | 荊曉遠;馬飛;訾璐;黃鶴;姚永芳;李娟娟 | 申請(專利權)人: | 廣東石油化工學院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62 |
| 代理公司: | 11401 北京金智普華知識產權代理有限公司 | 代理人: | 楊采良 |
| 地址: | 525000 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 映射 低分辨率視頻 字典 非對稱 分辨率視頻 半監督 分辨率 學習 視頻 高分辨率視頻 低分辨率 高分辨率 視頻對象 特征轉化 投影矩陣 有效解決 有效應用 重新識別 準確率 場景 清晰 | ||
1.一種基于非對稱映射半耦合字典對學習的低分辨率視頻行人重學習方法,其特征在于,所述基于非對稱映射半耦合字典對學習的低分辨率視頻行人重學習方法包括:
步驟一、對高分辨率行人視頻和低分辨率行人視頻分別進行時空特征提取;
步驟二、設計視頻重構誤差項、半耦合映射項和鑒別保真項,構造整體的目標函數;
步驟三、優化目標函數;從高低分辨率視頻的特征中學習一對非對稱映射、一對高低分辨率字典及一個映射矩陣,將低分辨率視頻的特征轉化為有鑒別的高分辨率特征;
步驟四、根據學習到的非對稱映射、字典和映射矩陣,將高、低分辨率行人視頻分別進行稀疏表示;
步驟五、通過步驟四得到的不同分辨率視頻的稀疏表示,給定低分辨率probe視頻集,計算與高分辨率gallery視頻集的距離,并將距離最近的高分辨率視頻作為匹配,實現不同分辨率視頻間的行人重識別;
步驟二進一步包括:攝像頭A得到的訓練樣本為高分辨率視頻,攝像頭B得到的為低分辨率樣本;A=[A1,A2,...,AN],B=[B1,B2,...,BN]分別代表高分辨率視頻和低分辨率視頻的訓練樣本;N為訓練樣本的總數;對A執行下采樣和平滑操作產生與B具有相同分辨率的圖像集;O=[O1,...,Ok,...,OC]為C個模擬的低分辨率視頻,C代表攝像頭A的樣本下采樣比例的數目;
Ok=[Ok,1,...,Ok,2,...,Ok,N]表示采用第k個下采樣率獲得的模擬低分辨率樣本集合;
學習一對字典用于不同分辨率視頻的表示;X表示字典DH上A的編碼系數矩陣,Zk為字典DL上Ok的系數矩陣,Y為字典DH上B的系數矩陣;DH和DL為高分辨率視頻和低分辨率視頻對應的字典;
攝像頭A捕獲的高分辨率視頻為gallery集,攝像頭B捕獲的低分辨率視頻為probe集;半耦合映射項如下:
其中P代表高分辨率和模擬低分辨率視頻編碼系數之間的半耦合映射矩陣,對低分辨率造成的信息損失進行補充;
步驟二中,視頻重構誤差項如下:
其中W,W′,V代表高分辨率,模擬低分辨率和低分辨率樣本的非對稱視頻內映射;每個人的特征集中包含許多變量,非對稱視頻內映射的作用就是使得這些變量的影響最小,建模公式如下:
其中μi表示第i個行人視頻特征集的中心,μi,k表示第k個模擬低分辨率視頻集中第i個行人視頻特征集的中心;是Ai的第j個特征向量,同理是Ok,i的第j個特征向量,是Bi的第j個特征向量;
對重構的視頻特征,鑒別保真項如下:
其中<i,j>∈S表示第i個元素和第j個元素屬于同一行人,<i,j>∈D表示兩個元素屬于不同行人;β為調整參數;學習到的映射P使得B中低分辨率特征系數重構后與A中高分辨率特征系數更近;
最后的PSDPL的目標函數同時結合視頻重構誤差,視頻內映射和半耦合映射矩陣,如下:
其中為正則化項,將編碼系數、視頻內映射及映射矩陣正則化;α,η,θ,λ為平衡因子;I為單位矩陣;
步驟三中,當其余變量固定時,目標函數對于變量集合中每一個變量是凸的,利用交替迭代優化目標函數;公式(5)的目標函數分為4個子問題,即更新視頻內映射W、W′和V,更新編碼系數X、Z和Y,更新字典對DH和DL,更新稀疏表示系數間的映射矩陣P的4個子問題;
視頻內的映射W、W′和V更新時,其他變量不變時,對于W,W′,V,公式(5)的目標函數分別寫為:
對W求導,公式(6)的解為:
W′,V的解與W類似;
編碼系數X、Z和Y更新時,移除系數X之外的其他參數,公式(5)中目標函數簡化為:
公式(10)的解可通過將對Xi求導并設為0求解,Zk的解與Xi類似,Xi的解:
對于Yi,公式(5)中目標函數簡化為:
公式(10)的解通過將對Yi求導并設為0求解,Xi的解:
更新字典DH和DL時,其他變量固定,目標函數簡化為:
公式(14)和公式(15)通過ADMM算法求解;
更新視頻稀疏表示間的映射矩陣P時,其他變量不變,僅考慮P,目標函數寫為:
對P求導并設為0,求解得:
目標函數的優化流程如下:
輸入:高分辨率視頻和模擬的低分辨率視頻的時空特征集A和O,低分辨率視頻的時空特征集B;
初始化DH,DL,P,W,W′和V;參數α,β,λ,θ和η;
迭代下面步驟直到收斂:
1):固定其他變量,分別使用公式(6)、(7)和(8),更新W、W′和V;
2):固定其他變量,根據公式(11)和(13),更新X和Y;Zk的更新與X類似;
3):固定其他變量,使用公式(14)和(15)更新DH和DL;
4):固定其他變量,使用公式(17)更新映射矩陣P;
5)輸出:視頻內映射W和V、字典對DH,DL和映射矩陣P。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東石油化工學院,未經廣東石油化工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910324340.2/1.html,轉載請聲明來源鉆瓜專利網。





