[發(fā)明專利]一種基于語義區(qū)域測度學(xué)習(xí)的行人再識別方法有效
| 申請?zhí)枺?/td> | 201710841964.2 | 申請日: | 2017-09-18 |
| 公開(公告)號: | CN107563344B | 公開(公告)日: | 2020-07-28 |
| 發(fā)明(設(shè)計)人: | 張重;黃美艷;劉爽 | 申請(專利權(quán))人: | 天津師范大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京中政聯(lián)科專利代理事務(wù)所(普通合伙) 11489 | 代理人: | 陳超 |
| 地址: | 300387 *** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 語義 區(qū)域 測度 學(xué)習(xí) 行人 識別 方法 | ||
1.一種基于語義區(qū)域測度學(xué)習(xí)的行人再識別方法,其特征在于,所述方法包括:
步驟S1,將行人再識別兩個視角下的每幅訓(xùn)練圖像劃分為K個子區(qū)域并為每個子區(qū)域提取特征;
步驟S2,基于兩個視角下兩幅訓(xùn)練圖像不同子區(qū)域之間的關(guān)系得到三種子區(qū)域?qū)︻愋停鋈N子區(qū)域?qū)︻愋桶悆?nèi)子區(qū)域?qū)Α⑷躅悆?nèi)子區(qū)域?qū)皖愅庾訁^(qū)域?qū)Γ?/p>
步驟S3,基于每個子區(qū)域的特征向量和映射矩陣M計算得到三種子區(qū)域?qū)μ卣飨蛄恐g的差異,并將其作為三類子區(qū)域樣本并賦予三類子區(qū)域樣本對應(yīng)的標(biāo)簽;
步驟S4,基于三類子區(qū)域樣本及對應(yīng)的標(biāo)簽,學(xué)習(xí)映射矩陣M并利用優(yōu)化算法求解映射矩陣M;
步驟S5,利用映射矩陣M,計算不同視角下兩幅行人圖像子區(qū)域?qū)χg的距離;
步驟S6,基于子區(qū)域間的距離,為每個子區(qū)域在與之對應(yīng)的子區(qū)域和與之對應(yīng)的子區(qū)域的鄰近子區(qū)域中尋找最佳匹配子區(qū)域,將每個子區(qū)域與其最佳匹配子區(qū)域之間的距離作為該子區(qū)域的最佳相似度得分;
步驟S7,將兩個視角下兩幅行人圖像所有子區(qū)域的最佳相似度得分之和作為兩幅行人圖像的相似度得分;
步驟S8,在測試階段,根據(jù)步驟S1-S7求得兩個視角下任意兩幅測試圖像的相似度得分,相似度得分最高的兩幅測試圖像被認(rèn)為是相似行人圖像對,據(jù)此得到測試圖像的行人再識別結(jié)果;
所述步驟S2包括以下步驟:
步驟S21,將不同視角的同一行人的兩幅訓(xùn)練圖像的對應(yīng)子區(qū)域定義為類內(nèi)子區(qū)域?qū)Γ?/p>
步驟S22,將不同視角的同一行人的兩幅訓(xùn)練圖像的上下鄰近m個非對應(yīng)子區(qū)域定義為弱類內(nèi)子區(qū)域?qū)Γ?/p>
步驟S23,將不同視角的不同行人的兩幅訓(xùn)練圖像的對應(yīng)子區(qū)域和非對應(yīng)子區(qū)域定義為類外子區(qū)域?qū)Γ?/p>
所述步驟S3包括以下步驟:
步驟S31,計算類內(nèi)子區(qū)域?qū)Φ奶卣飨蛄吭谟成淇臻g上的差異,并將其作為正子區(qū)域樣本,其中,類內(nèi)子區(qū)域?qū)Φ奶卣飨蛄吭谟成淇臻g上的差異ΔI表示為:
其中,和表示任一類內(nèi)子區(qū)域?qū)Φ奶卣飨蛄浚琈為映射矩陣,k用于表示K個子區(qū)域中的第k個子區(qū)域,1≤k≤K;
步驟S32,計算弱類內(nèi)子區(qū)域?qū)μ卣飨蛄吭谟成淇臻g上的差異,并將其作為弱正子區(qū)域樣本,其中,弱類內(nèi)子區(qū)域?qū)μ卣飨蛄吭谟成淇臻g上的差異ΔW表示為:
其中,和表示任一弱類內(nèi)子區(qū)域?qū)Φ奶卣飨蛄浚?/p>
步驟S33,計算類外子區(qū)域?qū)μ卣飨蛄吭谟成淇臻g上的差異,并將其作為負(fù)子區(qū)域樣本,其中,類外子區(qū)域?qū)μ卣飨蛄吭谟成淇臻g上的差異ΔE表示為:
其中,和表示任一類外子區(qū)域?qū)Φ奶卣飨蛄浚?/p>
所述步驟S4包括以下步驟:
步驟S41,確定最大化互信息目標(biāo)函數(shù)Φ(M);
步驟S42,基于所述最大化互信息目標(biāo)函數(shù)Φ(M),利用貪婪軸旋轉(zhuǎn)法得到映射矩陣M;
所述步驟S41包括以下步驟:
步驟S411,確定最大化互信息目標(biāo)函數(shù)Φ(M),所述最大化互信息目標(biāo)函數(shù)Φ(M)表示為:
其中,I(﹒)是互信息,表示兩個隨機(jī)變量的依賴程度;vk是一個集合,vk∈{ΔI,ΔE},lv∈{1,-1};ek也是一個集合,ek∈{ΔW,ΔE},le∈{2,-1};ε為平衡兩種互信息的系數(shù);
步驟S412,根據(jù)熵的鏈?zhǔn)椒▌t,將所述最大化互信息目標(biāo)函數(shù)公式Φ(M)的第一項I(vk;lv)表示為:
其中,H(vk)即H(ΔI,ΔE)表示正子區(qū)域樣本ΔI和負(fù)子區(qū)域樣本ΔE的聯(lián)合熵,H(vk|lv)表示所有正、負(fù)子區(qū)域樣本的條件熵,P(lv=1)H(ΔI)表示正子區(qū)域樣本ΔI的邊緣熵,P(lv=-1)H(ΔE)表示負(fù)子區(qū)域樣本ΔE的邊緣熵;
步驟S413,假設(shè)正、負(fù)子區(qū)域樣本服從高斯分布,利用正、負(fù)子區(qū)域樣本估計H(vk)表示為:
其中,r表示子區(qū)域的特征向量投射在映射空間的維數(shù),det表示求取矩陣的行列式,表示所有正、負(fù)子區(qū)域樣本的協(xié)方差矩陣;
步驟S414,根據(jù)對H(vk)的估計,互信息I(vk;lv)可由正、負(fù)子區(qū)域樣本協(xié)方差的行列式表示為:
其中,和分別表示正、負(fù)子區(qū)域樣本的協(xié)方差矩陣,μ1和ρ分別表示正、負(fù)子區(qū)域樣本的先驗概率;
步驟S415,類似的,將所述最大化互信息目標(biāo)函數(shù)Φ(M)的第二項I(ek;le)表示為:
其中,Σle表示所有弱正子區(qū)域樣本和負(fù)子區(qū)域樣本的協(xié)方差矩陣,表示弱正子區(qū)域樣本的協(xié)方差矩陣,μ2表示弱正子區(qū)域樣本的先驗概率;
步驟S416,將最大化互信息目標(biāo)函數(shù)Φ(M)表示為:
所述步驟S42包括以下步驟:
步驟S421,在t-1次迭代時,用M(t-1)估計M(t),找到一個矩陣Y(t)∈SO(d),其中,SO(d)是d維特殊正交群,使得在第t次迭代時M(t)表示為:
M(t)=Y(jié)(t)M(t-1),
其中,矩陣Y(t)用于尋找映射矩陣M優(yōu)化迭代時的旋轉(zhuǎn)方向;
步驟S422,根據(jù)李代數(shù)(Lie algebra),將映射矩陣M的最佳旋轉(zhuǎn)方向表示為:
其中,2≤p≤d,p+1≤q≤d,β是步長,γ是搜索最優(yōu)旋轉(zhuǎn)方向的步數(shù),Bp,q是一個只有第p行第q列的元素為1,其它元素均為0的矩陣,Bq,p是一個只有第q行第p列的元素為1,其它元素均為0的矩陣,ΔΦp,q=[Φ(Yp,qM(t-1))-Φ(M(t-1))]/α,α是一個很小的正數(shù),Yp,q=exp(α(Bp,q-Bq,p));
步驟S423,迭代找到滿足下式的最優(yōu)步數(shù)γ*:
將矩陣Y(t)表示為:
得到第t次迭代時的M(t),即映射矩陣M:
M(t)=Y(jié)(t)M(t-1)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津師范大學(xué),未經(jīng)天津師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710841964.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 汽車活塞環(huán)光密封性檢測工裝
- 識別神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)源
- 分布式系統(tǒng)中多層次測度網(wǎng)絡(luò)關(guān)系構(gòu)建方法
- 識別神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)源的系統(tǒng)和方法
- 小電流接地系統(tǒng)綜合選線故障測度計算方法
- 一種城市建設(shè)水平預(yù)測系統(tǒng)
- 一種智慧城市建設(shè)測度方法
- 一種基于MATLAB軟件的深海管道綜合風(fēng)險指標(biāo)評價方法
- 一種帶有噪聲相關(guān)的非線性可觀測度分析方法
- 一種建筑工程垂直度測量裝置





