[發(fā)明專利]一種基于視覺詞袋模型的行人重識別方法有效
| 申請?zhí)枺?/td> | 201810307805.9 | 申請日: | 2018-04-08 |
| 公開(公告)號: | CN108509925B | 公開(公告)日: | 2020-04-14 |
| 發(fā)明(設(shè)計(jì))人: | 張?jiān)浦?/a>;劉一秀;李瑞龍;王松;史維東;孫立波;劉雙偉 | 申請(專利權(quán))人: | 東北大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62 |
| 代理公司: | 北京易捷勝知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11613 | 代理人: | 韓國勝 |
| 地址: | 110169 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 視覺 模型 行人 識別 方法 | ||
1.一種基于視覺詞袋模型的行人重識別方法,其特征在于,包括:
步驟101、提取每張圖像的局部區(qū)域的行人特征;
步驟102、獲取每一個行人特征的字典和稀疏表示向量;
步驟103、依據(jù)所有行人特征的所述字典、稀疏表示向量,構(gòu)建每張圖像的視覺詞袋模型;
步驟104、采用每張圖像的視覺詞袋模型,獲取該圖像的視覺詞袋直方圖;
步驟105、將任意兩張圖像的每一個行人特征的稀疏表示向量和視覺詞袋模型進(jìn)行匹配,獲取匹配結(jié)果,所述任意兩張圖像中的一張圖像為一個攝像機(jī)中的圖像,另一張圖像為另一個攝像機(jī)中的圖像;
所述步驟101包括:采用SIFT特征提取算法和/或LOMO特征提取算法提取每張圖像的局部區(qū)域的視覺特征描述子;
所述步驟102包括:針對每張圖像的所有視覺特征描述子,采用跨視角字典學(xué)習(xí)算法對視覺特征描述子進(jìn)行處理,獲取每一個視覺特征描述子的字典和稀疏表示向量;
所述步驟103包括:利用K均值聚類算法,將字典中的特征向量進(jìn)行聚類,得到了一組相關(guān)性小于預(yù)設(shè)閾值的特征向量;基于聚類后的特征向量構(gòu)成視覺詞袋模型;
所述步驟105包括:
利用余弦距離和/或XQDA度量學(xué)習(xí)算法對圖像中提取的特征描述子進(jìn)行距離的度量;
余弦距離定義如下:
其中,Xi、Yi為兩張圖像的特征向量在第i個維度的值,n為自然數(shù);
在第一次的度量里,選取局部SIFT特征所構(gòu)建的視覺詞袋直方圖;把所有圖像按相似度排序,取前10%的圖像再次進(jìn)行度量;
前10%的圖像的局部LOMO特征,利用XQDA算法進(jìn)行度量;
XQDA算法利用少量樣本學(xué)習(xí)得到投影子空間矩陣W;
投影子空間矩陣W公式如下:
利用投影子空間矩陣將特征投影到低維子空間,利用KISSME算法得到馬氏距離度量矩陣,并采用馬氏距離的算法對前10%的圖像的距離度量,并再次按相似度排序,得到與輸入行人最相似的圖像;
XQDA距離度量公式如下:
其中,x和z表示特征向量,W為度量矩陣,∑I與∑E分別表示類內(nèi)與類間特征協(xié)方差矩陣。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟102包括:
跨視角字典學(xué)習(xí)公式:
X(1)=D(1)P(1)X(1)
X(2)=D(2)P(2)X(2)
D(1)和D(2)表示不同視角下對應(yīng)的字典模型,P(1)和P(2)對應(yīng)不同的投影矩陣;X(1)、X(2)為兩張圖像的特征向量;
在特征提取之后,獲得局部SIFT特征與局部LOMO特征,將局部SIFT特征在某一攝像機(jī)視角下的特征表達(dá)定義為X(1,1),對應(yīng)的字典與投影矩陣為D(1,1)與P(1,1);
則LOMO特征在該視角下的特征表達(dá)定義為X(1,2),對應(yīng)的字典與投影矩陣為D(1,2)與P(2,1);X(2,1),D(2,1),P(2,1),X(2,2),D(2,2),P(2,2)分別為在另一個視角下對應(yīng)的變量;
獲取跨視圖字典模型的目標(biāo)函數(shù):
s.t.||d1l(:,i)||≤1,||d2l(:,i)||≤1,i=1,...,m,l=1,2
通過最小化這個目標(biāo)函數(shù),得到各視角下的字典模型矩陣以及稀疏表示向量構(gòu)成的投影矩陣。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東北大學(xué),未經(jīng)東北大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810307805.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





