[發(fā)明專利]一種基于視覺詞袋模型的行人重識別方法有效
| 申請?zhí)枺?/td> | 201810307805.9 | 申請日: | 2018-04-08 |
| 公開(公告)號: | CN108509925B | 公開(公告)日: | 2020-04-14 |
| 發(fā)明(設(shè)計)人: | 張云洲;劉一秀;李瑞龍;王松;史維東;孫立波;劉雙偉 | 申請(專利權(quán))人: | 東北大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62 |
| 代理公司: | 北京易捷勝知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11613 | 代理人: | 韓國勝 |
| 地址: | 110169 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 視覺 模型 行人 識別 方法 | ||
本發(fā)明公開了一種基于視覺詞袋模型的行人重識別方法,方法包括:101、提取每張圖像的局部區(qū)域的行人特征;102、獲取每一個行人特征的字典和稀疏表示向量;103、依據(jù)所有行人特征的所述字典、稀疏表示向量,構(gòu)建每張圖像的視覺詞袋模型;104、采用每張圖像的視覺詞袋模型,獲取該圖像的視覺詞袋直方圖;105、將任意兩張圖像的每一個行人特征的稀疏表示向量和視覺詞袋模型進行匹配,獲取匹配結(jié)果,所述任意兩張圖像中的一張圖像為一個攝像機中的圖像,另一張圖像為另一個攝像機中的圖像。上述方法能夠解決Office文檔在轉(zhuǎn)換過程中文檔格式跑版的問題。上述方法能夠提高行人重識別的準確率,減少運算量。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機視覺領(lǐng)域,具體涉及一種基于視覺詞袋模型的行人重識別方法。
背景技術(shù)
行人重識別(Person Re-identification)也稱行人再識別,是利用計算機視覺技術(shù)判斷圖像或者視頻序列中是否存在特定行人的技術(shù)。其主要任務(wù)是給定一個監(jiān)控行人圖像,檢索跨設(shè)備下的該行人圖像。這種算法在智能安防刑偵工作及圖像檢索等場景中具有很高的應(yīng)用價值。由于圖像拍攝時間、地點不同,同時考慮到光線、角度、姿態(tài)的差異性,外加大規(guī)模分布式部署的監(jiān)控系統(tǒng)網(wǎng)絡(luò)的拓展所帶來的行人圖像數(shù)據(jù)庫數(shù)據(jù)量的增大,如何提高行人圖像的重識別率以及檢索效率仍舊面臨很大挑戰(zhàn)。以行人數(shù)據(jù)集規(guī)模的過大的問題為例。一方面,隨著數(shù)據(jù)量的變大,攝像機數(shù)量的增多,行人身份數(shù)據(jù)的標注愈發(fā)的困難,對算法魯棒性的要求也越來越高。另一方面,隨著數(shù)據(jù)量的增大,算法運行時間也會變長,這就對算法的效率提出了較高的要求。
因此,在大規(guī)模數(shù)據(jù)集下如何提高行人重識別率,且使得運行時間合適,算法效率高成為當前需要解決的問題。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中的問題,本發(fā)明提供一種基于視覺詞袋模型的行人重識別方法,本發(fā)明的方法能夠提高行人重識別的準確率,減少運算量。
第一方面,本發(fā)明提供一種基于視覺詞袋模型的行人重識別方法,包括:
101、提取每張圖像的局部區(qū)域的行人特征;
102、獲取每一個行人特征的字典和稀疏表示向量;
103、依據(jù)所有行人特征的所述字典、稀疏表示向量,構(gòu)建每張圖像的視覺詞袋模型;
104、采用每張圖像的視覺詞袋模型,獲取該圖像的視覺詞袋直方圖;
105、將任意兩張圖像的每一個行人特征的稀疏表示向量和視覺詞袋模型進行匹配,獲取匹配結(jié)果,所述任意兩張圖像中的一張圖像為一個攝像機中的圖像,另一張圖像為另一個攝像機中的圖像。
可選地,所述步驟101包括:
采用SIFT特征提取算法和/或LOMO特征提取算法提取每張圖像的局部區(qū)域的視覺特征描述子。
可選地,所述步驟102包括:
針對每張圖像的所有視覺特征描述子,采用跨視角字典學(xué)習(xí)算法對視覺特征描述子進行處理,獲取每一個視覺特征描述子的字典和稀疏表示向量。
可選地,所述步驟103包括:
利用K均值聚類算法,將字典中的特征向量進行聚類,得到了一組相關(guān)性小于預(yù)設(shè)閾值的特征向量;
基于聚類后的特征向量構(gòu)成視覺詞袋模型。
可選地,所述步驟105包括:
利用余弦距離和/或XQDA度量學(xué)習(xí)算法對圖像中提取的特征描述子進行距離的度量;
余弦距離定義如下:
其中,Xi、Yi為兩張圖像的特征向量在第i個維度的值,n為自然數(shù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東北大學(xué),未經(jīng)東北大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810307805.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





