[發(fā)明專利]一種基于模糊深度聚類的無監(jiān)督行人再識別方法在審
| 申請?zhí)枺?/td> | 201811279325.2 | 申請日: | 2018-10-30 |
| 公開(公告)號: | CN109299707A | 公開(公告)日: | 2019-02-01 |
| 發(fā)明(設(shè)計)人: | 張重;黃美艷;劉爽;石明珠 | 申請(專利權(quán))人: | 天津師范大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/08 |
| 代理公司: | 北京中政聯(lián)科專利代理事務(wù)所(普通合伙) 11489 | 代理人: | 陳超 |
| 地址: | 300387 *** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 聚類 模糊 無監(jiān)督 圖像特征提取 可靠性樣本 網(wǎng)絡(luò)模型 標簽 特征空間 圖像特征 網(wǎng)絡(luò)學習 聚類中心 特征距離 圖像分配 訓練特征 初始化 正確率 構(gòu)建 擬合 匹配 飽和 網(wǎng)絡(luò) 圖像 測試 分配 | ||
本發(fā)明實施例公開了一種基于模糊深度聚類的無監(jiān)督行人再識別方法,該方法包括:利用行人圖像特征提取網(wǎng)絡(luò)模型提取行人圖像特征;構(gòu)建模糊深度聚類網(wǎng)絡(luò)并初始化;利用模糊深度聚類網(wǎng)絡(luò)學習新的特征空間和聚類中心,為無標簽行人圖像分配模糊標簽;利用可靠性樣本對于行人圖像特征提取網(wǎng)絡(luò)模型進行訓練;交替訓練直至可靠性樣本達到飽和;利用訓練得到的行人圖像特征提取網(wǎng)絡(luò)模型提取測試行人圖像特征,通過計算特征距離得到無監(jiān)督行人再識別結(jié)果。本發(fā)明利用模糊深度聚類網(wǎng)絡(luò)學習新的特征空間,有利于復(fù)雜行人圖像的聚類和模糊標簽的分配,利用帶模糊標簽的可靠性樣本訓練特征提取網(wǎng)絡(luò),減少了過度擬合的風險,從而提高無監(jiān)督行人再識別匹配的正確率。
技術(shù)領(lǐng)域
本發(fā)明屬于計算機視覺、模式識別、人工智能技術(shù)領(lǐng)域,具體涉及一種基于模糊深度聚類的無監(jiān)督行人再識別方法。
背景技術(shù)
行人再識別(Re-identification)的目標是判斷不同攝像頭下出現(xiàn)的行人是否屬于同一行人,可以看作是圖像檢索的子問題。隨著社會的不斷發(fā)展,越來越多的攝像頭被安裝到公共場所,如:商場、小區(qū)、校園、機場等等。通過對公共場所行人的監(jiān)控,可以方便收集犯罪分子的作案過程,為警方破案提供更多的線索。同時視頻監(jiān)控對行人進行了合理約束,保障了人們的社會公共安全。由于行人圖像的拍攝角度不同、光照條件差、分辨率低、行人姿態(tài)不斷變化等原因,使得行人再識別成為目前計算機視覺領(lǐng)域一個既具有研究價值又極具挑戰(zhàn)性的熱門課題。
目前,卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)廣泛應(yīng)用于行人再識別領(lǐng)域,并且能夠有效地提高行人再識別的性能,但卷積神經(jīng)網(wǎng)絡(luò)的計算需要大量有標簽的行人圖像,而標記過程的成本非常高。為了解決這個問題,無監(jiān)督行人再識別應(yīng)運而生。無監(jiān)督行人再識別不需要行人圖像的標簽并且更接近于實際應(yīng)用。基于卷積神經(jīng)網(wǎng)絡(luò),無監(jiān)督行人再識別主要分為兩大類:第一類采用無監(jiān)督域適應(yīng)技術(shù)從源域(有標簽)和目標域(無標簽)中學習深度特征。Wang等人提出了一個可遷移模型來學習目標域的語義特征和判別性特征;Zhong等人同時考慮了相機的不變性和域連通性,以學習目標域中更廣義的深度特征。第二類通過預(yù)測無標簽行人圖像的偽標簽實現(xiàn)無監(jiān)督的行人再識別。Wu等人提出了一種動態(tài)采樣策略,逐步估計行人圖像的標簽,同時優(yōu)化深度網(wǎng)絡(luò)以此學習行人表示特征;Fan等人通過交替更新k-means聚類和CNN模型得到行人圖像標簽并學習有判別性的特征。對于復(fù)雜的行人圖像,原始的特征空間具有高度的非線性和不可分性,此外,利用k-means聚類賦予無標簽的行人圖像單一的標簽容易造成CNN的過擬合。
發(fā)明內(nèi)容
本發(fā)明的目的是要解決原始特征空間的高度非線性和不可分性以及利用k-means聚類得到單一標簽對無監(jiān)督行人再識別結(jié)果影響較大的問題,為此,本發(fā)明提供一種基于模糊深度聚類的無監(jiān)督行人再識別方法。
為了實現(xiàn)所述目的,本發(fā)明提出一種基于模糊深度聚類的無監(jiān)督行人再識別方法,所述方法包括以下步驟:
步驟S1,確定行人圖像特征提取網(wǎng)絡(luò)模型,并利用所述行人圖像特征提取網(wǎng)絡(luò)模型對于行人圖像提取行人圖像特征,其中,所述行人圖像為不帶標簽圖像;
步驟S2,構(gòu)建模糊深度聚類網(wǎng)絡(luò)并對其進行初始化;
步驟S3,利用初始化后的模糊深度聚類網(wǎng)絡(luò)學習新的特征空間和聚類中心,并為無標簽的行人圖像分配模糊標簽;
步驟S4,從帶有模糊標簽的行人圖像中確定可靠性樣本,并利用所述可靠性樣本對于所述行人圖像特征提取網(wǎng)絡(luò)模型進行訓練;
步驟S5,交替訓練所述模糊深度聚類網(wǎng)絡(luò)和行人圖像特征提取網(wǎng)絡(luò)模型直至選擇的可靠性樣本達到飽和,得到訓練完成的行人圖像特征提取網(wǎng)絡(luò)模型;
步驟S6,獲取測試行人圖像,利用訓練得到的行人圖像特征提取網(wǎng)絡(luò)模型提取所述測試行人圖像的特征,通過計算所述測試行人圖像的特征與圖庫中行人圖像的特征之間的距離即可得到無監(jiān)督行人再識別結(jié)果。
可選地,所述步驟S1包括以下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津師范大學,未經(jīng)天津師范大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811279325.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 數(shù)據(jù)處理裝置、方法和程序以及計算機可讀介質(zhì)
- 一種聲學模型訓練方法和裝置、計算機設(shè)備、存儲介質(zhì)
- 一種基于無監(jiān)督和有監(jiān)督學習的水泥游離鈣軟測量方法
- 一種基于有監(jiān)督學習和無監(jiān)督學習的反欺詐方法
- 計算機視覺訓練系統(tǒng)和用于訓練計算機視覺系統(tǒng)的方法
- 一種半監(jiān)督學習方法、系統(tǒng)、設(shè)備和存儲介質(zhì)及語義解析方法
- 一種基于無監(jiān)督或弱監(jiān)督方式的圖像分割數(shù)據(jù)標注方法及系統(tǒng)
- 網(wǎng)絡(luò)模型的訓練方法、數(shù)據(jù)處理方法、裝置、介質(zhì)及設(shè)備
- 社區(qū)劃分方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 數(shù)據(jù)標注方法及裝置





