[發(fā)明專利]一種基于數(shù)據(jù)增強(qiáng)的深度哈希行人重識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 201910927206.1 | 申請(qǐng)日: | 2019-09-27 |
| 公開(公告)號(hào): | CN110852152A | 公開(公告)日: | 2020-02-28 |
| 發(fā)明(設(shè)計(jì))人: | 印鑒;藍(lán)海珊 | 申請(qǐng)(專利權(quán))人: | 中山大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司 44102 | 代理人: | 劉俊 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 數(shù)據(jù) 增強(qiáng) 深度 行人 識(shí)別 方法 | ||
1.一種基于數(shù)據(jù)增強(qiáng)的深度哈希行人重識(shí)別方法,其特征在于,包括以下步驟:
S1:對(duì)原始數(shù)據(jù)集圖片進(jìn)行K-means聚類,建立深度卷積生成對(duì)抗網(wǎng)絡(luò)分別對(duì)n組聚類圖片生成n組無標(biāo)簽行人圖片;
S2:建立深度哈希卷積神經(jīng)網(wǎng)絡(luò),建立三元組損失和均值標(biāo)簽平滑損失函數(shù);
S3:將原始圖片和生成圖片一起送入網(wǎng)絡(luò)中訓(xùn)練,并在測試集上進(jìn)行測試。
2.根據(jù)權(quán)利要求1所述的基于數(shù)據(jù)增強(qiáng)的深度哈希行人重識(shí)別方法,其特征在于,所述步驟S1的具體過程是:
S11:對(duì)k類原始數(shù)據(jù)集圖片,放入在ImageNet上預(yù)訓(xùn)練好的Resnet50網(wǎng)絡(luò)中,先隨機(jī)選取n個(gè)中心點(diǎn)即n張圖片,遍歷所有提取到的圖片特征,通過計(jì)算其他圖片特征到中心點(diǎn)特征的歐式距離將每個(gè)圖片特征劃分到最近的中心點(diǎn)中,計(jì)算每個(gè)聚類的平均值,并作為新的中心點(diǎn),一共迭代40-60次左右將原始數(shù)據(jù)集圖片聚類為n個(gè)類;
其中,Imagenet是一個(gè)包含2萬多個(gè)類別,有1400多萬幅張圖片的數(shù)據(jù)集,是目前深度學(xué)習(xí)圖像領(lǐng)域算法性能檢驗(yàn)的“標(biāo)準(zhǔn)”數(shù)據(jù)集,用于預(yù)訓(xùn)練Resnet50網(wǎng)絡(luò),直接用Imagenet數(shù)據(jù)集預(yù)訓(xùn)練好的Resnet50網(wǎng)絡(luò)作為基網(wǎng)絡(luò),Resnet50是深度卷積神經(jīng)網(wǎng)絡(luò),哈希指的是在實(shí)驗(yàn)最后將實(shí)數(shù)值特征映射到了哈希維度的特征,即01特征;
S12:建立一個(gè)生成器網(wǎng)絡(luò)G和一個(gè)判別器網(wǎng)絡(luò)D;
S13:在G、D中,除G網(wǎng)絡(luò)的輸出層和D網(wǎng)絡(luò)的輸入層,其他層均使用批量規(guī)范化幫助模型收斂,損失函數(shù)為V(D,G)=Ex~Pdata(x)[lnD(x)]+Ez~Pz(z)[ln(1-D(G(z)))],其中Ex~Pdata(x)表示在訓(xùn)練數(shù)據(jù)x中取得真實(shí)樣本,Ez~Pz(z)表示從已知的噪聲分布中提取的樣本,x表示真實(shí)圖片,z表示輸入G網(wǎng)絡(luò)的噪聲,G(z)表示G網(wǎng)絡(luò)生成的圖片,D(x)表示D網(wǎng)絡(luò)判斷真實(shí)圖片為真實(shí)的概率,D(G(z))表示D網(wǎng)絡(luò)判斷G生成的圖片為真實(shí)的概率,G希望自己生成的圖片越接近真實(shí)越好,即D(G(z))盡可能得大,希望V(D,G)越小越好,D希望D(x)越大,D(G(z))越小,希望V(D,G)越大越好;
S14:使用梯度下降法,在每個(gè)epoch的每batchsize張圖片訓(xùn)練中,對(duì)D網(wǎng)絡(luò)參數(shù)更新一次后,固定D網(wǎng)絡(luò),對(duì)G網(wǎng)絡(luò)參數(shù)更新兩次,以避免D網(wǎng)絡(luò)的loss為0,即對(duì)D和G交替做優(yōu)化訓(xùn)練,在30個(gè)epoch之后停止訓(xùn)練;
S15:該深度卷積生成對(duì)抗網(wǎng)絡(luò)先對(duì)整個(gè)原始數(shù)據(jù)集進(jìn)行訓(xùn)練,在整個(gè)數(shù)據(jù)集訓(xùn)練得到的模型基礎(chǔ)上再分別用每組聚類得到的圖片進(jìn)行訓(xùn)練,訓(xùn)練得到n個(gè)模型,再用生成器網(wǎng)絡(luò)G對(duì)應(yīng)生成n組圖片,得到n組用于數(shù)據(jù)增強(qiáng)的圖片。
3.根據(jù)權(quán)利要求2所述的基于數(shù)據(jù)增強(qiáng)的深度哈希行人重識(shí)別方法,其特征在于,所述步驟S12中建立一個(gè)生成器網(wǎng)絡(luò)G的過程是:
G網(wǎng)絡(luò)的輸入是batchsize個(gè)N維的隨機(jī)噪聲向量,先通過一個(gè)全連接層轉(zhuǎn)化為4x4x1024向量,在reshape成4x4x1024矩陣后通過四層反卷積進(jìn)行上采樣,并逐漸減少通道數(shù),最后得到batchsize張64x64x3大小的圖片,最后的輸出層使用tanh激活函數(shù),其余層使用relu激活函數(shù)。
4.根據(jù)權(quán)利要求3所述的基于數(shù)據(jù)增強(qiáng)的深度哈希行人重識(shí)別方法,其特征在于,所述步驟S12中建立一個(gè)判別器網(wǎng)絡(luò)D的過程是:
D網(wǎng)絡(luò)的輸入是batchsize張64x64x3大小的圖片,通過四個(gè)卷積層得到4x4x1024矩陣,在flatten成4x4x1024向量之后經(jīng)過一個(gè)全連接層得到batchsize維向量,最后將得到的batchsize維特征值送入sigmoid函數(shù),輸出值小于等于0.5則判別為假圖片,大于0.5則判別為真圖片,在D網(wǎng)絡(luò)中所有層都使用LeakyReLU激活函數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中山大學(xué),未經(jīng)中山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910927206.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 增強(qiáng)片及增強(qiáng)方法
- 圖像增強(qiáng)設(shè)備和圖像增強(qiáng)方法
- 圖像增強(qiáng)裝置、圖像增強(qiáng)方法
- 粉狀增強(qiáng)減水劑及摻有粉狀增強(qiáng)減水劑的增強(qiáng)水泥
- 增強(qiáng)片、增強(qiáng)構(gòu)件、增強(qiáng)套件、增強(qiáng)片的制造方法及增強(qiáng)構(gòu)件的制造方法
- 增強(qiáng)片、增強(qiáng)構(gòu)件、增強(qiáng)套件、增強(qiáng)片的制造方法及增強(qiáng)構(gòu)件的制造方法
- 使用增強(qiáng)模型的增強(qiáng)現(xiàn)實(shí)系統(tǒng)
- 增強(qiáng)片及增強(qiáng)結(jié)構(gòu)體
- 圖像增強(qiáng)方法和圖像增強(qiáng)裝置
- 增強(qiáng)現(xiàn)實(shí)鏡片、增強(qiáng)現(xiàn)實(shí)眼鏡及增強(qiáng)現(xiàn)實(shí)成像方法





