[發(fā)明專利]一種基于循環(huán)生成式對抗網(wǎng)絡(luò)的行人圖像生成方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201711435515.4 | 申請日: | 2017-12-26 |
| 公開(公告)號: | CN108256439A | 公開(公告)日: | 2018-07-06 |
| 發(fā)明(設(shè)計)人: | 張史梁;田奇;高文;魏龍輝 | 申請(專利權(quán))人: | 北京大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京辰權(quán)知識產(chǎn)權(quán)代理有限公司 11619 | 代理人: | 劉廣達(dá) |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 遷移 生成式 對抗 圖像生成 圖像 網(wǎng)絡(luò) 數(shù)據(jù)庫 公共數(shù)據(jù)集 額外數(shù)據(jù) 函數(shù)學(xué)習(xí) 目標(biāo)應(yīng)用 魯棒 標(biāo)注 場景 風(fēng)格 身份 | ||
本發(fā)明提供了一種基于循環(huán)生成式對抗網(wǎng)絡(luò)的行人圖像生成方法及系統(tǒng),包括如下步驟:遷移函數(shù)學(xué)習(xí),生成人物遷移生成式對抗網(wǎng)絡(luò);基于所述人物遷移生成式對抗網(wǎng)絡(luò),完成所述行人圖像中的人物遷移,將一個數(shù)據(jù)庫中的行人圖像遷移到另一個數(shù)據(jù)庫中,生成新的行人圖像。所述遷移函數(shù)包括風(fēng)格損失和身份損失。與傳統(tǒng)方法相比,本發(fā)明在眾多行人再識別公共數(shù)據(jù)集上取得了很好的遷移效果,可以在無需額外數(shù)據(jù)標(biāo)注的前提下,在目標(biāo)應(yīng)用場景中訓(xùn)練魯棒的行人再識別模型,并獲得較高的準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像識別技術(shù)領(lǐng)域,尤其是涉及一種基于生成式對抗網(wǎng)絡(luò)的行人圖像生成方法及系統(tǒng)。
背景技術(shù)
近年來,隨著人們對社會的公共安全越來越關(guān)注,視頻監(jiān)控系統(tǒng)大量普及。諸如機(jī)場、火車站、校園和辦公大樓等公眾場所,都亟需監(jiān)控,為安防保駕護(hù)航。面對海量的監(jiān)控視頻數(shù)據(jù),大量的人力需要投入到視頻信息的監(jiān)控與檢索中去,這種方式的效率不僅低,還造成了額外資源浪費(fèi)。如果能夠利用計算機(jī)視覺分析技術(shù),自動化監(jiān)控及分析視頻信息,必然可以極大地加快“平安城市”的建設(shè)。
行人再識別是計算機(jī)視覺的研究中關(guān)鍵的任務(wù)。一般來說,給定關(guān)于行人的一張圖片或者一段視頻,行人再識別就是在其它不重合拍攝場景下的圖片或者視頻中,將同一個人識別出來的過程。盡管相關(guān)的研究越來越受到重視,行人再識別的準(zhǔn)確率也已經(jīng)提高了不少,但仍有許多困難需要解決。由于待識別的行人圖片與原圖片拍攝于不同的相機(jī),設(shè)備的差異會給成像條件帶來誤差;不同的場景下的環(huán)境不一,對采集的數(shù)據(jù)也會產(chǎn)生不同的偏差;且光照的改變會使得同一種顏色的表現(xiàn)不同;更重要的是,行人在攝像頭下的姿態(tài)變化以及遮擋問題,都使得對同一個人的辨別難度相當(dāng)大。
行人再識別中,背景、光照、攝像機(jī)參數(shù)等因素變化往往導(dǎo)致可用的標(biāo)注數(shù)據(jù)集與目標(biāo)應(yīng)用場景數(shù)據(jù)之間存在較大差異。直接使用此類標(biāo)注數(shù)據(jù)訓(xùn)練得到的模型在不同類型的應(yīng)用場景中性能較差。
發(fā)明內(nèi)容
為解決以上問題,本發(fā)明顯式地利用生成式模型對已標(biāo)注的行人圖像數(shù)據(jù)進(jìn)行遷移,使得遷移后的數(shù)據(jù)符合目標(biāo)應(yīng)用場景中的數(shù)據(jù)特點,從而使遷移后的數(shù)據(jù)可以更有效的應(yīng)用于目標(biāo)場景中的模型訓(xùn)練任務(wù)。
根據(jù)本發(fā)明的一個方面,提供了一種基于循環(huán)生成式對抗網(wǎng)絡(luò)的行人圖像生成方法,包括如下步驟:
遷移函數(shù)學(xué)習(xí),生成人物遷移生成式對抗網(wǎng)絡(luò);
基于所述人物遷移生成式對抗網(wǎng)絡(luò),完成所述行人圖像中的人物遷移,將一個數(shù)據(jù)庫中的行人圖像遷移到另一個數(shù)據(jù)庫中,生成新的行人圖像。
優(yōu)選的,所述遷移函數(shù)包括風(fēng)格損失和身份損失。
優(yōu)選的,所述人物遷移生成式對抗網(wǎng)絡(luò)的目標(biāo)函數(shù)為:
其中,表示風(fēng)格損失,表示身份損失,λ1表示兩種損失之間的交換系數(shù)。
優(yōu)選的,所述風(fēng)格損失為:
其中,表示標(biāo)準(zhǔn)對抗損失,表示循環(huán)一致性損失,G表示從數(shù)據(jù)集A到B的風(fēng)格映射函數(shù),而表示從數(shù)據(jù)集B到A的風(fēng)格映射函數(shù),DA和DB分別表示A和B的風(fēng)格鑒別器,λ2表示交換系數(shù)。
優(yōu)選的,所述風(fēng)格鑒別器DA、DB分別由數(shù)據(jù)集A、B內(nèi)的未標(biāo)簽人物圖像訓(xùn)練得到。
優(yōu)選的,所述身份損失為:
其中,G(a)表示從圖像a中遷移到數(shù)據(jù)集B的人物圖像,表示從圖像b中遷移到數(shù)據(jù)集A的人物圖像,M(a)表示圖像a的前景模板,M(b)表示圖像b的前景模板,表示從數(shù)據(jù)集A中采樣出的圖像a的數(shù)學(xué)期望,表示從數(shù)據(jù)集B中采樣出的圖像b的數(shù)學(xué)期望。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京大學(xué),未經(jīng)北京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711435515.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種菧類化合物甲基樹豆酮酸A的合成方法
- 一種菧類化合物樹豆酮酸A的合成方法
- 醫(yī)學(xué)經(jīng)驗總結(jié)模型的建立方法、裝置
- 生成式對抗網(wǎng)絡(luò)裝置及訓(xùn)練方法
- 一種基于生成式對抗網(wǎng)絡(luò)的開放式問題自動生成方法
- 文本摘要的生成方法、訓(xùn)練方法、裝置、設(shè)備及介質(zhì)
- 用于低劑量PET重建的多任務(wù)學(xué)習(xí)型生成式對抗網(wǎng)絡(luò)生成方法及系統(tǒng)
- 基于徑向基函數(shù)的氣動建模生成式對抗網(wǎng)絡(luò)模型訓(xùn)練方法
- 一種文本生成摘要方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)
- 里德-所羅門編碼裝置
- 農(nóng)業(yè)信息對抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源線性規(guī)劃最優(yōu)分配方法
- 基于聚類數(shù)據(jù)挖掘的對抗行為搜索算法
- 面向多種對抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對抗強(qiáng)度的對抗訓(xùn)練方法
- 對抗攻擊模型的訓(xùn)練方法及裝置
- 對抗樣本的生成方法和裝置
- 多樣本對抗擾動生成方法、裝置、存儲介質(zhì)和計算設(shè)備
- 一種無人集群協(xié)同博弈對抗的控制方法及系統(tǒng)





