[發明專利]基于生成對抗網絡的行人重識別數據集姿態數據增廣方法有效
| 申請號: | 202011559996.1 | 申請日: | 2020-12-25 |
| 公開(公告)號: | CN112613411B | 公開(公告)日: | 2022-05-27 |
| 發明(設計)人: | 陳浩錕;龔小謹 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 林超 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 生成 對抗 網絡 行人 識別 數據 姿態 增廣 方法 | ||
1.一種基于生成對抗網絡的行人重識別數據集姿態數據增廣方法,其特征在于,包括如下步驟:
(1)對需要進行姿態數據增廣的目標場景進行圖像的采集,并標注圖像中的姿態類別,獲得訓練集,建立包含生成對抗網絡和姿態分類器的網絡;
(2)基于步驟(1)中建立的訓練集,訓練所構建的生成對抗網絡;
(3)基于步驟(1)中建立的訓練集,訓練所構建的姿態分類器;
(4)使用步驟(2)中訓練得到的生成對抗網絡中的生成器和步驟(3)中得到的姿態分類器,構建虛擬數據集,虛擬數據集包括隨機采樣的高斯向量、用高斯向量經生成對抗網絡處理獲得的圖片以及用圖片經姿態分類器處理獲得的圖片對應的姿態類別;
(5)構建編碼器,使用步驟(4)中得到的虛擬數據集,訓練所構建的編碼器;
(6)將步驟(4)得到的虛擬數據集經線性SVM算法處理后獲得超平面的法向量;
(7)訓練結束后,對于任意需要進行姿態數據增廣的目標場景的待測圖片,利用編碼器、生成對抗網絡和法向量共同進行姿態數據的增廣。
2.根據權利要求1中所述的一種基于生成對抗網絡的行人重識別數據集姿態數據增廣方法,其特征在于:所述步驟(1)中,生成對抗網絡包含了相互獨立的生成器和判別器,生成器接收隨機生成的高斯向量作為輸入,輸出初始RGB圖片;判別器接收生成器輸出的初始RGB圖片或訓練集,輸出初始RGB圖片或訓練集各自的真假標簽;姿態分類器包括分類卷積網絡結構和連續兩層全連接層,在分類卷積網絡結構的輸出端依次串聯兩層全連接層,分類卷積網絡結構接收生成器輸出的初始RGB圖片,輸出姿態標簽。
3.根據權利要求2中所述的一種基于生成對抗網絡的行人重識別數據集姿態數據增廣方法,其特征在于:所述的生成對抗網絡和姿態分類器在步驟(2)前均采用ImageNet數據集預先訓練,姿態分類器中的分類卷積網絡結構以ImageNet數據集訓練后的網絡參數作為初始值,兩層全連接層的參數初始化為標準差為0.01的正態分布。
4.根據權利要求1中所述的一種基于生成對抗網絡的行人重識別數據集姿態數據增廣方法,其特征在于:所述步驟(3)中,姿態分類器訓練時設置以下損失函數:
Loss=-yilog(xi)-(1-yi)log(1-xi)
其中,imgi為來自步驟(1)中構建的訓練集的任意圖像,yi為第i幅圖像imgi的真實姿態標簽,imgi表示訓練集中的第i幅圖像,fview為步驟(3)中所構建的姿態分類器,xi表示第i幅圖像imgi的預測姿態標簽;
整個姿態分類器的訓練通過自適應動量估計算法優化損失函數進行。
5.根據權利要求1中所述的一種基于生成對抗網絡的行人重識別數據集姿態數據增廣方法,其特征在于:所述步驟(4)中,
(4.1)以步驟(2)中訓練得到的生成對抗網絡作為工具;以隨機生成采樣自均值為0、方差為1的正態分布的一個高斯向量輸入到生成對抗網絡的生成器中,輸出獲得一幅初始RGB圖片,由高斯向量和對應的初始RGB圖片組成高斯向量-圖片對;
(4.2)以步驟(3)中訓練得到的姿態分類器作為工具,將高斯向量-圖片對中的初始RGB圖片輸入姿態分類器,輸出對應的姿態標簽,由高斯向量和對應的初始RGB圖片、姿態標簽組成高斯向量-圖片-姿態對;
(4.3)重復(4.1)過程N次,獲取N組向量-圖片對和N組高斯向量-圖片-姿態對,以N組高斯向量-圖片-姿態對作為虛擬數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011559996.1/1.html,轉載請聲明來源鉆瓜專利網。





