[發明專利]一種基于生成式對抗網絡的行人檢測數據擴充方法在審
| 申請號: | 202010595052.3 | 申請日: | 2020-06-28 |
| 公開(公告)號: | CN111950346A | 公開(公告)日: | 2020-11-17 |
| 發明(設計)人: | 彭瀅;吳杰 | 申請(專利權)人: | 中國電子科技網絡信息安全有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 成都九鼎天元知識產權代理有限公司 51214 | 代理人: | 管高峰 |
| 地址: | 610207 四川省成都市*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 生成 對抗 網絡 行人 檢測 數據 擴充 方法 | ||
1.一種基于生成式對抗網絡的行人檢測數據擴充方法,其特征在于,包括:
S1、搭建三層級聯生成式對抗神經網絡模型,并設定模型訓練的目標函數;每層生成式對抗神經網絡均采用BicycleGAN的結構,生成器采用殘差U-net結構,后一層的網絡的輸入為行人實例掩碼圖片和前一層網絡的輸出;
S2、訓練數據預處理;
S3、采用預處理后的數據訓練三層級聯生成式對抗神經網絡模型;
S4、通過三層級聯生成式對抗神經網絡模型完成行人檢測數據的擴充。
2.根據權利要求1所述的基于生成式對抗網絡的行人檢測數據擴充方法,其特征在于,所述S1中,搭建三層級聯生成式對抗神經網絡模型具體過程包括:
S11、構建殘差U-net結構的生成器,生成器的編碼器部分加入多尺度殘差塊,生成器的解碼器部分加入通道注意力殘差塊;所述生成器在第一層、第二層、第三層網絡中包含的基本塊個數分別為n1=12,n2=14,n3=16,在每層的第j個和第n-j個基本塊之間跳連;所述基本塊包括多尺度殘差塊和通道注意力殘差塊;
S12、基于PatchGAN的判別器進行構建判別器;
S13、基于殘差網絡構建編碼器;
S14、級聯網絡每一層采用S11、S12、S13構建的生成器、判別器和編碼器,第一層輸入的圖片分辨率為64*64,第二層為128*128,第三層為256*256;兩層生成式對抗網絡之間通過一個卷積層相連,形成三層級聯生成式對抗神經網絡;
S15、基于BicycleGAN的目標函數加入基于VGG-19的感知損失作為三層級聯生成式對抗神經網絡模型的目標函數。
3.根據權利要求2所述的基于生成式對抗網絡的行人檢測數據擴充方法,其特征在于,所述步驟11中,生成器的編碼器部分的每個中間層注入一個16維的隱層向量z,所述隱層向量z經過行人實例掩碼遮掩。
4.根據權利要求3所述的基于生成式對抗網絡的行人檢測數據擴充方法,其特征在于,所述步驟15中三層級聯生成式對抗神經網絡模型的目標函數具體為:
其中,G*,E*分別代表生成器和編碼器,Dwhole是全局判別器,Dlocal是局部判別器,和LGAN(·)分別代表BicycleGAN網絡結構中的cVAE-GAN和cLR-GAN的對抗損失目標函數;是L1損失,它使生成器的輸入盡可能與行人樣本圖片相似;也是L1損失,它使編碼器的輸出盡可能貼近高斯分布;LKL是cLR-GAN中的KL距離,LVGG是感知損失;λ、λKL、λlatent、λVGG是超參數,控制對應項的權重。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電子科技網絡信息安全有限公司,未經中國電子科技網絡信息安全有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010595052.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種高壓斷路器機構的防雨罩
- 下一篇:一種生物醫藥研磨裝置的連桿驅動機構





