[發(fā)明專利]一種基于深度對(duì)抗生成網(wǎng)絡(luò)的文本生成人臉?lè)椒?/span>有效
| 申請(qǐng)?zhí)枺?/td> | 202011099710.6 | 申請(qǐng)日: | 2020-10-13 |
| 公開(kāi)(公告)號(hào): | CN114359423B | 公開(kāi)(公告)日: | 2023-09-12 |
| 發(fā)明(設(shè)計(jì))人: | 何小海;羅曉東;張津;劉露平;卿粼波;吳小強(qiáng);滕奇志 | 申請(qǐng)(專利權(quán))人: | 四川大學(xué) |
| 主分類號(hào): | G06T11/00 | 分類號(hào): | G06T11/00;G06N3/0475;G06N3/094 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 610065 四川*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 對(duì)抗 生成 網(wǎng)絡(luò) 文本 方法 | ||
1.一種基于深度對(duì)抗生成網(wǎng)絡(luò)的文本生成人臉?lè)椒?,其特征在于包括以下步驟:
步驟一:數(shù)據(jù)集制作,在公開(kāi)人臉數(shù)據(jù)集上選取人臉圖像并對(duì)其進(jìn)行文本描述,然后將描述完成的人臉圖像和文本描述數(shù)據(jù)隨機(jī)拆分為訓(xùn)練集和測(cè)試集;
步驟二:網(wǎng)絡(luò)模型設(shè)計(jì),提出雙通道對(duì)抗生成網(wǎng)絡(luò)(Dual-channel?GenerativeAdversarial?Network,DualGAN)模型,同時(shí)引入感知損失函數(shù)(Perceptual?Loss)來(lái)引導(dǎo)網(wǎng)絡(luò)模型根據(jù)文本描述生成更逼真的人臉圖像;
步驟三:網(wǎng)絡(luò)模型參數(shù)訓(xùn)練,將步驟一中的訓(xùn)練數(shù)據(jù)集輸入到步驟二中的模型進(jìn)行訓(xùn)練,并根據(jù)中間結(jié)果不斷對(duì)網(wǎng)絡(luò)模型參數(shù)進(jìn)行調(diào)整和優(yōu)化;
步驟四:網(wǎng)絡(luò)模型性能測(cè)試,將步驟一中的測(cè)試數(shù)據(jù)集輸入到步驟三訓(xùn)練好的網(wǎng)絡(luò)模型中進(jìn)行人臉生成測(cè)試,并引入人臉相似度(Face?Similarity?Score,FSS)和人臉相似度距離(Face?Similarity?Distance,FSD)來(lái)對(duì)生成的人臉圖像進(jìn)行評(píng)價(jià)。
2.根據(jù)權(quán)利要求1所述的基于深度對(duì)抗生成網(wǎng)絡(luò)的文本生成人臉?lè)椒?,其特征在于步驟二中的網(wǎng)絡(luò)模型,采用的是三級(jí)對(duì)抗生成網(wǎng)絡(luò),第一級(jí)生成的人臉圖像分辨率大小為64×64,第二級(jí)生成的人臉圖像分辨率大小為128×128,第三級(jí)生成的人臉圖像分辨率大小為256×256,第一級(jí)采用雙通道對(duì)抗生成網(wǎng)絡(luò)(Dual-channel?Generative?AdversarialNetwork,DualGAN)模型。
3.根據(jù)權(quán)利要求1所述的基于深度對(duì)抗生成網(wǎng)絡(luò)的文本生成人臉?lè)椒?,其特征在于步驟二中將第三級(jí)對(duì)抗生成網(wǎng)絡(luò)生成的人臉圖像和對(duì)應(yīng)的原始人臉圖像編碼轉(zhuǎn)化成特征向量,并計(jì)算它們的歐式距離(Euclidean?Eetric)也即感知損失(Perceptual?Loss),將該損失函數(shù)反向傳播到網(wǎng)絡(luò)中,通過(guò)梯度下降來(lái)引導(dǎo)模型訓(xùn)練,最終提升生成的人臉圖像與原始圖像相似度。
4.根據(jù)權(quán)利要求1所述的基于深度對(duì)抗生成網(wǎng)絡(luò)的文本生成人臉?lè)椒?,其特征在于步驟四為了定量的評(píng)價(jià)提出網(wǎng)絡(luò)模型生成人臉圖像的質(zhì)量,引入人臉相似度(FaceSimilarity?Score,FSS)和人臉相似度距離(Face?Similarity?Distance,FSD)兩個(gè)評(píng)價(jià)指標(biāo)來(lái)對(duì)生成的人臉圖像進(jìn)行定量客觀的評(píng)價(jià)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川大學(xué),未經(jīng)四川大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011099710.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 農(nóng)業(yè)信息對(duì)抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源線性規(guī)劃最優(yōu)分配方法
- 基于聚類數(shù)據(jù)挖掘的對(duì)抗行為搜索算法
- 面向多種對(duì)抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對(duì)抗強(qiáng)度的對(duì)抗訓(xùn)練方法
- 對(duì)抗攻擊模型的訓(xùn)練方法及裝置
- 對(duì)抗樣本的生成方法和裝置
- 多樣本對(duì)抗擾動(dòng)生成方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算設(shè)備
- 一種無(wú)人集群協(xié)同博弈對(duì)抗的控制方法及系統(tǒng)





