[發(fā)明專利]一種基于生成式對(duì)抗網(wǎng)絡(luò)的人臉表情生成方法有效
申請(qǐng)?zhí)枺?/td> | 202110361039.6 | 申請(qǐng)日: | 2021-04-02 |
公開(公告)號(hào): | CN112990078B | 公開(公告)日: | 2022-05-10 |
發(fā)明(設(shè)計(jì))人: | 王蕊;施璠;曲強(qiáng);姜青山 | 申請(qǐng)(專利權(quán))人: | 深圳先進(jìn)技術(shù)研究院 |
主分類號(hào): | G06V40/16 | 分類號(hào): | G06V40/16;G06V20/40;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京市誠輝律師事務(wù)所 11430 | 代理人: | 耿慧敏;朱偉軍 |
地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關(guān)鍵詞: | 一種 基于 生成 對(duì)抗 網(wǎng)絡(luò) 表情 方法 | ||
1.一種基于生成式對(duì)抗網(wǎng)絡(luò)的人臉表情生成方法,包括以下步驟:
構(gòu)建深度學(xué)習(xí)網(wǎng)絡(luò)模型,該深度學(xué)習(xí)網(wǎng)絡(luò)模型包括循環(huán)神經(jīng)網(wǎng)絡(luò)、生成器、圖像判別器、第一視頻判別器和第二視頻判別器,其中循環(huán)神經(jīng)網(wǎng)絡(luò)針對(duì)輸入圖像產(chǎn)生時(shí)間相關(guān)的運(yùn)動(dòng)向量;生成器用于將循環(huán)神經(jīng)網(wǎng)絡(luò)產(chǎn)生的運(yùn)動(dòng)向量和輸入圖像作為輸入,輸出相應(yīng)的視頻幀;圖像判別器用于判斷各視頻幀的真?zhèn)危坏谝灰曨l判別器用于判斷視頻真?zhèn)尾?duì)視頻進(jìn)行分類;第二視頻判別器輔助第一視頻判別器用于控制生成視頻變化的真實(shí)性和平滑性;
利用包含不同表情類別的樣本圖像作為輸入,以設(shè)定的目標(biāo)函數(shù)為優(yōu)化目標(biāo),訓(xùn)練所述深度學(xué)習(xí)網(wǎng)絡(luò)模型;
利用經(jīng)訓(xùn)練的生成器實(shí)時(shí)生成人臉視頻;
其中,所述目標(biāo)函數(shù)設(shè)置為:
其中D包括圖像判別器、第一視頻判別器和第二視頻判別器,G是生成器,λ1、λ2、λ3、λ4是超參數(shù),limg_adv是圖像判別器的損失函數(shù),lvid_adv是第一視頻判別器的對(duì)抗損失函數(shù),lpatch_adv是第二視頻判別器的對(duì)抗損失函數(shù),lcat是生成器的分類損失函數(shù),lrec是生成器的重構(gòu)損失函數(shù);
其中,所述圖像判別器的損失函數(shù)表示為:
其中Pvideo(v)是真實(shí)視頻的分布,v[0]表示視頻v的第一幀,v[t]表示視頻的第(t+1)幀,c是目標(biāo)類別,Dimg表示圖像判別器,Pdata(x)、Pz(z)和Pc(c)分別表示x、z和c的分布,x為輸入的人臉圖像,z為隨機(jī)噪聲。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述生成器基于U-net結(jié)構(gòu)構(gòu)建,包括用于下采樣的多層卷積層,以及與所述多層卷積層對(duì)應(yīng)的多層反卷積用于實(shí)現(xiàn)上采樣。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述第一視頻判別器DV的對(duì)抗損失函數(shù)表示為:
其中,c是目標(biāo)類別,Pz(z)是隨機(jī)噪聲的分布,x為輸入的人臉圖像,v表示視頻,Pvideo(v)表示真實(shí)視頻的分布,Pdata(x)、Pz(z)和Pc(c)分別表示x、z和c的分布。
4.根據(jù)權(quán)利要求1所述的方法,其中,所述第二視頻判別器Dpatch的對(duì)抗損失函數(shù)表示為:
其中,c是目標(biāo)類別,是z為隨機(jī)噪聲,x為輸入的人臉圖像,Pvideo(v)表示真實(shí)視頻的分布,Pdata(x)、Pz(z)和Pc(c)分別表示x、z和c的分布。
5.根據(jù)權(quán)利要求1所述的方法,其中,所述生成器的分類損失函數(shù)表示為:
其中,Q是分類網(wǎng)絡(luò),c為目標(biāo)類別,z為隨機(jī)噪聲,x為輸入的人臉圖像,Pdata(x)、Pz(z)和Pc(c)分別表示x、z和c的分布,函數(shù)P表示對(duì)應(yīng)項(xiàng)的分布。
6.根據(jù)權(quán)利要求1所述的方法,其中,所述生成器的重構(gòu)損失函數(shù)表示為:
其中表示生成視頻的第一幀,x為輸入的人臉圖像,表示生成的視頻,表示的分布,Px(x)表示x的分布。
7.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其中,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)根據(jù)權(quán)利要求1至6中任一項(xiàng)所述方法的步驟。
8.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,在所述存儲(chǔ)器上存儲(chǔ)有能夠在處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述的方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳先進(jìn)技術(shù)研究院,未經(jīng)深圳先進(jìn)技術(shù)研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110361039.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 農(nóng)業(yè)信息對(duì)抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源線性規(guī)劃最優(yōu)分配方法
- 基于聚類數(shù)據(jù)挖掘的對(duì)抗行為搜索算法
- 面向多種對(duì)抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對(duì)抗強(qiáng)度的對(duì)抗訓(xùn)練方法
- 對(duì)抗攻擊模型的訓(xùn)練方法及裝置
- 對(duì)抗樣本的生成方法和裝置
- 多樣本對(duì)抗擾動(dòng)生成方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算設(shè)備
- 一種無人集群協(xié)同博弈對(duì)抗的控制方法及系統(tǒng)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置