[發(fā)明專利]結(jié)合風(fēng)格遷移的可控表情生成方法有效
| 申請(qǐng)?zhí)枺?/td> | 202011618332.8 | 申請(qǐng)日: | 2020-12-30 |
| 公開(公告)號(hào): | CN112767519B | 公開(公告)日: | 2022-04-19 |
| 發(fā)明(設(shè)計(jì))人: | 姬艷麗;張浩 | 申請(qǐng)(專利權(quán))人: | 電子科技大學(xué) |
| 主分類號(hào): | G06T13/40 | 分類號(hào): | G06T13/40;G06N3/04;G06N3/08 |
| 代理公司: | 成都行之專利代理事務(wù)所(普通合伙) 51220 | 代理人: | 溫利平 |
| 地址: | 611731 四川省成*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 結(jié)合 風(fēng)格 遷移 可控 表情 生成 方法 | ||
1.一種結(jié)合風(fēng)格遷移的可控表情生成方法,其特征在于,包括以下步驟:
S1:獲取若干真實(shí)人臉表情圖像和動(dòng)漫風(fēng)格人臉表情圖像,對(duì)于每個(gè)真實(shí)人臉表情圖像獲取其對(duì)應(yīng)的AU向量作為AU向量標(biāo)簽;
S2:構(gòu)建和訓(xùn)練風(fēng)格遷移模塊,包括特征編碼器1和風(fēng)格遷移解碼器,其中特征編碼器1用于對(duì)真實(shí)人臉表情圖像進(jìn)行高維語(yǔ)義特征提取,風(fēng)格遷移解碼器用于對(duì)特征編碼器1輸出的特征進(jìn)行解碼得到動(dòng)漫風(fēng)格人臉表情圖像并輸出;
對(duì)步驟S1獲取的真實(shí)人臉表情圖像和動(dòng)漫風(fēng)格人臉表情圖像進(jìn)行隨機(jī)配對(duì)作為訓(xùn)練樣本,對(duì)風(fēng)格遷移模塊進(jìn)行無(wú)監(jiān)督訓(xùn)練;
S3:構(gòu)建可控表情生成對(duì)抗網(wǎng)絡(luò),包括表情控制生成模塊和判別器模塊,其中:
表情控制生成模塊包括特征編碼器2、映射網(wǎng)絡(luò)、自適應(yīng)歸一化層、表情控制解碼器和掩碼計(jì)算層;表情控制生成模塊的輸入為風(fēng)格遷移模塊所輸出的動(dòng)漫風(fēng)格人臉表情圖像以及期望表情的AU向量,生成與該AU向量表情類別一致的動(dòng)漫風(fēng)格人臉表情圖像;其中:
特征編碼器2用于提取動(dòng)漫風(fēng)格人臉表情圖像的高維語(yǔ)義的人臉特征,輸出至自適應(yīng)歸一化層;
映射網(wǎng)絡(luò)用于對(duì)輸入的AU向量進(jìn)行解耦,將AU向量的長(zhǎng)度調(diào)整至與特征編碼器2輸出的人臉特征通道數(shù)一致,將解耦后的AU向量輸出至自適應(yīng)歸一化層;
自適應(yīng)歸一化層用于將特征編碼器2輸出的人臉特征和映射網(wǎng)絡(luò)解耦后的AU向量結(jié)合,將得到的特征輸出至表情控制解碼器;
表情控制解碼器用于對(duì)自適應(yīng)歸一化層輸出的特征進(jìn)行解碼,輸出注意力掩碼圖像A和顏色掩碼圖像C至掩碼計(jì)算層;表情控制解碼器包括上采樣網(wǎng)絡(luò)和兩層卷積網(wǎng)絡(luò),其中上采樣網(wǎng)絡(luò)用于對(duì)輸入的特征進(jìn)行上采樣,兩層卷積網(wǎng)絡(luò)分別對(duì)上采樣網(wǎng)絡(luò)得到的特征進(jìn)行卷積后分別得到注意力掩碼圖像A和顏色掩碼圖像C輸出至掩碼計(jì)算層;
掩碼計(jì)算層用于將表情控制解碼器輸出的注意力掩碼圖像A和顏色掩碼圖像C與輸入的動(dòng)漫風(fēng)格人臉表情圖像相結(jié)合,輸出與給定AU向量一致的動(dòng)漫風(fēng)格人臉表情圖像;掩碼計(jì)算層采用如下公式計(jì)算,輸出AU向量為yg的動(dòng)漫風(fēng)格人臉表情圖像
其中,表示表情控制生成模塊輸入的動(dòng)漫風(fēng)格人臉表情圖像;
判別器模塊包括AU預(yù)測(cè)器和風(fēng)格判別器,其中:
AU預(yù)測(cè)器的輸入為動(dòng)漫風(fēng)格人臉表情圖像,對(duì)該動(dòng)漫風(fēng)格人臉表情圖像的AU向量進(jìn)行預(yù)測(cè),目的是能夠準(zhǔn)確預(yù)測(cè)出動(dòng)漫風(fēng)格人臉表情圖像具有的AU向量;
風(fēng)格判別器的輸入為動(dòng)漫風(fēng)格人臉表情圖像,輸出介于0和1之間真/偽值,目的是對(duì)動(dòng)漫風(fēng)格是否逼真進(jìn)行判別;
S4:記步驟S1中真實(shí)人臉表情圖像為其AU向量標(biāo)簽為yo,將真實(shí)人臉表情圖像輸入至步驟S2中訓(xùn)練好的風(fēng)格遷移模塊,生成AU向量為yo的動(dòng)漫風(fēng)格人臉表情圖像將動(dòng)漫風(fēng)格人臉表情圖像AU向量標(biāo)簽yo和預(yù)設(shè)的期望表情的AU向量yg作為訓(xùn)練樣本,對(duì)可控表情生成對(duì)抗網(wǎng)絡(luò)進(jìn)行訓(xùn)練;在訓(xùn)練過(guò)程中,對(duì)判別器模塊和表情控制生成模塊進(jìn)行交替訓(xùn)練,具體方法為:
判別器模塊訓(xùn)練時(shí),固定住表情控制生成模塊的網(wǎng)絡(luò)權(quán)重參數(shù);每次訓(xùn)練包含兩組輸入:第一組為動(dòng)漫風(fēng)格人臉表情圖像和對(duì)應(yīng)的AU向量標(biāo)簽yo,第二組為表情控制生成模塊根據(jù)輸入的動(dòng)漫風(fēng)格人臉表情圖像和AU向量yg生成的動(dòng)漫風(fēng)格人臉表情圖像及AU向量yg;輸出為每組輸入預(yù)測(cè)的AU向量和真/偽值;然后根據(jù)預(yù)設(shè)的損失函數(shù)L計(jì)算出損失值優(yōu)化判別器模塊網(wǎng)絡(luò)參數(shù),損失函數(shù)L為:
其中,表示圖像真/偽對(duì)抗損失,其計(jì)算公式如下:
其中,E[]表示求取期望,G是表情控制生成模塊,DI指的是風(fēng)格判別器;是AU向量標(biāo)簽為yo的動(dòng)漫風(fēng)格人臉表情圖像,yg指的是期望的AU向量;表示表情控制生成模塊G根據(jù)輸入的圖像和AU向量yg生成的動(dòng)漫風(fēng)格人臉表情圖像DI是為了從風(fēng)格上區(qū)分出表情控制生成模塊G的輸入和輸出圖像,其輸出值DI()表示風(fēng)格判別器DI根據(jù)動(dòng)漫風(fēng)格人臉表情圖像所預(yù)測(cè)的真/偽值,DI()是0到1之間的概率值,越接近0則表示該圖像的風(fēng)格與輸入的越不相似;
表示生成動(dòng)漫風(fēng)格人臉表情圖像時(shí)的注意力掩碼損失,根據(jù)動(dòng)漫風(fēng)格人臉表情圖像和AU向量yg生成動(dòng)漫風(fēng)格人臉表情圖像時(shí)所產(chǎn)生的注意力掩碼圖像A得到,其計(jì)算公式如下:
其中,A表示表情控制生成模塊G根據(jù)和yg輸出的注意力掩碼圖像,Ai,j表示A中像素點(diǎn)(i,j)的掩碼值,i=1,2,…,H,j=1,2,…,W;λTV是預(yù)設(shè)的超參數(shù);
表示表情約束損失,其計(jì)算公式如下:
其中,Dy()表示AU預(yù)測(cè)器根據(jù)動(dòng)漫風(fēng)格人臉表情圖像輸出的該圖像的AU預(yù)測(cè)向量,||||2表示求取二范數(shù);
表示重建損失,其計(jì)算公式如下:
其中,表示根據(jù)動(dòng)漫風(fēng)格人臉表情圖像和AU向量標(biāo)簽yo生成的動(dòng)漫風(fēng)格人臉表情圖像
λI、λA、λy、λrec是控制每部分損失相對(duì)重要程度的超參數(shù);
以最小化損失值L為目標(biāo),優(yōu)化表情控制生成模塊G的網(wǎng)絡(luò)參數(shù);以最大化損失值L為目標(biāo),優(yōu)化判別器模塊D的網(wǎng)絡(luò)參數(shù);從而完成可控表情生成對(duì)抗網(wǎng)絡(luò)的訓(xùn)練;
表情控制生成模塊訓(xùn)練時(shí),固定住判別器模塊的網(wǎng)絡(luò)權(quán)重參數(shù);每次訓(xùn)練包含兩組輸入:第一組輸入為動(dòng)漫風(fēng)格人臉表情圖像和AU向量yg,輸出生成的動(dòng)漫風(fēng)格人臉表情圖像將生成的動(dòng)漫風(fēng)格人臉表情圖像和AU向量yg輸入到判別器模塊中,預(yù)測(cè)真/偽值和AU向量;第二組輸入為表情控制生成模塊根據(jù)第一組輸入而生成的AU向量為yg的動(dòng)漫風(fēng)格人臉表情圖像及AU向量標(biāo)簽yo,輸出AU向量為yo的動(dòng)漫風(fēng)格人臉表情圖像然后根據(jù)預(yù)設(shè)的損失函數(shù)L計(jì)算出損失值優(yōu)化表情控制生成模塊網(wǎng)絡(luò)參數(shù);
S5:對(duì)于某真實(shí)人臉表情圖像,當(dāng)需要生成期望表情的動(dòng)漫風(fēng)格人臉表情圖像時(shí),將真實(shí)人臉圖像輸入至風(fēng)格遷移模塊得到動(dòng)漫風(fēng)格人臉表情圖像,將該動(dòng)漫風(fēng)格人臉表情圖像和期望表情的AU向量輸入表情控制生成模塊,得到期望表情的動(dòng)漫風(fēng)格人臉表情圖像。
2.根據(jù)權(quán)利要求1所述的可控表情生成方法,其特征在于,所述步驟S2中風(fēng)格遷移模塊采用CycleGAN網(wǎng)絡(luò)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011618332.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 圖像風(fēng)格化重建的方法和裝置
- 風(fēng)格化輸入圖像
- 圖像風(fēng)格遷移方法、裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 終端應(yīng)用風(fēng)格切換、控制方法、顯示終端、服務(wù)器及系統(tǒng)
- 圖片風(fēng)格轉(zhuǎn)換方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種面向視頻的非均勻風(fēng)格遷移方法
- 一種面向圖像的非均勻風(fēng)格遷移方法
- 圖像處理方法、遷移模型訓(xùn)練方法、裝置、介質(zhì)及設(shè)備
- 一種進(jìn)風(fēng)格柵及空調(diào)器
- 一種基于風(fēng)格與內(nèi)容解耦的圖像風(fēng)格遷移方法
- 遷移方法和裝置
- 移動(dòng)邊緣系統(tǒng)中遷移應(yīng)用方法、相關(guān)設(shè)備及系統(tǒng)
- 虛擬機(jī)的遷移方法及裝置
- 數(shù)據(jù)遷移方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 計(jì)算任務(wù)遷移方法及計(jì)算任務(wù)遷移器
- 文件遷移方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于遷移工具的國(guó)產(chǎn)化應(yīng)用系統(tǒng)遷移方法
- 數(shù)據(jù)遷移方法及裝置
- 文件遷移方法及裝置
- 一種數(shù)據(jù)遷移方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)





