[發(fā)明專利]一種臉部驅(qū)動和直播方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110756772.8 | 申請日: | 2021-07-05 |
| 公開(公告)號: | CN113486787A | 公開(公告)日: | 2021-10-08 |
| 發(fā)明(設(shè)計(jì))人: | 林哲 | 申請(專利權(quán))人: | 廣州虎牙科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08;G06T7/55;G06T15/00;H04N5/265;H04N21/2187;H04N21/234;H04N21/426;H04N21/44;H04N21/4788 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 李彩玲 |
| 地址: | 511400 廣東省廣州市番禺*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 臉部 驅(qū)動 直播 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲 介質(zhì) | ||
1.一種臉部驅(qū)動方法,其特征在于,包括:
獲取源圖像和驅(qū)動圖像,源圖像和驅(qū)動圖像中包括不同對象的臉部數(shù)據(jù);
根據(jù)在源圖像中提取的臉部外觀特征,以及在驅(qū)動圖像中提取的臉部姿態(tài)表情特征,合成得到至少一張合成臉部圖像;
根據(jù)各合成臉部圖像的臉部特征,以及源圖像的背景特征,合成得到目標(biāo)驅(qū)動圖像。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)在源圖像中提取的臉部外觀特征,以及在驅(qū)動圖像中提取的臉部姿態(tài)表情特征,合成得到至少一張合成臉部圖像,包括:
將源圖像和驅(qū)動圖像分別輸入至臉部重建網(wǎng)絡(luò)中,獲取源圖像中的臉部形狀向量集和臉部紋理向量集,并獲取驅(qū)動圖像中的臉部表情向量集和臉部角度向量集;
將臉部形狀向量集、臉部紋理向量集、臉部表情向量集和臉部角度向量集共同輸入至臉部渲染模型中,獲取臉部渲染模型合成得到的合成臉部渲染圖像和合成臉部深度圖像。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)各合成臉部圖像的臉部特征,以及源圖像的背景特征,合成得到目標(biāo)驅(qū)動圖像,包括:
將源圖像輸入至預(yù)先訓(xùn)練的特征編碼器中,獲取源圖像的背景特征編碼;
將各合成臉部圖像以及所述背景特征編碼共同輸入至預(yù)先訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型中,獲取神經(jīng)網(wǎng)絡(luò)模型合成得到的目標(biāo)驅(qū)動圖像;
其中,特征編碼器和神經(jīng)網(wǎng)絡(luò)模型使用相同的訓(xùn)練樣本集,以無監(jiān)督的方式共同訓(xùn)練得到,訓(xùn)練樣本包括:源樣本圖像和驅(qū)動樣本圖像,源樣本圖像和驅(qū)動樣本圖像中的臉部數(shù)據(jù)所屬的對象相同或不同。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述神經(jīng)網(wǎng)絡(luò)模型為Unet神經(jīng)網(wǎng)絡(luò)模型;
所述Unet神經(jīng)網(wǎng)絡(luò)模型包括:相連的神經(jīng)網(wǎng)絡(luò)編碼器以及神經(jīng)網(wǎng)絡(luò)解碼器,所述特征編碼器的輸出端與所述神經(jīng)網(wǎng)絡(luò)解碼器的輸入端相連;各合成臉部圖像輸入至神經(jīng)網(wǎng)絡(luò)編碼器的輸入端;
所述神經(jīng)網(wǎng)絡(luò)編碼器,用于生成各合成臉部圖像的臉部特征,并傳輸至所述神經(jīng)網(wǎng)絡(luò)解碼器;
所述神經(jīng)網(wǎng)絡(luò)解碼器,用于根據(jù)各合成臉部圖像的臉部特征以及源圖像的背景特征編碼,合成得到的目標(biāo)驅(qū)動圖像。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,在根據(jù)各合成臉部圖像的臉部特征,以及源圖像的背景特征,合成得到目標(biāo)驅(qū)動圖像之前,還包括:
在訓(xùn)練樣本集中依次獲取當(dāng)前訓(xùn)練樣本,并獲取當(dāng)前訓(xùn)練樣本中的當(dāng)前源樣本圖像以及當(dāng)前驅(qū)動樣本圖像;
采用所述臉部重建網(wǎng)絡(luò)和所述臉部渲染模型,獲取與所述當(dāng)前源樣本圖像以及當(dāng)前驅(qū)動樣本圖像對應(yīng)的當(dāng)前合成臉部渲染圖像和當(dāng)前合成臉部深度圖像;
采用當(dāng)前訓(xùn)練的所述特征編碼器和所述神經(jīng)網(wǎng)絡(luò)模型,根據(jù)當(dāng)前合成臉部渲染圖像和當(dāng)前合成臉部深度圖像,合成得到當(dāng)前目標(biāo)驅(qū)動圖像;
根據(jù)將當(dāng)前目標(biāo)驅(qū)動圖像重新輸入至所述臉部重建網(wǎng)絡(luò)和所述特征編碼器得到的結(jié)果,計(jì)算得到目標(biāo)損失函數(shù);
使用目標(biāo)損失函數(shù)對所述特征編碼器和所述神經(jīng)網(wǎng)絡(luò)模型進(jìn)行參數(shù)調(diào)整后,返回執(zhí)行在訓(xùn)練樣本集中依次獲取當(dāng)前訓(xùn)練樣本的操作,直至滿足結(jié)束訓(xùn)練條件。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州虎牙科技有限公司,未經(jīng)廣州虎牙科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110756772.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 利用臉部網(wǎng)格創(chuàng)建臉部動畫的技術(shù)
- 注冊用于臉部識別的多個臉部圖像的裝置和方法
- 臉部特征點(diǎn)位置校正設(shè)備、臉部特征點(diǎn)位置校正方法以及臉部特征點(diǎn)位置校正程序
- 用于圖像中的與臉部有關(guān)的選擇和處理的圖像掩模
- 臉部朝向推定裝置及臉部朝向推定方法
- 一種臉部活體檢測、身份認(rèn)證方法及裝置
- 用于處理圖像的方法和裝置
- 臉部特征點(diǎn)定位方法及電子設(shè)備
- 臉部圖像處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)
- 基于人工智能的臉部識別方法、裝置、設(shè)備和存儲介質(zhì)





