[發(fā)明專利]一種視頻生成方法、裝置、服務(wù)器及存儲介質(zhì)在審

申請?zhí)枺?/td>	202111109871.3	申請日：	2021-09-22
公開（公告）號：	CN113901894A	公開（公告）日：	2022-01-07
發(fā)明（設(shè)計(jì)）人：	楊躍;董治;雷兆恒;梅立鋒	申請（專利權(quán)）人：	騰訊音樂娛樂科技（深圳）有限公司
主分類號：	G06K9/00	分類號：	G06K9/00;G06T17/00;G10L25/57
代理公司：	廣州三環(huán)專利商標(biāo)代理有限公司 44202	代理人：	熊永強(qiáng);杜維
地址：	518000 廣東省深圳市***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種視頻生成方法裝置服務(wù)器存儲介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種視頻生成方法，其特征在于，所述方法包括：

獲取人聲音頻數(shù)據(jù)，并獲取目標(biāo)對象的人臉圖像；

根據(jù)所述人聲音頻數(shù)據(jù)生成模擬人臉表情參數(shù)，并根據(jù)所述人臉圖像生成所述目標(biāo)對象的三維人臉參數(shù)；

根據(jù)所述模擬人臉表情參數(shù)和所述三維人臉參數(shù)生成所述目標(biāo)對象的初始動(dòng)態(tài)人臉視頻；

根據(jù)所述人聲音頻數(shù)據(jù)對所述初始動(dòng)態(tài)人臉視頻中的人臉唇形進(jìn)行修正，得到目標(biāo)動(dòng)態(tài)人臉視頻；所述目標(biāo)動(dòng)態(tài)人臉視頻中的人臉唇形與所述人聲音頻數(shù)據(jù)中的人聲內(nèi)容相對應(yīng)。

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)所述人聲音頻數(shù)據(jù)生成模擬人臉表情參數(shù)，包括：

將所述人聲音頻數(shù)據(jù)輸入表情參數(shù)提取模型，基于所述表情參數(shù)提取模型對所述人聲音頻數(shù)據(jù)進(jìn)行特征轉(zhuǎn)換，得到所述人聲音頻數(shù)據(jù)的語音特征參數(shù)；

基于所述表情參數(shù)提取模型對所述語音特征參數(shù)進(jìn)行特征遷移，得到所述人聲音頻數(shù)據(jù)的目標(biāo)音頻特征；

根據(jù)所述目標(biāo)音頻特征進(jìn)行表情參數(shù)映射，得到所述模擬人臉表情參數(shù)。

3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)所述人臉圖像生成所述目標(biāo)對象的三維人臉參數(shù)，包括：

將所述人臉圖像輸入三維人臉構(gòu)建模型，以使所述三維人臉構(gòu)建模型提取所述人臉圖像中所述目標(biāo)對象的人臉關(guān)鍵點(diǎn)，并使用所述人臉關(guān)鍵點(diǎn)對所述目標(biāo)對象進(jìn)行人臉重構(gòu)，得到所述目標(biāo)對象的三維人臉參數(shù)。

4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述三維人臉參數(shù)包含所述目標(biāo)對象的初始人臉表情參數(shù)和人臉形態(tài)參數(shù)；所述人聲音頻數(shù)據(jù)具有多幀音頻數(shù)據(jù)，一幀音頻數(shù)據(jù)對應(yīng)一組所述模擬人臉表情參數(shù)；

所述根據(jù)所述模擬人臉表情參數(shù)和所述三維人臉參數(shù)生成所述目標(biāo)對象的初始動(dòng)態(tài)人臉視頻，包括：

將所述三維人臉參數(shù)中的所述初始人臉表情參數(shù)分別替換為每幀音頻數(shù)據(jù)對應(yīng)的所述模擬人臉表情參數(shù)，得到針對所述目標(biāo)對象的所述每幀音頻數(shù)據(jù)分別對應(yīng)的目標(biāo)人臉參數(shù)；

根據(jù)所述每幀音頻數(shù)據(jù)分別對應(yīng)的目標(biāo)人臉參數(shù)，生成所述每幀音頻數(shù)據(jù)分別對應(yīng)的初始人臉圖像；

根據(jù)所述每幀音頻數(shù)據(jù)分別對應(yīng)的初始人臉圖像，生成所述目標(biāo)對象的初始動(dòng)態(tài)人臉視頻。

5.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述根據(jù)所述每幀音頻數(shù)據(jù)分別對應(yīng)的初始人臉圖像，生成所述目標(biāo)對象的初始動(dòng)態(tài)人臉視頻，包括：

對所述每幀音頻數(shù)據(jù)分別對應(yīng)的初始人臉圖像進(jìn)行圖像渲染，得到所述每幀音頻數(shù)據(jù)分別對應(yīng)的渲染人臉圖像；

根據(jù)所述每幀音頻數(shù)據(jù)分別對應(yīng)的渲染人臉圖像，生成所述目標(biāo)對象的初始動(dòng)態(tài)人臉視頻。

6.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述根據(jù)所述人聲音頻數(shù)據(jù)對所述初始動(dòng)態(tài)人臉視頻中的人臉唇形進(jìn)行修正，得到目標(biāo)動(dòng)態(tài)人臉視頻，包括：

將所述人聲音頻數(shù)據(jù)和所述初始動(dòng)態(tài)人臉視頻輸入唇形修正模型；

基于所述唇形修正模型提取所述每幀音頻數(shù)據(jù)分別對應(yīng)的音頻數(shù)據(jù)特征；

根據(jù)所述每幀音頻數(shù)據(jù)分別對應(yīng)的音頻數(shù)據(jù)特征，對所述初始動(dòng)態(tài)人臉視頻中所述每幀音頻數(shù)據(jù)分別對應(yīng)的初始人臉圖像中的唇形進(jìn)行修正，得到所述每幀音頻數(shù)據(jù)分別對應(yīng)的目標(biāo)人臉圖像；

根據(jù)所述每幀音頻數(shù)據(jù)分別對應(yīng)的目標(biāo)人臉圖像生成進(jìn)行人臉唇形修正后的所述目標(biāo)動(dòng)態(tài)人臉視頻。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊音樂娛樂科技（深圳）有限公司，未經(jīng)騰訊音樂娛樂科技（深圳）有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202111109871.3/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種太白貝母引種及延長生育期的方法
下一篇：一種用于制造及檢修飛機(jī)的升降設(shè)備及組合升降系統(tǒng)

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06K 數(shù)據(jù)識別；數(shù)據(jù)表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形，例如，指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正，例如，用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的，例如，由不同形狀的各個(gè)筆畫組成的，而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理，即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合

免登錄下載普通用戶下載升級VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】