[發(fā)明專利]三維人臉的唇動(dòng)控制方法、設(shè)備和介質(zhì)在審
| 申請?zhí)枺?/td> | 202110221201.4 | 申請日: | 2021-02-26 |
| 公開(公告)號(hào): | CN113035198A | 公開(公告)日: | 2021-06-25 |
| 發(fā)明(設(shè)計(jì))人: | 郭紫垣;趙亞飛;陳超;張世昌 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號(hào): | G10L15/25 | 分類號(hào): | G10L15/25;G06K9/00;G06F40/289 |
| 代理公司: | 北京市漢坤律師事務(wù)所 11602 | 代理人: | 姜浩然;吳麗麗 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 三維 控制 方法 設(shè)備 介質(zhì) | ||
本公開提供了一種三維人臉的唇動(dòng)控制方法,涉及人工智能技術(shù)領(lǐng)域,尤其涉及深度學(xué)習(xí)和語音處理技術(shù)領(lǐng)域。實(shí)現(xiàn)方案為:首先,對目標(biāo)語音相應(yīng)的文本進(jìn)行切分,得到一個(gè)或多個(gè)字;然后,基于目標(biāo)語音的音色特征,從向量庫中獲取所述一個(gè)或多個(gè)字中每一個(gè)字相應(yīng)的第一向量,所述向量庫包括與每一個(gè)字相應(yīng)的不同于第一向量的第二向量;至少基于所述一個(gè)或多個(gè)字相應(yīng)的一個(gè)或多個(gè)第一向量,確定與所述目標(biāo)語音相應(yīng)的目標(biāo)混合系數(shù);至少基于所述目標(biāo)混合系數(shù)控制所述三維人臉的唇動(dòng),以使得所述三維人臉的唇動(dòng)適配所述目標(biāo)語音。
技術(shù)領(lǐng)域
本公開涉及人工智能技術(shù)領(lǐng)域,尤其涉及深度學(xué)習(xí)和語音處理技術(shù)領(lǐng)域,具體涉及一種三維人臉的唇動(dòng)控制方法、裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù)
人工智能是研究使計(jì)算機(jī)來模擬人的某些思維過程和智能行為(如學(xué)習(xí)、推理、思考、規(guī)劃等)的學(xué)科,既有硬件層面的技術(shù)也有軟件層面的技術(shù)。人工智能硬件技術(shù)一般包括如傳感器、專用人工智能芯片、云計(jì)算、分布式存儲(chǔ)、大數(shù)據(jù)處理等技術(shù):人工智能軟件技術(shù)主要包括計(jì)算機(jī)視覺技術(shù)、語音識(shí)別技術(shù)、自然語言處理技術(shù)以及機(jī)器學(xué)習(xí)/深度學(xué)習(xí)、大數(shù)據(jù)處理技術(shù)、知識(shí)圖譜技術(shù)等幾大方向。
根據(jù)語音生成相應(yīng)唇動(dòng)的語音唇動(dòng)擬合技術(shù),是虛擬主播、虛擬形象機(jī)器人、動(dòng)畫角色嘴型設(shè)計(jì)等應(yīng)用的基礎(chǔ)技術(shù)之一。
在此部分中描述的方法不一定是之前已經(jīng)設(shè)想到或采用的方法。除非另有指明,否則不應(yīng)假定此部分中描述的任何方法僅因其包括在此部分中就被認(rèn)為是現(xiàn)有技術(shù)。類似地,除非另有指明,否則此部分中提及的問題不應(yīng)認(rèn)為在任何現(xiàn)有技術(shù)中已被公認(rèn)。
發(fā)明內(nèi)容
本公開提供了一種三維人臉的唇動(dòng)控制方法、裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品。
根據(jù)本公開的一方面,提供了一種三維人臉的唇動(dòng)控制方法,包括:對目標(biāo)語音相應(yīng)的文本進(jìn)行切分,得到一個(gè)或多個(gè)字;基于目標(biāo)語音的音色特征,從向量庫中獲取所述一個(gè)或多個(gè)字中每一個(gè)字相應(yīng)的第一向量,所述向量庫包括與每一個(gè)字相應(yīng)的不同于第一向量的第二向量;至少基于所述一個(gè)或多個(gè)字相應(yīng)的一個(gè)或多個(gè)第一向量,確定與所述目標(biāo)語音相應(yīng)的目標(biāo)混合系數(shù);以及至少基于所述目標(biāo)混合系數(shù)控制所述三維人臉的唇動(dòng),以使得所述三維人臉的唇動(dòng)適配所述目標(biāo)語音。
根據(jù)本公開的一方面,提供了唇動(dòng)模型的訓(xùn)練方法,包括:獲取樣本用戶的樣本語音以及所述樣本語音相應(yīng)的真實(shí)混合系數(shù);對所述樣本語音相應(yīng)的文本進(jìn)行切分,得到一個(gè)或多個(gè)字;將所述一個(gè)或多個(gè)字輸入特征向量層,獲取所述特征向量層輸出的所述一個(gè)或多個(gè)字中每一個(gè)字的第三向量,所述特征向量層被配置為基于所述樣本用戶的音色特征輸出的所述一個(gè)或多個(gè)字中每一個(gè)字的第三向量,所述特征向量層能夠輸出每一個(gè)字的不同于第三向量的第四向量;至少將所述一個(gè)或多個(gè)字相應(yīng)的一個(gè)或多個(gè)第三向量輸入所述唇動(dòng)模型,并獲取所述唇動(dòng)模型輸出的預(yù)測混合系數(shù);以及基于所述真實(shí)混合系數(shù)和預(yù)測混合系數(shù)之間的損失值,調(diào)整所述唇動(dòng)模型和所述特征向量層的參數(shù)。
根據(jù)本公開的另一方面,提供了一種三維人臉的唇動(dòng)控制裝置,包括:第一文本切分模塊,被配置用于對目標(biāo)語音相應(yīng)的文本進(jìn)行切分,得到一個(gè)或多個(gè)字;第一獲取模塊,被配置用于基于目標(biāo)語音的音色特征,從向量庫中獲取所述一個(gè)或多個(gè)字中每一個(gè)字相應(yīng)的第一向量,所述向量庫包括與每一個(gè)字相應(yīng)的不同于第一向量的第二向量;確定模塊,被配置用于至少基于所述一個(gè)或多個(gè)字相應(yīng)的一個(gè)或多個(gè)第一向量,確定與所述目標(biāo)語音相應(yīng)的目標(biāo)混合系數(shù);以及控制模塊,被配置用于至少基于所述目標(biāo)混合系數(shù)控制所述三維人臉的唇動(dòng),以使得所述三維人臉的唇動(dòng)適配所述目標(biāo)語音。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110221201.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種三維彩色物品制作方法
- 三維內(nèi)容顯示的方法、裝置和系統(tǒng)
- 三維對象搜索方法、裝置及系統(tǒng)
- 三維會(huì)話數(shù)據(jù)展示方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種三維模型處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 用于基于分布式賬本技術(shù)的三維打印的去中心化供應(yīng)鏈
- 標(biāo)記數(shù)據(jù)的獲取方法及裝置、訓(xùn)練方法及裝置、醫(yī)療設(shè)備
- 一種基于5G網(wǎng)絡(luò)的光場三維浸入式體驗(yàn)信息傳輸方法及系統(tǒng)
- 用于機(jī)器人生產(chǎn)系統(tǒng)仿真的三維場景管理與文件存儲(chǔ)方法
- 基于三維形狀知識(shí)圖譜的三維模型檢索方法及裝置
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗(yàn)設(shè)備、驗(yàn)證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動(dòng)設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點(diǎn)設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





