[發(fā)明專利]動畫生成方法和裝置在審

申請?zhí)枺?/td>	201811037239.0	申請日：	2018-09-06
公開（公告）號：	CN110880198A	公開（公告）日：	2020-03-13
發(fā)明（設(shè)計）人：	陳昌濱;卞衍堯;傅宇韜	申請（專利權(quán)）人：	百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司
主分類號：	G06T13/40	分類號：	G06T13/40
代理公司：	北京英賽嘉華知識產(chǎn)權(quán)代理有限責(zé)任公司 11204	代理人：	王達(dá)佐;馬曉亞
地址：	100085 北京市***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	動畫生成方法裝置
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本申請實施例公開了動畫生成方法和裝置。所述方法的一實施例包括：響應(yīng)于接收到輸入文本，獲取輸入文本的動畫標(biāo)簽，并得到輸入文本中的詞和動作之間的對應(yīng)關(guān)系；生成與輸入文本對應(yīng)的語音；將基于所得到的對應(yīng)關(guān)系對預(yù)設(shè)的人物形象的模型進行渲染生成的視頻和所生成的語音合并，生成人物形象的動畫。該實現(xiàn)方式可以使得生成的動畫中，人物形象的動作能夠自然而準(zhǔn)確地體現(xiàn)輸入文本所表達(dá)的含義。

技術(shù)領(lǐng)域

本申請實施例涉及多媒體領(lǐng)域，具體涉及計算機視覺領(lǐng)域，尤其涉及動畫生成方法和裝置。

背景技術(shù)

隨著人工智能技術(shù)的發(fā)展，越來越多的可與人語音交互的智能產(chǎn)品問世。但是這些產(chǎn)品都缺乏直觀的交互形象，在交互過程中用戶只能聽到聲音。如果在智能產(chǎn)品中加入動畫形象，可以讓用戶產(chǎn)生與自然人交流相似的感覺，能夠提升用戶的體驗。為了達(dá)到讓用戶產(chǎn)生與自然人交流的感覺，需要在可交互的設(shè)備上實時的產(chǎn)生生動的形象，需要自然的表情、動作以及相應(yīng)的與聲音同步的口型動畫。

現(xiàn)有的動畫制作方式，通常需要對于人物的聲音，唇動，表情和動作的設(shè)計需要進行逐幀的繪制和設(shè)計。在3D(three dimensional，三維)動畫的制作過程中，對于聲音和畫面結(jié)合的方式的是通過配音后進行動畫調(diào)整，或者根據(jù)動畫進行配音的。此外，人物形象的動作、表情和唇部動作均需要通過動畫師進行逐幀繪制，需要大量的勞動和時間成本。

發(fā)明內(nèi)容

本申請實施例提出了動畫生成方法和裝置。

第一方面，本申請實施例提供了一種動畫生成方法，包括：響應(yīng)于接收到輸入文本，獲取輸入文本的動畫標(biāo)簽，并得到輸入文本中的詞和動作之間的對應(yīng)關(guān)系；生成與輸入文本對應(yīng)的語音；將基于所得到的對應(yīng)關(guān)系對預(yù)設(shè)的人物形象的模型進行渲染生成的視頻和所生成的語音合并，生成人物形象的動畫。

在一些實施例中，生成與輸入文本對應(yīng)的語音包括：解析輸入文本生成音素序列；基于所生成的音素序列，合成得到與輸入文本對應(yīng)的語音。

在一些實施例中，生成與輸入文本對應(yīng)的語音還包括：確定與音素序列對應(yīng)的口型系數(shù)序列；基于所得到的對應(yīng)關(guān)系和語音，對預(yù)設(shè)的人物形象進行渲染，生成人物形象的動畫進一步包括：將基于所得到的對應(yīng)關(guān)系和口型系數(shù)序列對預(yù)設(shè)的人物形象的模型進行渲染生成的視頻，以及所生成的語音合并，生成人物形象的動畫。

在一些實施例中，響應(yīng)于接收到輸入文本，獲取輸入文本的動畫標(biāo)簽，并得到輸入文本中的詞和動作之間的對應(yīng)關(guān)系包括：將輸入文本輸入預(yù)先訓(xùn)練的動畫標(biāo)簽獲取模型，以得到輸入文本中的詞和動畫標(biāo)簽之間的對應(yīng)關(guān)系；基于輸入文本中的詞和動畫標(biāo)簽之間的對應(yīng)關(guān)系，生成動作系數(shù)序列，并將動作系數(shù)序列作為輸入文本中的詞和動作之間的對應(yīng)關(guān)系。

在一些實施例中，動畫標(biāo)簽包括表情標(biāo)簽和動作標(biāo)簽，動畫標(biāo)簽獲取模型包括情感預(yù)測子模型和動作預(yù)測子模型，將輸入文本輸入預(yù)先訓(xùn)練的動畫標(biāo)簽獲取模型，以得到輸入文本中的詞和動畫標(biāo)簽之間的對應(yīng)關(guān)系包括：將輸入文本輸入至預(yù)先訓(xùn)練的情感預(yù)測子模型，得到輸入文本所包含的詞和詞的情感傾向的對應(yīng)關(guān)系；基于輸入文本所包含的詞和詞的情感傾向的對應(yīng)關(guān)系確定輸入文本所包含的詞和預(yù)設(shè)表情標(biāo)簽之間的對應(yīng)關(guān)系；將輸入文本所包含的詞和詞的預(yù)設(shè)表情標(biāo)簽之間的對應(yīng)關(guān)系，輸入動作預(yù)測子模型，以得到動作系數(shù)序列，其中，動作系數(shù)序列用于指示輸入文本所包含的詞和詞的動作標(biāo)簽之間的對應(yīng)關(guān)系。

在一些實施例中，動作標(biāo)簽所指示的動作包括四肢動作、軀干動作和頭部動作中的至少一者。

在一些實施例中，生成與輸入文本對應(yīng)的語音進一步包括：將輸入文本輸入預(yù)先建立的語音口型生成模型，得到與輸入文本對應(yīng)的語音和口型系數(shù)序列。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司，未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811037239.0/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：垃圾清運車及車用篷布覆蓋機構(gòu)
下一篇：一種電子紅包檢測方法、系統(tǒng)及終端設(shè)備

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06T 一般的圖像數(shù)據(jù)處理或產(chǎn)生
G06T13-00 動畫制作
G06T13-20 .3D［三維］動畫
G06T13-80 .2D［二維］動畫，如使用精靈sprites
G06T13-40 ..關(guān)于角色的，例如：人類、動物或虛幻人物
G06T13-60 ..關(guān)于自然景觀的，例如：雨、雪、水或植物

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】