[發(fā)明專利]用于處理信息的方法和裝置在審

申請?zhí)枺?/td>	201910058552.0	申請日：	2019-01-22
公開（公告）號：	CN109599113A	公開（公告）日：	2019-04-09
發(fā)明（設(shè)計）人：	劉驍;呂復(fù)強;王建祥;紀建超	申請（專利權(quán)）人：	北京百度網(wǎng)訊科技有限公司
主分類號：	G10L15/22	分類號：	G10L15/22;G10L21/10;H04N13/106;H04N13/172
代理公司：	北京英賽嘉華知識產(chǎn)權(quán)代理有限責(zé)任公司 11204	代理人：	王達佐;馬曉亞
地址：	100085 北京市***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	口型變化應(yīng)答語音三維立體人像方法和裝置處理信息信息控制音素序列播放信息播放信息生成用戶發(fā)送語音信息
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本公開實施例公開了用于處理信息的方法和裝置。該方法的一具體實施方式包括：基于用戶發(fā)送的語音信息，生成應(yīng)答語音信息；根據(jù)上述應(yīng)答語音信息生成音素序列；根據(jù)上述音素序列生成口型變化信息，其中，上述口型變化信息用于在上述應(yīng)答語音信息播放時，控制所顯示的三維立體人像的口型變化；播放上述應(yīng)答語音信息，以及根據(jù)上述口型變化信息控制上述三維立體人像的口型變化。該實施方式實現(xiàn)了播放應(yīng)答語音信息的同時，基于所播放的應(yīng)答語音信息控制三維立體人像的口型變化，提高了三維立體人像的擬人效果。

技術(shù)領(lǐng)域

本公開實施例涉及計算機技術(shù)領(lǐng)域，具體涉及用于處理信息的方法和裝置。

背景技術(shù)

現(xiàn)階段，智能服務(wù)已經(jīng)被應(yīng)用到了各個領(lǐng)域。例如，在智能客服的應(yīng)用場景下，用戶可以通過文字或語音來與客服機器人進行信息交互。而虛擬人像技術(shù)通過渲染三維立體人像，可以為智能服務(wù)提供更為便捷的使用體驗。舉例來說，通過使用語音識別、語音合成等技術(shù)，能夠為三維立體人像賦予對話與聆聽的能力，從而提升了用戶與三維立體人像現(xiàn)場交互的擬人度。現(xiàn)有的虛擬人像技術(shù)雖然已經(jīng)具有很高的擬人效果，但大多仍然停留在腳本化的應(yīng)用場景，例如三維游戲、CG(computer graphics，計算機動畫)電影等，只能做到按照指示的內(nèi)容對已經(jīng)設(shè)計好的動作進行響應(yīng)。

發(fā)明內(nèi)容

本公開實施例提出了用于處理信息的方法和裝置。

第一方面，本公開實施例提供了一種用于處理信息的方法，該方法包括：基于用戶發(fā)送的語音信息，生成應(yīng)答語音信息；根據(jù)上述應(yīng)答語音信息生成音素序列；根據(jù)上述音素序列生成口型變化信息，其中，上述口型變化信息用于在上述應(yīng)答語音信息播放時，控制所顯示的三維立體人像的口型變化；播放上述應(yīng)答語音信息，以及根據(jù)上述口型變化信息控制上述三維立體人像的口型變化。

在一些實施例中，上述方法還包括：獲取上述用戶發(fā)送上述語音信息時所采集的上述用戶的視頻；對于上述視頻中的視頻幀，對該視頻幀中的人臉圖像進行面部表情識別，得到表情識別結(jié)果；播放上述視頻，以及在所播放的當(dāng)前視頻幀中呈現(xiàn)當(dāng)前視頻幀中的人臉圖像對應(yīng)的表情識別結(jié)果。

在一些實施例中，在播放上述視頻之前，上述方法還包括：接收上述用戶發(fā)送的人臉圖像裝飾請求，其中，上述人臉圖像裝飾請求包括裝飾用配圖選取信息；根據(jù)上述裝飾用配圖選取信息從預(yù)設(shè)的裝飾用配圖集合中選取目標(biāo)裝飾用配圖；將上述目標(biāo)裝飾用配圖添加到上述視頻的視頻幀中。

在一些實施例中，上述將上述目標(biāo)裝飾用配圖添加到上述視頻的視頻幀中，包括：間隔第一預(yù)設(shè)幀數(shù)從上述視頻中選取視頻幀，得到至少一個視頻幀；對于上述至少一個視頻幀中的視頻幀，對該視頻幀中的人臉圖像進行人臉關(guān)鍵點檢測，得到人臉關(guān)鍵點的位置；根據(jù)該視頻幀中人臉關(guān)鍵點的位置，將上述目標(biāo)裝飾用配圖添加到該視頻幀以及該視頻幀之后的第二預(yù)設(shè)幀數(shù)的視頻幀中。

在一些實施例中，上述方法還包括：根據(jù)上述音素序列生成手勢變化信息，其中，上述手勢變化信息用于在上述應(yīng)答語音信息播放時，控制所顯示的三維立體人像的手勢變化；以及上述播放上述應(yīng)答語音信息，以及根據(jù)上述口型變化信息控制上述三維立體人像的口型變化，包括：播放上述應(yīng)答語音信息，以及根據(jù)上述口型變化信息和上述手勢變化信息控制上述三維立體人像的口型變化和手勢變化。

在一些實施例中，上述方法還包括：基于上述語音信息生成待顯示信息，以及對上述待顯示信息進行顯示。

在一些實施例中，上述方法還包括：根據(jù)上述語音信息確定目標(biāo)業(yè)務(wù)類別；根據(jù)上述目標(biāo)業(yè)務(wù)類別確定目標(biāo)表情信息，以及根據(jù)上述目標(biāo)表情信息控制上述三維立體人像的表情。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司，未經(jīng)北京百度網(wǎng)訊科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201910058552.0/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種語音控制方法、裝置、存儲介質(zhì)及空調(diào)
下一篇：語音處理方法、存儲介質(zhì)和裝置

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準模板；訓(xùn)練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】