[發(fā)明專利]用于處理信息的方法和裝置在審
| 申請?zhí)枺?/td> | 201910058552.0 | 申請日: | 2019-01-22 |
| 公開(公告)號: | CN109599113A | 公開(公告)日: | 2019-04-09 |
| 發(fā)明(設(shè)計)人: | 劉驍;呂復(fù)強;王建祥;紀建超 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L21/10;H04N13/106;H04N13/172 |
| 代理公司: | 北京英賽嘉華知識產(chǎn)權(quán)代理有限責(zé)任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 口型變化 應(yīng)答語音 三維立體 人像 方法和裝置 處理信息 信息控制 音素序列 播放 信息播放 信息生成 用戶發(fā)送 語音信息 | ||
本公開實施例公開了用于處理信息的方法和裝置。該方法的一具體實施方式包括:基于用戶發(fā)送的語音信息,生成應(yīng)答語音信息;根據(jù)上述應(yīng)答語音信息生成音素序列;根據(jù)上述音素序列生成口型變化信息,其中,上述口型變化信息用于在上述應(yīng)答語音信息播放時,控制所顯示的三維立體人像的口型變化;播放上述應(yīng)答語音信息,以及根據(jù)上述口型變化信息控制上述三維立體人像的口型變化。該實施方式實現(xiàn)了播放應(yīng)答語音信息的同時,基于所播放的應(yīng)答語音信息控制三維立體人像的口型變化,提高了三維立體人像的擬人效果。
技術(shù)領(lǐng)域
本公開實施例涉及計算機技術(shù)領(lǐng)域,具體涉及用于處理信息的方法和裝置。
背景技術(shù)
現(xiàn)階段,智能服務(wù)已經(jīng)被應(yīng)用到了各個領(lǐng)域。例如,在智能客服的應(yīng)用場景下,用戶可以通過文字或語音來與客服機器人進行信息交互。而虛擬人像技術(shù)通過渲染三維立體人像,可以為智能服務(wù)提供更為便捷的使用體驗。舉例來說,通過使用語音識別、語音合成等技術(shù),能夠為三維立體人像賦予對話與聆聽的能力,從而提升了用戶與三維立體人像現(xiàn)場交互的擬人度。現(xiàn)有的虛擬人像技術(shù)雖然已經(jīng)具有很高的擬人效果,但大多仍然停留在腳本化的應(yīng)用場景,例如三維游戲、CG(computer graphics,計算機動畫)電影等,只能做到按照指示的內(nèi)容對已經(jīng)設(shè)計好的動作進行響應(yīng)。
發(fā)明內(nèi)容
本公開實施例提出了用于處理信息的方法和裝置。
第一方面,本公開實施例提供了一種用于處理信息的方法,該方法包括:基于用戶發(fā)送的語音信息,生成應(yīng)答語音信息;根據(jù)上述應(yīng)答語音信息生成音素序列;根據(jù)上述音素序列生成口型變化信息,其中,上述口型變化信息用于在上述應(yīng)答語音信息播放時,控制所顯示的三維立體人像的口型變化;播放上述應(yīng)答語音信息,以及根據(jù)上述口型變化信息控制上述三維立體人像的口型變化。
在一些實施例中,上述方法還包括:獲取上述用戶發(fā)送上述語音信息時所采集的上述用戶的視頻;對于上述視頻中的視頻幀,對該視頻幀中的人臉圖像進行面部表情識別,得到表情識別結(jié)果;播放上述視頻,以及在所播放的當(dāng)前視頻幀中呈現(xiàn)當(dāng)前視頻幀中的人臉圖像對應(yīng)的表情識別結(jié)果。
在一些實施例中,在播放上述視頻之前,上述方法還包括:接收上述用戶發(fā)送的人臉圖像裝飾請求,其中,上述人臉圖像裝飾請求包括裝飾用配圖選取信息;根據(jù)上述裝飾用配圖選取信息從預(yù)設(shè)的裝飾用配圖集合中選取目標(biāo)裝飾用配圖;將上述目標(biāo)裝飾用配圖添加到上述視頻的視頻幀中。
在一些實施例中,上述將上述目標(biāo)裝飾用配圖添加到上述視頻的視頻幀中,包括:間隔第一預(yù)設(shè)幀數(shù)從上述視頻中選取視頻幀,得到至少一個視頻幀;對于上述至少一個視頻幀中的視頻幀,對該視頻幀中的人臉圖像進行人臉關(guān)鍵點檢測,得到人臉關(guān)鍵點的位置;根據(jù)該視頻幀中人臉關(guān)鍵點的位置,將上述目標(biāo)裝飾用配圖添加到該視頻幀以及該視頻幀之后的第二預(yù)設(shè)幀數(shù)的視頻幀中。
在一些實施例中,上述方法還包括:根據(jù)上述音素序列生成手勢變化信息,其中,上述手勢變化信息用于在上述應(yīng)答語音信息播放時,控制所顯示的三維立體人像的手勢變化;以及上述播放上述應(yīng)答語音信息,以及根據(jù)上述口型變化信息控制上述三維立體人像的口型變化,包括:播放上述應(yīng)答語音信息,以及根據(jù)上述口型變化信息和上述手勢變化信息控制上述三維立體人像的口型變化和手勢變化。
在一些實施例中,上述方法還包括:基于上述語音信息生成待顯示信息,以及對上述待顯示信息進行顯示。
在一些實施例中,上述方法還包括:根據(jù)上述語音信息確定目標(biāo)業(yè)務(wù)類別;根據(jù)上述目標(biāo)業(yè)務(wù)類別確定目標(biāo)表情信息,以及根據(jù)上述目標(biāo)表情信息控制上述三維立體人像的表情。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910058552.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





