[發明專利]用于處理信息的方法和裝置在審
| 申請號: | 201910058552.0 | 申請日: | 2019-01-22 |
| 公開(公告)號: | CN109599113A | 公開(公告)日: | 2019-04-09 |
| 發明(設計)人: | 劉驍;呂復強;王建祥;紀建超 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L21/10;H04N13/106;H04N13/172 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 口型變化 應答語音 三維立體 人像 方法和裝置 處理信息 信息控制 音素序列 播放 信息播放 信息生成 用戶發送 語音信息 | ||
1.一種用于處理信息的方法,包括:
基于用戶發送的語音信息,生成應答語音信息;
根據所述應答語音信息生成音素序列;
根據所述音素序列生成口型變化信息,其中,所述口型變化信息用于在所述應答語音信息播放時,控制所顯示的三維立體人像的口型變化;
播放所述應答語音信息,以及根據所述口型變化信息控制所述三維立體人像的口型變化。
2.根據權利要求1所述的方法,其中,所述方法還包括:
獲取所述用戶發送所述語音信息時所采集的所述用戶的視頻;
對于所述視頻中的視頻幀,對該視頻幀中的人臉圖像進行面部表情識別,得到表情識別結果;
播放所述視頻,以及在所播放的當前視頻幀中呈現當前視頻幀中的人臉圖像對應的表情識別結果。
3.根據權利要求2所述的方法,其中,在播放所述視頻之前,所述方法還包括:
接收所述用戶發送的人臉圖像裝飾請求,其中,所述人臉圖像裝飾請求包括裝飾用配圖選取信息;
根據所述裝飾用配圖選取信息從預設的裝飾用配圖集合中選取目標裝飾用配圖;
將所述目標裝飾用配圖添加到所述視頻的視頻幀中。
4.根據權利要求3所述的方法,其中,所述將所述目標裝飾用配圖添加到所述視頻的視頻幀中,包括:
間隔第一預設幀數從所述視頻中選取視頻幀,得到至少一個視頻幀;
對于所述至少一個視頻幀中的視頻幀,對該視頻幀中的人臉圖像進行人臉關鍵點檢測,得到人臉關鍵點的位置;根據該視頻幀中人臉關鍵點的位置,將所述目標裝飾用配圖添加到該視頻幀以及該視頻幀之后的第二預設幀數的視頻幀中。
5.根據權利要求1所述的方法,其中,所述方法還包括:
根據所述音素序列生成手勢變化信息,其中,所述手勢變化信息用于在所述應答語音信息播放時,控制所顯示的三維立體人像的手勢變化;以及
所述播放所述應答語音信息,以及根據所述口型變化信息控制所述三維立體人像的口型變化,包括:
播放所述應答語音信息,以及根據所述口型變化信息和所述手勢變化信息控制所述三維立體人像的口型變化和手勢變化。
6.根據權利要求1所述的方法,其中,所述方法還包括:
基于所述語音信息生成待顯示信息,以及對所述待顯示信息進行顯示。
7.根據權利要求1所述的方法,其中,所述方法還包括:
根據所述語音信息確定目標業務類別;
根據所述目標業務類別確定目標表情信息,以及根據所述目標表情信息控制所述三維立體人像的表情。
8.一種用于處理信息的裝置,包括:
第一生成單元,被配置成基于用戶發送的語音信息,生成應答語音信息;
第二生成單元,被配置成根據所述應答語音信息生成音素序列;
第三生成單元,被配置成根據所述音素序列生成口型變化信息,其中,所述口型變化信息用于在所述應答語音信息播放時,控制所顯示的三維立體人像的口型變化;
播放單元,被配置成播放所述應答語音信息,以及根據所述口型變化信息控制所述三維立體人像的口型變化。
9.根據權利要求8所述的裝置,其中,所述裝置還包括:
獲取單元,被配置成獲取所述用戶發送所述語音信息時所采集的所述用戶的視頻;
識別單元,被配置成對于所述視頻中的視頻幀,對該視頻幀中的人臉圖像進行面部表情識別,得到表情識別結果;
呈現單元,被配置成播放所述視頻,以及在所播放的當前視頻幀中呈現當前視頻幀中的人臉圖像對應的表情識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910058552.0/1.html,轉載請聲明來源鉆瓜專利網。





