[發明專利]一種生成動畫人物口型的方法及裝置有效
| 申請號: | 202010042300.1 | 申請日: | 2020-01-15 |
| 公開(公告)號: | CN111260761B | 公開(公告)日: | 2023-05-09 |
| 發明(設計)人: | 程大治;夏龍;吳凡;卓邦聲;高強;馬楠;郭常圳 | 申請(專利權)人: | 北京猿力未來科技有限公司 |
| 主分類號: | G06T13/20 | 分類號: | G06T13/20;G06T13/40;G10L15/02 |
| 代理公司: | 北京智信禾專利代理有限公司 11637 | 代理人: | 劉曉楠 |
| 地址: | 100102 北京市朝陽區廣順南大*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 生成 動畫人物 口型 方法 裝置 | ||
本申請提供一種生成動畫人物口型的方法及裝置,其中所述生成動畫人物口型的方法包括:接收語音音頻和所述語音音頻對應的語音文本;獲取所述語音音頻的每個音頻幀中的候選音素概率和所述語音文本對應的音素序列;根據所述語音音頻的每個音頻幀中的候選音素概率和所述音素序列生成所述語音音頻對應的音素集合列表;根據所述音素集合列表在預設的動畫人物素材庫中查找并播放對應的動畫人物口型。通過上述方法,可以使得動畫人物的口型時刻配合語音音頻,使得生成的動畫人物的口型更符合現實世界中的說話方式,使得生成的動畫更加自然、真實。
技術領域
本申請涉及計算機技術領域,特別涉及一種生成動畫人物口型的方法及裝置、計算設備和計算機可讀存儲介質。
背景技術
隨著計算機技術的快速發展,動畫制作也得到了廣泛的應用,為了吸引小朋友的注意力,經常會制作一些動畫教學等視頻素,用以給提供娛樂或者教學等等。
在現有的技術中,生成的動畫人物無法根據語音制作相對應的口型,動畫播放出來之后經常會出現口型與語音不對應的問題,甚至動畫人物的口型十分夸張,從而導致動畫不夠自然,不夠真實,生成的動畫質量比較差。
因此,如何解決上述問題,就成為技術人員亟待解決的問題。
發明內容
有鑒于此,本申請實施例提供了一種生成動畫人物口型的方法及裝置、計算設備和計算機可讀存儲介質,以解決現有技術中存在的技術缺陷。
根據本申請實施例的第一方面,提供了一種生成動畫人物口型的方法,包括:
接收語音音頻和所述語音音頻對應的語音文本;
獲取所述語音音頻的每個音頻幀中的候選音素概率和所述語音文本對應的音素序列;
根據所述語音音頻的每個音頻幀中的候選音素概率和所述音素序列生成所述語音音頻對應的音素集合列表;
根據所述音素集合列表在預設的動畫人物素材庫中查找并播放對應的動畫人物口型。
可選的,獲取所述語音音頻的每個音頻幀中的候選音素概率,包括:
將所述語音音頻做分幀處理,獲得多個音頻幀;
提取每個音頻幀的聲學特征;
將所述聲學特征輸入至預先訓練好的聲學模型,以使所述聲學模型預測每個所述音頻幀中的候選音素概率。
可選的,獲取所述語音文本對應的音素序列,包括:
對所述語音文本做分字處理,獲得字集合;
根據所述字集合中的每個字在預設的字典中查找對應的音素;
按照所述字集合中每個字的順序生成所述語音文本對應的音素序列。
可選的,根據所述語音音頻的每個音頻幀中的候選音素概率和所述音素序列生成所述語音音頻對應的音素集合列表,包括:
根據前n個音頻幀中的候選音素序列概率、第n+1個音頻幀中的候選音素概率和所述音素序列生成前n+1個音頻幀中的候選音素序列概率,其中n為正整數;
獲取所述語音音頻對應的候選音素序列,并根據所述候選音素序列和所述候選音素序列中每個音素的開始幀和結束幀生成音素集合列表。
可選的,在根據所述音素集合列表在預設的動畫人物素材庫中查找并播放對應的動畫人物口型之前,還包括:
對所述音素集合列表中的音素做預處理,獲得經過處理后的音素集合列表。
可選的,所述音素集合列表中包括所述語音音頻對應的候選音素序列和每個音素的開始幀和結束幀;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京猿力未來科技有限公司,未經北京猿力未來科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010042300.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鋼筋掃描儀
- 下一篇:一種具有防脫落功能的電子線連接裝置





