[發明專利]生成語音動畫的方法和裝置有效

申請號：	201610889079.7	申請日：	2016-10-11
公開（公告）號：	CN106653054B	公開（公告）日：	2020-02-14
發明（設計）人：	王夏鳴;趙志翔	申請（專利權）人：	科大訊飛股份有限公司
主分類號：	G10L21/12	分類號：	G10L21/12
代理公司：	11201 北京清亦華知識產權代理事務所(普通合伙)	代理人：	張大威
地址：	230088 安徽省***	國省代碼：	安徽;34
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	生成語音動畫方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請提出一種生成語音動畫的方法和裝置，該生成語音動畫的方法包括：獲取當前語音信號的音量值；根據所述音量值，在組成待生成的語音動畫波形的位置點中確定波峰位置點，以及確定波峰位置點的波峰振幅值；根據所述波峰位置點和所述波峰振幅值，生成語音動畫波形。該方法能夠生成更準確的仿聲音頻譜的語音動畫，為用戶帶來更逼真的語音反饋體驗。

技術領域

本申請涉及語音信號處理等技術領域，尤其涉及一種生成語音動畫的方法和裝置。

背景技術

在主流智能手機系統上，如iOS、Android，第三方軟件有權限訪問手機麥克風，并利用系統層級的音頻錄制接口獲取麥克風錄制的聲音。具有語音錄制功能的應用軟件在與用戶交互時，可以通過語音動畫的形式向用戶實時反饋錄音狀態，以告知用戶目前的狀態是在錄音。

相關技術中的語音動畫雖然可以展示出類似聲音頻譜的漣漪效果，但是通過對相關技術中的語音動畫的分析，其不能準確地反映出聲音信號的真實特征，在仿真效果等方面都存在一定問題。

發明內容

本申請旨在至少在一定程度上解決相關技術中的技術問題之一。

為此，本申請的一個目的在于提出一種生成語音動畫的方法，該方法能夠生成更準確的仿聲音頻譜的語音動畫，為用戶帶來更逼真的語音反饋體驗。

本申請的另一個目的在于提出一種生成語音動畫的裝置。

為達到上述目的，本申請第一方面實施例提出的生成語音動畫的方法，包括：獲取當前語音信號的音量值；根據所述音量值，在組成待生成的語音動畫波形的位置點中確定波峰位置點，以及確定波峰位置點的波峰振幅值；根據所述波峰位置點和所述波峰振幅值，生成語音動畫波形。

本申請第一方面實施例提出的生成語音動畫的方法，通過獲取音量值并根據音量值確定波峰位置點和波峰振幅值，可以更真實地反映聲音具有的頻譜特征，從而生成更準確的仿聲音頻譜的語音動畫，為用戶帶來更逼真的語音反饋體驗。

為達到上述目的，本申請第二方面實施例提出的生成語音動畫的裝置，包括：音量獲取模塊，用于獲取當前語音信號的音量值；波峰確定模塊，用于根據所述音量值，在組成待生成的語音動畫波形的位置點中確定波峰位置點，以及確定波峰位置點的波峰振幅值；波形生成模塊，用于根據所述波峰位置點和所述波峰振幅值，生成語音動畫波形。

本申請第二方面實施例提出的生成語音動畫的裝置，通過獲取音量值并根據音量值確定波峰位置點和波峰振幅值，可以更真實地反映聲音具有的頻譜特征，從而生成更準確的仿聲音頻譜的語音動畫，為用戶帶來更逼真的語音反饋體驗。

本申請附加的方面和優點將在下面的描述中部分給出，部分將從下面的描述中變得明顯，或通過本申請的實踐了解到。

附圖說明

本申請上述的和/或附加的方面和優點從下面結合附圖對實施例的描述中將變得明顯和容易理解，其中：

圖1是本申請一個實施例提出的生成語音動畫的方法的流程示意圖；

圖2是本申請實施例中組成待生成的語音動畫波形的位置點的示意圖；

圖3是本申請另一個實施例提出的生成語音動畫的方法的流程示意圖；

圖4是本申請實施例中候選波峰位置點的示意圖；

圖5是本申請實施例中最終采用的波峰位置點的示意圖；

圖6是本申請實施例中波峰振幅值的初始值的示意圖；

圖7是本申請實施例中波峰振幅值的最終值的示意圖；

圖8是本申請實施例中生成的語音動畫波形的示意圖；