[發明專利]TTS預合成方法及系統在審
| 申請號: | 202011208009.3 | 申請日: | 2020-11-03 |
| 公開(公告)號: | CN112289301A | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 黃玲兒;郭志煌 | 申請(專利權)人: | 蘇州思必馳信息科技有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/04 |
| 代理公司: | 北京商專永信知識產權代理事務所(普通合伙) 11400 | 代理人: | 黃謙;車江華 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | tts 合成 方法 系統 | ||
本發明實施例提供一種TTS預合成方法。該方法包括:根據電子設備中的語料名稱的動態變化,利用固定句式以及對應的動態變化后的語料名稱,在線進行動態TTS預合成。本發明實施例還提供一種TTS預合成系統。本發明實施例動靜態結合預生成TTS,在使用靜態預生成TTS錄音的情況下,加上主動檢測電子設備中的語料名稱的變化,在此變化上,由此動態預生成相關TTS錄音。將這些預生成的TTS錄音預置到版本中,解決了本地TTS引擎或預生成固定的TTS音頻的缺陷。
技術領域
本發明涉及語音合成領域,尤其涉及一種TTS預合成方法及系統。
背景技術
語音助手軟件應答用戶的對話,通常是直接使用本地語音合成TTS(Text ToSpeech,文本到語音)或者使用固定的TTS錄音。
市面上的語音助手,一般是使用本地TTS引擎生成想要的TTS音頻進行播放;或者預生成固定的TTS音頻,儲存在本地進行播放。
第一種是依賴設備本地的TTS引擎,如果在沒有可用的成熟的TTS引擎的情況下,則無法正常運行。第二種是預置的TTS都是固定的,無法根據設備情況和使用場景進行動態變化。
在實現本發明過程中,發明人發現相關技術中至少存在如下問題:
第一種是由于其技術本身完全依賴TTS本地引擎的有無和質量高低,如果TTS本地引擎質量較差,對于某些文本,會無法生成音頻;第二種是由于預置TTS過于固定,應用于實際中使用時,很難將所有可能會涉及到的語音都提取預置,如果出現一些內置外的文本時,也無法找到對應的音頻向用戶回復。
發明內容
為了至少解決現有技術中TTS本地引擎較差時,無法生成音頻,預置固定的TTS錄音,對于一些內置外的文本時,無法找到相應的錄音進行回復的問題。
第一方面,本發明實施例提供一種TTS預合成方法,應用于電子設備,包括:
根據電子設備中的語料名稱的動態變化,利用固定句式以及對應的動態變化后的所述語料名稱,在線進行動態TTS預合成。
第二方面,本發明實施例提供一種TTS預合成系統,應用于電子設備,包括:
預合成程序模塊,用于根據電子設備中的語料名稱的動態變化,利用固定句式以及對應的動態變化后的所述語料名稱,在線進行動態TTS預合成。
第三方面,提供一種電子設備,其包括:至少一個處理器,以及與所述至少一個處理器通信連接的存儲器,其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行本發明任一實施例的TTS預合成方法的步驟。
第四方面,本發明實施例提供一種存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現本發明任一實施例的TTS預合成方法的步驟。
本發明實施例的有益效果在于:動靜態結合預生成TTS,在使用靜態預生成TTS錄音的情況下,加上主動檢測電子設備中的語料名稱的變化,在此變化上,由此動態預生成相關TTS錄音。將這些預生成的TTS錄音預置到版本中,解決了本地TTS引擎或預生成固定的TTS音頻的缺陷。調用在線的TTS的API或SDK可以準確的將預生成的文本,轉換成對應的語音,確保了準確性。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是本發明一實施例提供的一種TTS預合成方法的流程圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州思必馳信息科技有限公司,未經蘇州思必馳信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011208009.3/2.html,轉載請聲明來源鉆瓜專利網。





