[發明專利]語音合成方法和裝置有效
| 申請號: | 201710147062.9 | 申請日: | 2017-03-13 |
| 公開(公告)號: | CN107644637B | 公開(公告)日: | 2018-09-25 |
| 發明(設計)人: | 鄒芳;李晉;周濤 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/08 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 謝曲曲 |
| 地址: | 518052 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 合成 方法 裝置 | ||
本發明涉及一種語音合成方法和裝置。所述方法包括:獲取被觸發的語音合成指令,所述語音合成指令中攜帶用戶標識;根據所述語音合成指令確定對應的待合成的單位語音、語音組合順序以及相鄰兩個單位語音之間的停頓時長;從與所述用戶標識對應的語音庫中提取與用戶的音色相匹配的待合成的單位語音;根據所提取的待合成的單位語音、語音組合順序以及相鄰兩個單位語音之間的停頓時長合成目標語音。上述的語音合成方法和裝置可提高語音合成的靈活性。
技術領域
本發明涉及信息處理技術領域,特別是涉及一種語音合成方法和裝置。
背景技術
文字轉語音系統(TextToSpeech,從文本到語言,簡稱TTS)的語音合成技術已經被應用到很多領域,但合成的語音均是來源于提前設定好的某一種或幾種音色的固定語音庫,這樣播報出來的語音比較單調。
發明內容
基于此,有必要針對上述的技術問題,提供一種能夠提高語音合成的靈活性的語音合成方法和裝置。
一種語音合成方法,所述方法包括:
獲取被觸發的語音合成指令,所述語音合成指令中攜帶用戶標識;
根據所述語音合成指令確定對應的待合成的單位語音、語音組合順序以及相鄰兩個單位語音之間的停頓時長;
從與所述用戶標識對應的語音庫中提取與用戶的音色相匹配的待合成的單位語音;
根據所提取的待合成的單位語音、語音組合順序以及相鄰兩個單位語音之間的停頓時長合成目標語音。
在其中一個實施例中,所述根據所述語音合成指令確定對應的待合成的單位語音、語音組合順序以及相鄰兩個單位語音之間的停頓時長的步驟,包括:
根據所述語音合成指令確定對應的文本信息;
獲取構成所述文本信息的單位文字和文字組合順序;
根據所述單位文字確定對應的待合成的單位語音;
根據所述文字組合順序確定對應的語音組合順序;
根據所述單位文字和文字組合順序確定相鄰兩個單位語音之間的停頓時長。
在其中一個實施例中,所述從與所述用戶標識對應的語音庫中提取與用戶的音色相匹配的待合成的單位語音的步驟,包括:
根據所述用戶標識確定用于存儲與所述用戶的語音具有相同音色的單位語音的語音庫;
從所述語音庫中查詢所有待合成的單位語音,并提取所述語音庫中存在的待合成的單位語音;
當所述語音庫中不存在待合成的單位語音時,從與所述用戶的音色的匹配度最高的一個或多個語音庫中,提取剩余不存在的待合成單位語音,直到所有的待合成語音均提取完畢。
在其中一個實施例中,所述語音庫中包括與用戶音色相同的第一單位語音,和與用戶音色的匹配度超過預設閾值但不與所述用戶音色相同的第二單位語音;
所述從與所述用戶標識對應的語音庫中提取與用戶的音色相匹配的待合成的單位語音的步驟,包括:
優先從所述語音庫中的第一單位語音中提取待合成的單位語音;
從所述第二單位語音中提取所述第一單位語音中不存在的剩余待合成的單位語音。
在其中一個實施例中,所述方法還包括:
獲取語音信號;
提取所述語音信號中所包含的單位語音和對應的音色;
根據所提取的單位語音更新與所述語音信號的音色對應的語音庫中的單位語音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710147062.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種醫用鞋套
- 下一篇:一種具有隔熱抗阻燃功能的鞋底





