[發明專利]語音的合成方法及裝置、存儲介質、電子裝置在審
| 申請號: | 201810462450.0 | 申請日: | 2018-05-15 |
| 公開(公告)號: | CN110556092A | 公開(公告)日: | 2019-12-10 |
| 發明(設計)人: | 解俊;朱杰;湯夢;李斌 | 申請(專利權)人: | 中興通訊股份有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02 |
| 代理公司: | 11240 北京康信知識產權代理有限責任公司 | 代理人: | 董文倩;江舟 |
| 地址: | 518057 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 情感特征 韻律參數 轉換規則 語音 合成 參數轉換 存儲介質 電子裝置 情感語音 映射關系 語音合成 | ||
本發明提供了一種語音的合成方法及裝置、存儲介質、電子裝置,其中,該方法包括:獲取第一語音的情感特征參數;根據轉換規則將情感特征參數轉換為韻律參數,其中,轉換規則用于描述情感特征參數與韻律參數的映射關系;根據韻律參數和第一語音合成第二語音。通過本發明,解決了相關技術中合成情感語音過于復雜的技術問題。
技術領域
本發明涉及通信領域,具體而言,涉及一種語音的合成方法及裝置、存儲介質、電子裝置。
背景技術
語音合成技術的使用場合非常廣泛,但通常的語音合成技術一般只能產生中性語音(即無情感語音),不能適用于一些需要包含情感的場合,如:詩歌、小說等的數字朗讀,在一些需要語音提醒的場合,如:手機終端的語音提示、汽車駕駛的語音提示等,如果采用了情感語音,則更接近人類的交互特點,更具親和力。
相關技術中的情感語音合成方法通常是由情感語音字段拼接合成的,這種方法要提供所需情感的語音數據庫,然后將情感語段進行拼接,形成情感語音。具體就是需要一個龐大的情感語音庫,并且不同的情感需要分別對應一個語音庫,再依據已有的韻律規則進行合成,然后再在此基礎上通過一定的算法進行情感語音韻律參數的調節,由此來對語音單元進行波形拼接,合成出對應的情感語句。相關技術中在確定語音參數時,都是通過人工調試來完成。
針對相關技術中存在的上述問題,目前尚未發現有效的解決方案。
發明內容
本發明實施例提供了一種語音的合成方法及裝置、存儲介質、電子裝置。
根據本發明的一個實施例,提供了一種語音的合成方法,包括:獲取第一語音的情感特征參數;根據轉換規則將所述情感特征參數轉換為韻律參數,其中,所述轉換規則用于描述所述情感特征參數與所述韻律參數的映射關系;根據所述韻律參數和所述第一語音合成第二語音。
根據本發明的另一個實施例,提供了一種語音的合成裝置,包括:獲取模塊,用于獲取第一語音的情感特征參數;轉換模塊,用于根據轉換規則將所述情感特征參數轉換為韻律參數,其中,所述轉換規則用于描述所述情感特征參數與所述韻律參數的映射關系;合成模塊,用于根據所述韻律參數和所述第一語音合成第二語音。
根據本發明的又一個實施例,還提供了一種存儲介質,所述存儲介質中存儲有計算機程序,其中,所述計算機程序被設置為運行時執行上述任一項方法實施例中的步驟。
根據本發明的又一個實施例,還提供了一種電子裝置,包括存儲器和處理器,所述存儲器中存儲有計算機程序,所述處理器被設置為運行所述計算機程序以執行上述任一項方法實施例中的步驟。
通過本發明,通過使用轉換規則將情感特征參數轉換為韻律參數,并合成得到第二語音,第二語音在播放時具備韻律感,從而實現在攜帶語音中攜帶情感,解決了相關技術中合成情感語音過于復雜的技術問題,簡化了情感語音的合成系統,提高了情感語音的合成效率。
附圖說明
此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中:
圖1是本發明實施例的一種語音的合成方法的移動終端的硬件結構框圖;
圖2是根據本發明實施例的語音的合成方法的流程圖;
圖3是根據本發明實施例的語音的合成裝置的結構框圖;
圖4是本發明實施例基于PSOLA方法的情感語音轉換系統的結構示意圖;
圖5為本實施例平滑地近似任意形狀的概率密度分布示意圖;
圖6是本實施例三個高斯概率密度函數的加權和對某種分布進行擬合示意圖。
圖7是本發明實施例基于GMM的韻律特征參數確定流程圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中興通訊股份有限公司,未經中興通訊股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810462450.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:信息提供裝置
- 下一篇:一種語音標注方法及其系統





