[發明專利]用于波形拼接語音合成的選音方法和裝置有效
| 申請號: | 201610035220.7 | 申請日: | 2016-01-19 |
| 公開(公告)號: | CN105719641B | 公開(公告)日: | 2019-07-30 |
| 發明(設計)人: | 張輝;李秀林 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G10L13/10 | 分類號: | G10L13/10;G10L13/033 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 波形 拼接 語音 合成 方法 裝置 | ||
本發明提出一種用于波形拼接語音合成的選音方法和裝置,該用于波形拼接語音合成的選音方法包括:獲取標注信息,所述標注信息是對待合成文本進行前端處理后得到的;獲取預先生成的機器學習模型;根據所述標注信息和所述機器學習模型進行機器學習預選,得到候選音子波形片斷。該方法能夠提高語音合成時的預選效果。
技術領域
本發明涉及語音合成技術領域,尤其涉及一種用于波形拼接語音合成的選音方法和裝置。
背景技術
語音合成,又稱文語轉換(Text to Speech)技術,解決的主要問題是如何將文字信息轉化為可聽的聲音信息。
在語音合成時,需要先對輸入的文本進行前端處理,再進行聲學參數預測得到聲學參數,最后利用聲學參數直接通過聲碼器合成聲音,或者從音庫中挑選單元進行波形拼接。相對于聲碼器合成的聲音,基于波形拼接的合成聲音有更高的音質,以及更好保持了原發音人的風格。
在構建基于波形拼接的語音合成系統過程中,相關技術中,通常是先根據標注信息獲取候選音子波形片斷,再在候選音子波形片斷中進行一系列的預選,包括:時長預選、韻律位置預選、上下文預選、Kullback-Leibler距離 (KLD)預選和鄰居預選等,之后再從預選得到的波形片斷中選擇出最優音子波形片斷序列,之后根據最優音子波形片斷序列拼接合成得到合成語音。
相關技術中的上述方案會存在如下問題:
(1)各個預選過程相互獨立,沒有把這些信息綜合起來充分考慮,因此難以取得很好的預選效果;
(2)上述預選過程需要調整閾值和權重,而調整閾值和權重的工作需要大量的細致的人工工作,容易顧此失彼,針對一個音庫調整好閾值和權重后,換一個音庫往往需要重新調整這些參數;
(3)需要進行多步預選,計算量較大(特別是KLD預選);
(4)該方法的工程實現較為繁瑣,涉及到大量參數的維護,代碼復雜度高,較難維護。
發明內容
本發明旨在至少在一定程度上解決相關技術中的技術問題之一。
為此,本發明的一個目的在于提出一種用于波形拼接語音合成的選音方法,該方法可以提高語音合成時預選音子的預選效果。
本發明的另一個目的在于提出一種用于波形拼接語音合成的選音裝置。
為達到上述目的,本發明第一方面實施例提出的用于波形拼接語音合成的選音方法,包括:獲取標注信息,所述標注信息是對待合成文本進行前端處理后得到的;獲取預先生成的機器學習模型;根據所述標注信息和所述機器學習模型進行機器學習預選,得到候選音子波形片斷。
本發明第一方面實施例提出的用于波形拼接語音合成的選音方法,通過采用機器學習模型進行預選,可以將各種信息綜合起來考慮,從而提高語音合成時的預選效果。
為達到上述目的,本發明第二方面實施例提出的用于波形拼接語音合成的選音裝置,包括:第一獲取模塊,用于獲取標注信息,所述標注信息是對待合成文本進行前端處理后得到的;第二獲取模塊,用于獲取預先生成的機器學習模型;預選模塊,用于根據所述標注信息和所述機器學習模型進行機器學習預選,得到候選音子波形片斷。
本發明第二方面實施例提出的用于波形拼接語音合成的選音裝置,通過采用機器學習模型進行預選,可以將各種信息綜合起來考慮,從而提高語音合成時的預選效果。
本發明附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發明的實踐了解到。
附圖說明
本發明上述的和/或附加的方面和優點從下面結合附圖對實施例的描述中將變得明顯和容易理解,其中:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610035220.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:GSM信號頻點檢測方法及其裝置
- 下一篇:電信網絡多維監控方法





