[發明專利]用于波形拼接語音合成的選音方法和裝置有效
| 申請號: | 201610035220.7 | 申請日: | 2016-01-19 |
| 公開(公告)號: | CN105719641B | 公開(公告)日: | 2019-07-30 |
| 發明(設計)人: | 張輝;李秀林 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G10L13/10 | 分類號: | G10L13/10;G10L13/033 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 波形 拼接 語音 合成 方法 裝置 | ||
1.一種用于波形拼接語音合成的選音方法,其特征在于,包括:
獲取標注信息,所述標注信息是對待合成文本進行前端處理后得到的;
獲取預先生成的機器學習模型;
根據所述標注信息和所述機器學習模型進行機器學習預選,得到候選音子波形片斷;
所述根據所述標注信息和所述機器學習模型進行機器學習預選,得到候選音子波形片斷,包括:
根據所述待合成文本對應的標注信息,對應每個音子,遍歷所述音子對應的音子樹,獲取所述音子樹的葉子節點關聯的HMM;
根據所述HMM與波形片斷的對應關系,獲取與所述葉子節點關聯的HMM對應的波形片斷,將所述波形片斷確定為得到候選音子波形片斷。
2.根據權利要求1所述的方法,其特征在于,當所述機器學習模型是音子樹時,所述方法還包括:
獲取音子樣本的標注信息及音子樣本的波形片斷,并根據所述音子樣本的標注信息,訓練得到HMM,以及,建立HMM與波形片斷的對應關系;
對應每個音子,對所述音子對應的HMM進行決策樹聚類,得到所述音子對應的音子樹。
3.根據權利要求2所述的方法,其特征在于,所述音子樹中,每個非葉子節點對應一個最優的分裂問題,每個葉子節點關聯一個或多個HMM。
4.根據權利要求3所述的方法,其特征在于,所述最優的分裂問題是使得分裂前后對數似然值增量最大的問題,當分裂前后對數似然增量小于預設閾值時,停止分裂,其中,所述預設閾值根據MDL準則確定。
5.根據權利要求1所述的方法,其特征在于,還包括:
獲取聲學參數,所述聲學參數是根據所述標注信息進行聲學參數預測后得到的;
根據所述聲學參數和所述候選音子波形片斷,進行代價計算,選擇出最優音子波形片斷序列,以便對所述最優音子波形片斷序列中的波形片斷進行拼接,得到合成語音。
6.一種用于波形拼接語音合成的選音裝置,其特征在于,包括:
第一獲取模塊,用于獲取標注信息,所述標注信息是對待合成文本進行前端處理后得到的;
第二獲取模塊,用于獲取預先生成的機器學習模型;
預選模塊,用于根據所述標注信息和所述機器學習模型進行機器學習預選,得到預選后的音子;
所述預選模塊具體用于:
根據所述待合成文本對應的標注信息,對應每個音子,遍歷所述音子對應的音子樹,獲取所述音子樹的葉子節點關聯的HMM;
根據所述HMM與波形片斷的對應關系,獲取與所述葉子節點關聯的HMM對應的波形片斷,將所述波形片斷確定為得到候選音子波形片斷。
7.根據權利要求6所述的裝置,其特征在于,當所述機器學習模型是音子樹時,所述裝置還包括:
建模模塊,用于獲取音子樣本的標注信息及音子樣本的波形片斷,并根據所述音子樣本的標注信息,訓練得到HMM,以及,建立HMM與波形片斷的對應關系;
聚類模塊,用于對應每個音子,對所述音子對應的HMM進行決策樹聚類,得到所述音子對應的音子樹。
8.根據權利要求6所述的裝置,其特征在于,還包括:
第三獲取模塊,用于獲取聲學參數,所述聲學參數是根據所述標注信息進行聲學參數預測后得到的;
確定模塊,用于根據所述聲學參數和所述候選音子波形片斷,進行代價計算,選擇出最優音子波形片斷序列,以便對所述最優音子波形片斷序列中的波形片斷進行拼接,得到合成語音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610035220.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:GSM信號頻點檢測方法及其裝置
- 下一篇:電信網絡多維監控方法





