[發明專利]語音合成模型生成方法和裝置有效
| 申請號: | 201710897311.6 | 申請日: | 2017-09-28 |
| 公開(公告)號: | CN107452369B | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 李昊 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G10L13/00 | 分類號: | G10L13/00;G10L13/08;G10L25/30 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 合成 模型 生成 方法 裝置 | ||
本申請公開了語音合成模型生成方法和裝置。該方法的一具體實施方式包括:獲取用于對語音合成模型對應的神經網絡進行訓練的文本的文本特征和文本對應的語音的聲學特征,其中,聲學特征中的用于訓練的文本對應的語音的基頻數據通過基頻數據提取模型提取,基頻數據提取模型基于利用包含的每一幀語音均對應有基頻數據的語音預先對基頻數據提取模型對應的神經網絡進行訓練而生成;利用文本特征和聲學特征對語音合成模型對應的神經網絡進行訓練。實現了利用預先訓練的基頻數據提取模型提取用于訓練的段語音的基頻數據,使得用于訓練語音的完整的基頻數據可以用于對語音合成模型對應的神經網絡的訓練,進而提升訓練效果。
技術領域
本申請涉及計算機領域,具體涉及語音領域,尤其涉及語音合成模型生成方法和裝置。
背景技術
在對語音合成模型對應的神經網絡進行訓練過程中,需要利用用于訓練的語音的聲學特征,對于聲學特征中的語音的基頻數據,目前,通常是采用數學變換的方式提取語音中的基頻數據。
采用數學變換的方式提取語音中的基頻數據會出現一段語音中的部分語音段的基頻數據難以提取出的情況,導致用于訓練的語音的基頻數據不是完整的語音的基頻數據,進而影響語音合成模型對應的神經網絡進行訓練的訓練效果。
發明信息
本申請提供了一種語音合成模型生成方法和裝置,用于解決上述背景技術部分存在的技術問題。
第一方面,本申請提供了語音合成模型生成方法,該方法包括:獲取用于對語音合成模型對應的神經網絡進行訓練的文本的文本特征和文本對應的語音的聲學特征,其中,所述聲學特征中的用于訓練的文本對應的語音的基頻數據通過基頻數據提取模型提取,所述基頻數據提取模型基于利用包含的每一幀語音均對應有基頻數據的語音預先對基頻數據提取模型對應的神經網絡進行訓練而生成;利用所述文本的文本特征和文本對應的語音的聲學特征對語音合成模型對應的神經網絡進行訓練。
第二方面,本申請提供了語音合成模型生成裝置,該裝置包括:獲取單元,配置用于獲取用于對語音合成模型對應的神經網絡進行訓練的文本的文本特征和文本對應的語音的聲學特征,其中,所述聲學特征中的用于訓練的文本對應的語音的基頻數據通過基頻數據提取模型提取,所述基頻數據提取模型基于利用包含的每一幀語音均對應有基頻數據的語音預先對基頻數據提取模型對應的神經網絡進行訓練而生成;訓練單元,配置用于利用所述文本的文本特征和文本對應的語音的聲學特征對語音合成模型對應的神經網絡進行訓練。
本申請提供的語音合成模型生成方法和裝置,通過獲取用于對語音合成模型對應的神經網絡進行訓練的文本的文本特征和文本對應的語音的聲學特征,其中,所述聲學特征中的用于訓練的文本對應的語音的基頻數據通過基頻數據提取模型提取,所述基頻數據提取模型基于利用包含的每一幀語音均對應有基頻數據的語音預先對基頻數據提取模型對應的神經網絡進行訓練而生成;利用所述文本的文本特征和文本對應的語音的聲學特征對語音合成模型對應的神經網絡進行訓練。實現了利用預先訓練的指示語音的特征與基頻數據的特征的對應關系的基頻數據提取模型提取用于訓練的段語音的基頻數據,使得用于訓練語音的完整的基頻數據可以用于對語音合成模型對應的神經網絡的訓練,進而提升訓練效果。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特征、目的和優點將會變得更明顯:
圖1示出了根據本申請的語音合成模型生成方法的一個實施例的流程圖;
圖2示出了根據本申請的語音合成模型生成裝置的一個實施例的結構示意圖;
圖3示出了適于用來實現本申請實施例的電子設備的計算機系統的結構示意圖。
具體實施方式
下面結合附圖和實施例對本申請作進一步的詳細說明??梢岳斫獾氖牵颂幩枋龅木唧w實施例僅僅用于解釋相關發明,而非對該發明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與有關發明相關的部分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710897311.6/2.html,轉載請聲明來源鉆瓜專利網。





