[發明專利]統計參數模型建立方法和裝置、語音合成方法和裝置有效
| 申請號: | 201710258873.6 | 申請日: | 2017-04-19 |
| 公開(公告)號: | CN106971709B | 公開(公告)日: | 2021-10-15 |
| 發明(設計)人: | 李為;嚴航宇;李科;吳永堅;黃飛躍 | 申請(專利權)人: | 騰訊科技(上海)有限公司 |
| 主分類號: | G10L13/08 | 分類號: | G10L13/08;G10L13/04 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 何平;鄧云鵬 |
| 地址: | 201200 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 統計 參數 模型 建立 方法 裝置 語音 合成 | ||
本發明涉及一種統計參數模型建立方法,包括獲取模型訓練數據,模型訓練數據包括文本特征序列和對應的原始語音樣本序列;將文本特征樣本序列中的文本特征樣本點與原始語音樣本序列中的語音樣本點匹配形成的原始向量矩陣輸入統計參數模型訓練;將原始向量矩陣在隱層中進行非線性映射計算,輸出對應的預測語音樣本點;根據預測語音樣本點與對應的原始語音樣本點采用差距最小原則確定統計參數模型的模型參數,得到對應的目標統計參數模型。此方法提高了合成語音的飽和度和自然度,還涉及一種統計參數模型建立裝置以及利用上述目標統計參數模型的語音合成方法和裝置。
技術領域
本發明涉及語音技術領域,特別是涉及一種統計參數模型建立方法和裝置、語音合成方法和裝置。
背景技術
TTS(Text To Speech,文本到語音)系統由前端和后端兩個模塊構成,用于將一段文本內容通過一系列的分析和建模后轉換為可以播放和存儲的語音文件。前端主要是對文本內容進行處理,將文本內容轉換成不同形式的中間表達狀態,用于指導后端模型將文本內容轉換成對應的語音。后端模塊的其中一類為統計參數模型,統計參數模型是指通過對發聲機理的模式進行建模的一種模型。
傳統技術中的統計參數模型需要從語音中提取與發聲關系最密切的基頻、發聲時長以及頻譜特征等特征后,對提取到的語音特征進行建模,在語音合成的過程中,傳統技術中的統計參數模型也是首先合成預測的基頻、發聲時長以及頻譜特征,然后通過后端信號處理模塊將獲取的語音特征重新融合為語音波形。但是傳統技術的參數統計模型在對特征進行提取時,需要對原始語音進行變換,在對語音進行變換的過程中容易造成信息的損失,而信息的損失讓合成的音色不夠飽滿、有明顯機器音等缺陷。
發明內容
基于此,有必要針對上述問題,提供一種能夠提高合成語音的飽和度和自然度的統計參數模型建立方法和裝置、語音合成方法和裝置。
一種統計參數模型建立方法,所述方法包括:
獲取模型訓練數據,所述模型訓練數據包括文本特征序列和對應的原始語音樣本序列;
將所述文本特征樣本序列中的文本特征樣本點與原始語音樣本序列中的語音樣本點匹配形成的原始向量矩陣輸入統計參數模型訓練;
將所述原始向量矩陣在隱層中進行非線性映射計算,輸出對應的預測語音樣本點;
根據所述預測語音樣本點與對應的原始語音樣本點采用差距最小原則確定所述統計參數模型的模型參數,得到對應的目標統計參數模型。
一種統計參數模型建立裝置,所述裝置包括:
獲取模塊,用于獲取模型訓練數據,所述模型訓練數據包括文本特征序列和對應的原始語音樣本序列;
訓練模塊,用于將所述文本特征樣本序列中的文本特征樣本點與原始語音樣本序列中的語音樣本點匹配形成的原始向量矩陣輸入統計參數模型訓練;
樣本點預測模塊,用于將所述原始向量矩陣在隱層中進行非線性映射計算,輸出對應的預測語音樣本點;
模型建立模塊,用于根據所述預測語音樣本點與對應的原始語音樣本點采用差距最小原則確定所述統計參數模型的模型參數,得到對應的目標統計參數模型。
上述統計參數模型建立方法和裝置,通過將訓練數據中的文本特征序列中的文本特征樣本點與原始語音樣本序列中的語音樣本點匹配形成的原始向量矩陣進行統計參數模型訓練,將原始向量矩陣在隱層中進行非線性映射計算,得到對應的預測語音樣本點,將預測語音樣本點與對應的原始語音樣本點相比較,采用差距最小原則確定統計參數模型的模型參數,得到對應的目標統計參數模型。通過直接對文本特征序列進行采樣獲取文本特征樣本點,直接對文本特征樣本點與語音特征樣本點進行建模,不需要進行語音特征提取,最大程度上避免了語音在特征提取的過程中造成的原始信息的丟失,提高了統計參數模型合成語音的飽和度和自然度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(上海)有限公司,未經騰訊科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710258873.6/2.html,轉載請聲明來源鉆瓜專利網。





