[發明專利]語音轉換方法和裝置有效
| 申請號: | 201710093860.8 | 申請日: | 2017-02-21 |
| 公開(公告)號: | CN106920547B | 公開(公告)日: | 2021-11-02 |
| 發明(設計)人: | 袁豪磊;梅曉 | 申請(專利權)人: | 騰訊科技(上海)有限公司 |
| 主分類號: | G10L15/07 | 分類號: | G10L15/07;G10L17/04;G10L17/14;G10L25/03;G10L25/51 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 何平;鄧云鵬 |
| 地址: | 201200 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 轉換 方法 裝置 | ||
本發明涉及一種語音轉換方法和裝置,該方法包括:獲取目標文本;合成與所述目標文本對應的第一機器語音;從異步機器語音庫中,篩選出韻律特征與所述第一機器語音的韻律特征匹配的異步機器語音單元序列;在同步機器語音庫中,查找與所述異步機器語音單元序列對應的同步機器語音單元序列;根據所述同步機器語音單元序列的韻律特征,合成與所述目標文本對應的第二機器語音;從所述同步機器語音庫中,挑選與所述第二機器語音聲學特征匹配的同步機器語音單元;將說話人語音庫中與所述同步機器語音單元對應的說話人語音單元拼接,得到說話人目標語音。本申請提供的方案提高了語音轉換效果。
技術領域
本發明涉及計算機技術領域,特別是涉及一種語音轉換方法和裝置。
背景技術
隨著計算機技術的發展,語音內容轉換的應用越來越廣泛,如在有聲小說朗讀或者語音導航中實現個性化的聲音等。伴隨著生活水平的提高,人們對語音內容轉換已經不僅僅滿足于單純對音色實現轉換,還要求轉換的語音更符合特定的說話人的口語習慣和說話風格。
傳統的語音內容轉換技術中,在需要轉換得到目標說話人語音時,主要是通過音色轉換的方法,將其他說話人的語音轉換為目標說話人的語音。然而,傳統的語音轉換方法得到的語音無法真實地反應說話人的語音風格,導致語音轉換效果與真實說話人相比有一定的差距。
發明內容
基于此,有必要針對傳統的語音轉化方法在轉換符合說話人語音風格的語音時效果不理想的問題,提供一種語音轉換方法和裝置。
一種語音轉換方法,所述方法包括:
獲取目標文本;
合成與所述目標文本對應的第一機器語音;
從異步機器語音庫中,篩選出韻律特征與所述第一機器語音的韻律特征匹配的異步機器語音單元序列;
在同步機器語音庫中,查找與所述異步機器語音單元序列對應的同步機器語音單元序列;
根據所述同步機器語音單元序列的韻律特征,合成與所述目標文本對應的第二機器語音;
從所述同步機器語音庫中,挑選與所述第二機器語音聲學特征匹配的同步機器語音單元;
將說話人語音庫中與所述同步機器語音單元對應的說話人語音單元拼接,得到說話人目標語音;
其中,所述同步機器語音庫、所述異步機器語音庫和所述說話人語音庫的文本內容相同,且所述說話人語音庫與所述同步機器語音庫的韻律特征相匹配。
一種語音轉換裝置,其特征在于,所述裝置包括:
獲取模塊,用于獲取目標文本;
第一合成模塊,用于合成與所述目標文本對應的第一機器語音;
第一篩選模塊,用于從異步機器語音庫中,篩選出韻律特征與所述第一機器語音的韻律特征匹配的異步機器語音單元序列;
查找模塊,用于在同步機器語音庫中,查找與所述異步機器語音單元序列對應的同步機器語音單元序列;
第二合成模塊,用于根據所述同步機器語音單元序列的韻律特征,合成與所述目標文本對應的第二機器語音;
第二篩選模塊,用于從所述同步機器語音庫中,挑選與所述第二機器語音聲學特征匹配的同步機器語音單元;
拼接模塊,將說話人語音庫中與所述同步機器語音單元對應的說話人語音單元拼接,得到說話人目標語音;
其中,所述同步機器語音庫、所述異步機器語音庫和所述說話人語音庫的文本內容相同,且所述說話人語音庫與所述同步機器語音庫的韻律特征相匹配。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(上海)有限公司,未經騰訊科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710093860.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:脫硫除塵除霧超低排放裝置
- 下一篇:一種室內空氣消毒機





