[發明專利]語音轉換方法和系統有效
| 申請號: | 200710163066.2 | 申請日: | 2007-09-29 |
| 公開(公告)號: | CN101399044A | 公開(公告)日: | 2009-04-01 |
| 發明(設計)人: | 雙志偉;孟繁平;秦勇;施勤 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G10L21/00 | 分類號: | G10L21/00;G10L13/00;G10L13/02;G10L13/08 |
| 代理公司: | 北京市金杜律師事務所 | 代理人: | 王茂華;趙林琳 |
| 地址: | 美國紐*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 轉換 方法 系統 | ||
1.一種語音轉換方法,包括:
語音分析步驟,用于對源說話者的語音執行語音分析以獲得語音 信息;
頻譜轉換步驟,用于基于所述語音信息執行頻譜轉換,以將所述 源說話者的所述語音的頻譜轉換為與目標說話者的語音相似的第一 頻譜,所述頻譜轉換步驟通過頻率彎曲來執行并且包括補償所述源 說話者和所述目標說話者的聲光譜差值;
單元選擇步驟,用于至少使用所述第一頻譜作為目標,基于目 標說話者語料庫對所述目標說話者的所述語音執行單元選擇;
頻譜替換步驟,用于通過以所選擇的目標說話者語音單元的頻譜 替代所述第一頻譜的至少一部分來生成替換的頻譜;
語音重建步驟,用于至少基于所述替換的頻譜執行語音重建。
2.根據權利要求1所述的方法,還包括:
韻律轉換步驟,用于基于所述語音信息執行韻律轉換,至少獲得 與所述目標說話者的語音相似的第一音調曲線;
其中在所述單元選擇步驟中,使用所述第一頻譜和所述第一音 調曲線作為目標,基于所述目標說話者的語音執行單元選擇;以及
在所述語音重建步驟中,基于替換的頻譜和所述第一音調曲線執 行語音重建。
3.根據權利要求1所述的方法,其中:
在所述頻譜替換步驟中,利用所選擇單元的高于特定頻率的頻 譜替換所述第一頻譜中的相應部分,而將所述第一頻譜中低于所述 特定頻率的部分保持不變。
4.根據權利要求3所述的方法,其中:
所述特定頻率選擇在500Hz至2000Hz之間。
5.根據權利要求2所述的方法,還包括:
頻譜平滑步驟,用于對所述頻譜替換步驟中獲得的替換的頻譜 進行頻譜平滑;
其中在所述語音重建步驟中,基于平滑的頻譜和所述第一音調曲 線執行語音重建。
6.根據權利要求1到5中任一權利要求所述的方法,其中:
所述語音信息包括頻譜包絡和音調曲線信息。
7.一種語音轉換系統,包括:
語音分析裝置,用于對源說話者的語音執行語音分析以獲得語音 信息;
頻譜轉換裝置,用于基于所述語音信息執行頻譜轉換,以將所述 源說話者的所述語音的頻譜轉換為與目標說話者的語音相似的第一 頻譜,其中所述頻譜轉換步驟通過頻率彎曲來執行,并且包括補償 所述源說話者和所述目標說話者的聲光譜差值;
單元選擇裝置,用于至少使用所述第一頻譜作為目標,基于目 標說話者語料庫對所述目標說話者的所述語音執行單元選擇;
頻譜替換裝置,用于通過以所選擇的目標說話者語音單元的頻譜 替代所述第一頻譜的至少一部分來生成替換的頻譜;
語音重建裝置,用于至少基于所述替換的頻譜執行語音重建。
8.根據權利要求7所述的系統,還包括:
韻律轉換裝置,用于基于所述語音信息執行韻律轉換,至少獲得 與所述目標說話者的語音相似的第一音調曲線;
其中所述單元選擇裝置使用所述第一頻譜和所述第一音調曲線 作為目標,基于所述目標說話者的語音執行單元選擇;以及
所述語音重建裝置基于替換的頻譜和所述第一音調曲線執行語 音重建。
9.根據權利要求7所述的系統,其中:
所述頻譜替換裝置利用所選擇單元的高于特定頻率的頻譜替換 所述第一頻譜中的相應部分,而將所述第一頻譜中低于所述特定頻 率的部分保持不變。
10.根據權利要求9所述的系統,其中:
所述特定頻率選擇在500Hz至2000Hz之間。
11.根據權利要求8所述的系統,還包括:
頻譜平滑裝置,用于對所述頻譜替換步驟中獲得的替換的頻譜 進行頻譜平滑;
其中所述語音重建裝置基于平滑的頻譜和所述第一音調曲線執 行語音重建。
12.根據權利要求7到11中任一權利要求所述的系統,其中:
所述語音信息包括頻譜包絡和音調曲線信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710163066.2/1.html,轉載請聲明來源鉆瓜專利網。





