[發明專利]自動進行語音轉換的方法和裝置無效
| 申請號: | 200710139735.2 | 申請日: | 2007-07-30 |
| 公開(公告)號: | CN101359473A | 公開(公告)日: | 2009-02-04 |
| 發明(設計)人: | 施琴;秦勇;劉義;雙志偉 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G10L13/04 | 分類號: | G10L13/04;G10L21/06 |
| 代理公司: | 北京市中咨律師事務所 | 代理人: | 于靜;楊曉光 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自動 進行 語音 轉換 方法 裝置 | ||
1、一種用于自動進行語音轉換的方法,所述方法包括:
獲得源語音信息和源文字信息;
根據源語音信息,選擇語音合成庫中的標準說話人;
根據所選擇的語音合成庫中的標準說話人,將所述源文字信息合成為標準語音信息;以及
將所述標準語音信息按照源語音信息進行音色轉換,從而得到目標語音信息。
2、一種如權利要求0所述的方法,進一步包括獲得訓練數據的步驟,所述獲得訓練數據的步驟包括:
對齊所述源文字信息和源語音信息。
3、一種如權利要求0所述的方法,其中所述獲得訓練數據的步驟還包括:
對所述源語音信息的角色進行聚類。
4、一種如權利要求0所述的方法,進一步包括將所述目標語音信息與所述源語音信息進行時間同步的步驟。
5、一種如權利要求0所述的方法,其中所述選擇語音合成庫中的標準說話人的步驟進一步包括:
根據語音合成庫中的標準說話人的標準語音信息與源語音信息之間的基頻差異和頻譜差異,選擇聲學特征差異最小的語音合成庫中的標準說話人。
6、一種如權利要求0所述的方法,其中所述將標準語音信息按照源語音信息進行音色轉換,從而得到目標語音信息的步驟進一步包括:
根據語音合成庫中的標準語音信息與源語音信息之間的基頻差異和頻譜差異,對所述標準語音信息進行音色轉換,將其轉換成目標語音信息。
7、一種如權利要求0或0所述的方法,其中所述基頻差異包括基頻的均值差異和方差差異。
8、一種如權利要求0所述的方法,其中將所述目標語音信息與所述源語音信息進行時間同步的步驟包括根據源語音信息進行同步。
9、一種如權利要求0所述的方法,其中將所述目標語音信息與所述源語音信息進行時間同步的步驟包括根據源語音信息所對應的畫面信息進行同步。
10、一種用于自動進行語音轉換的系統,所述系統包括:
獲得源語音信息和源文字信息的單元;
根據所述源語音信息,選擇語音合成庫中的標準說話人的單元;
根據所選擇的語音合成庫中的標準說話人,將所述源文字信息合成為標準語音信息的單元;以及
將所述標準語音信息按照源語音進行音色轉換,從而得到目標語音信息的單元。
11、一種如權利要求0所述的系統,進一步包括獲得訓練數據的單元,所述獲得訓練數據的單元包括:
對齊所述源文字信息和源語音信息的單元。
12、一種如權利要求0所述的系統,其中所述獲得訓練數據的單元還包括:
對所述源語音信息的角色進行聚類的單元。
13、一種如權利要求0所述的系統,進一步包括將所述目標語音信息與所述源語音信息進行時間同步的單元。
14、一種如權利要求0所述的系統,其中所述選擇語音合成庫中的標準說話人的單元進一步包括:
根據語音合成庫中的標準說話人的標準語音信息與源語音信息之間的基頻差異和頻譜差異,選擇聲學特征差異最小的語音合成庫中的標準說話人的單元。
15、一種如權利要求0所述的系統,其中所述將標準語音信息按照源語音信息進行音色轉換,從而得到目標語音信息的單元進一步包括:
根據語音合成庫中的標準語音信息與源語音信息之間的基頻差異和頻譜差異,對所述標準語音信息進行音色轉換,將其轉換成目標語音信息的單元。
16、一種如權利要求0或0所述的系統,其中所述基頻差異包括基頻的均值差異和方差差異。
17、一種如權利要求0所述的系統,其中將所述目標語音信息與所述源語音信息進行時間同步的單元包括根據源語音信息進行同步的單元。
18、一種如權利要求0所述的系統,其中將所述目標語音信息與所述源語音信息進行時間同步的單元包括根據源語音信息所對應的畫面信息進行同步的單元。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710139735.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于自行車變速器的控制裝置
- 下一篇:植物中類胡蘿卜素的增強





