[發明專利]一種說話人聲音轉換方法有效
| 申請號: | 201210528629.4 | 申請日: | 2012-12-11 |
| 公開(公告)號: | CN102982809A | 公開(公告)日: | 2013-03-20 |
| 發明(設計)人: | 陳凌輝;戴禮榮;凌震華 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G10L25/30 | 分類號: | G10L25/30 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 宋焰琴 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 說話 人聲 轉換 方法 | ||
1.一種說話人聲音轉換方法,用于把源說話人所說的話的語音信號進行轉換,使轉換后的語音聽起來是不同于源說話人的目標說話人所說的,其特征在于,該方法包括訓練階段和轉換階段,其中,
所述訓練階段包括:
步驟A1、從源說話人和目標說話人的訓練語音信號中分別提取基頻特征和頻譜特征,所述頻譜特征包括說話人特征和內容特征;
步驟A2、根據源說話人和目標說話人的訓練語音信號的基頻特征,構建從源說話人的語音到目標說話人的語音的基頻轉換函數;
步驟A3、根據步驟A1提取的源說話人和目標說話人的說話人特征構建說話人轉換函數;
所述轉換階段包括:
步驟B1、從源說話人的待轉換語音信號中提取基頻特征和頻譜特征,所述頻譜特征包括說話人特征和內容特征;
步驟B2、分別使用訓練階段得到的基頻轉換函數和說話人轉換函數,對從步驟B1中從所述待轉換語音信號中提取出的基頻特征和說話人特征進行轉換,得到轉換后的基頻特征和說話人特征;
步驟B3、根據步驟B2得到的轉換后的基頻特征和說話人特征,以及步驟B1提取的待轉換語音信號中的內容特征,合成目標說話人的語音。
2.如權利要求1所述的說話人聲音轉換方法,其特征在于,所述步驟A2統計源說話人和目標說話人的訓練語音信號的基頻特征在對數域分布的均值和方差,根據所統計的均值和方差構建從源說話人的語音到目標說話人的語音的基頻轉換函數。
3.如權利要求2所述的說話人聲音轉換方法,其特征在于,所述基頻轉換函數為線性變換函數。
4.如權利要求1所述的說話人聲音轉換方法,其特征在于,所述步驟A1和步驟B1的提取語音信號的基頻特征和頻譜特征的方法包括:
步驟a1、基于語音信號的源-濾波器結構,將語音信號以20~30ms進行分段,每一段作為一幀,并對每一幀的語音信號提取基頻和頻譜參數;
步驟a2、使用一個神經網絡來分離所述頻譜參數中的說話人特征和內容特征,該神經網絡結構采用上下對稱的共2K-1層多層(K為自然數)網絡結構,包括:最下層為輸入層,從該層輸入待分離的聲學特征;最上層為輸出層,該層輸出重構出的聲學特征;中間2K-3個隱層,每層若干個節點,模擬神經單元的處理過程。從輸入層到從下至上的第K個隱層為編碼網絡,用于從輸入的語音聲學特征中提取出高層的信息;從下至上的第K個隱層為編碼層;編碼層的網絡節點分為兩部分,一部分與說話人相關,另一部分與內容相關,它們的輸出分別對應說話人特征和內容特征;從下至上的第K個隱層以上的隱層為解碼網絡,用于從高層的說話人特征和內容特征中重建出聲學頻譜參數。
5.如權利要求4所述的說話人聲音轉換方法,其特征在于,所述步驟a2包括在一語音信號數據庫上對所述神經網絡進行訓練,以使其具備從聲學特征中提取和分離說話人特征和內容特征的能力。
6.如權利要求5所述的說話人聲音轉換方法,其特征在于,所述對所述神經網絡進行訓練的步驟包括:
步驟b1、通過預訓練來初始化所述神經網絡的網絡權值;
步驟b2、對所述神經網絡的編碼層的每個節點的輸出特征,采用一個區分性準則來統計其在不同說話人之間和不同內容之間的區分性,將不同說話人間區分性大而不同內容之間區分性小的節點作為說話人相關節點,其余的節點作為內容相關節點;
步驟b3、設計特定的區分性目標函數來精細調整該神經網絡的權值,使該神經網絡具備從聲學特征中分離說話人信息和內容信息的能力。
7.如權利要求5所述的說話人聲音轉換方法,其特征在于,所述步驟b1采取無監督的學習模式,使用貪婪算法來逐層訓練該神經網絡;
8.如權利要求7所述的說話人聲音轉換方法,其特征在于,所述步驟b1包括:
在輸入層,輸入特征服從高斯分布,則在輸入的各維上加入適量的高斯噪聲,并采用最小均方誤差準則來訓練;在第一層以上各層,輸入特征服從二值分布,因此以一定的概率,將輸入特征的某些維置零,并使用最小交叉熵準則來訓練;經過預訓練得到一個K層疊加的自動編碼器后,將其向上翻轉,便得到了上下對稱的自動編碼器結構。
9.如權利要求6所述的說話人聲音轉換方法,其特征在于,所述步驟b2采用Fisher′s?ratio準則作為區分性準則。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210528629.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:泄油過濾系統及工程機械
- 下一篇:一種氣動式可多位置變距式結構





