[發明專利]訓練數據有限情形下的非平行文本語音轉換方法有效
| 申請號: | 201810418346.1 | 申請日: | 2018-05-03 |
| 公開(公告)號: | CN109671423B | 公開(公告)日: | 2023-06-02 |
| 發明(設計)人: | 李燕萍;許吉良 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G10L13/08 | 分類號: | G10L13/08;G10L25/18;G10L25/24 |
| 代理公司: | 南京蘇科專利代理有限責任公司 32102 | 代理人: | 姚姣陽;徐振興 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訓練 數據 有限 情形 平行 文本 語音 轉換 方法 | ||
1.一種訓練數據有限情形下的非平行文本語音轉換方法,其特征在于,包括以下步驟:
1訓練部分:
1.1訓練語料通過AHOcoder分析/合成模型提取出不同說話人的不同語句的梅爾頻率倒譜系數Mel-Frequency?Cepstral?Coefficients,MFCC和對數基頻log?f0;
1.2對1.1中說話人每幀的MFCC語音特征X進行一次差分和二次差分,并與原特征進行拼接得到特征Xt=(X,ΔX,Δ2X),然后將拼接后特征的前后各一幀形成聯合特征參數xn=(Xt-1,Xt,Xt+1);
1.3將1.2中的聯合特征xn作為說話人識別任務的深度神經網絡(Deep?NeuralNetworks,DNN)訓練的輸入數據,DNN模型的輸出為說話人分類標簽;當目標說話人訓練數據不充分時,對DNN的訓練過程進行干預與優化,補充目標說話人的特征空間;待DNN模型訓練至收斂后,提取每一幀的Bottleneck特征bn作為變分自編碼器VariationalAutoencoder,VAE模型訓練過程中decoder的監督信息;
1.4對于VAE模型的訓練,將1.2中的輸出xn和1.3中DNN模型的輸出bn作為VAE模型的輸入,按照VAE模型訓練方法進行模型訓練;待VAE模型訓練至收斂后,將VAE隱含空間各幀的采樣特征zn提取出來作為目標說話人Bottleneck特征映射網絡Back?Propagation網絡的訓練數據;
1.5訓練Bottleneck映射網絡,將1.4中得到的zn和說話人標簽特征yn組成聯合特征(zn,yn)輸入BP網絡,并以DNN網絡輸出的Bottleneck特征bn作為BP網絡的監督數據進行訓練,通過隨機梯度下降算法優化網絡的輸出誤差,從而得到Bottleneck特征映射網絡;
1.6將以上訓練好的DNN特征提取網絡,VAE模型,Bottleneck特征映射網絡組成語音轉換系統;
2轉換階段:
2.1源說話人任意測試語音通過AHOcoder分析/合成模型提取源說話人MFCC特征參數Xsrc和對數基頻log?f0;
2.2將源說話人任意測試語音的語音特征參數Xsrc輸入VAE語音轉換模型,通過VAE模型的encoder過程得到采樣特征zn,并將zn和說話人標簽特征yn組成聯合特征(zn,yn)輸入Bottleneck特征映射網絡BP網絡,訓練得到目標說話人Bottleneck特征bn,將bn和zn通過VAE模型的decoder重構出轉換后的語音特征參數Xtar;
2.3將轉換階段2.1中提取的源說話人對數基頻log?f0轉換為目標說話人語音對數基頻,將轉換后的語音特征參數Xtar還原為梅爾頻率倒譜形式的語音頻譜特征參數xn;
2.4將2.3中的語音頻譜特征參數xn和目標說話人語音對數基頻通過AHOcoder模型合成轉換后的說話人語音。
2.根據權利要求1所述的訓練數據有限情形下的非平行文本語音轉換方法,其特征在于:所述步驟1.1中提取MFCC特征參數和對數基頻log?f0是利用AHOcoder聲音編碼器提取得到,然后將MFCC特征參數讀取到MATLAB平臺進行處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810418346.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種獲取純凈語音的錄音方法
- 下一篇:車輛特征的響應激活
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





