[發明專利]一種使用盲語音分離的語音轉換系統和方法無效
| 申請號: | 201210090640.7 | 申請日: | 2012-03-30 |
| 公開(公告)號: | CN102592607A | 公開(公告)日: | 2012-07-18 |
| 發明(設計)人: | 申艷;汶躍龍;張嘉馳;范禮乾;楊柳;蔣詩慧 | 申請(專利權)人: | 北京交通大學 |
| 主分類號: | G10L21/02 | 分類號: | G10L21/02;G10L15/14;G10L11/06;G10L19/04 |
| 代理公司: | 北京正理專利代理有限公司 11257 | 代理人: | 張雪梅 |
| 地址: | 100044*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 使用 語音 分離 轉換 系統 方法 | ||
1.一種使用盲語音分離的語音轉換方法,其特征在于,該方法包括如下步驟:
1)將采集到的語音信號利用子帶分解成低頻和高頻部分,且分別將低頻部分轉換得到的語音作為ICA的第一路觀測信號x1(t),將高頻部分轉換得到的語音信號作為ICA的第二路觀測信號x2(t);
2)對所述觀測信號進行語音分離;
3)對分離出的語音信號提取語音特征參數,獲得的源和目標說話人語音的語音特征參數;
4)對所述語音特征參數輸入進行語音轉換;
5)對進行語音轉換后的語音特征參數進行語音合成得到合成語音。
2.根據權利要求1所述的一種使用盲語音分離的語音轉換系統和方法,其特征在于,所述步驟2)對所述觀測信號進行語音分離包括如下步驟:
201)將所述兩路信號x1(t)、x2(t)構成二維觀測信號矩陣X(t)=[x1(t),x2(t)]T,作為待分離觀測信號;
202)將觀測信號X(t)進行分塊處理,根據觀測信號X(t)的維度合理設置塊的大小;
203)對所有分塊的觀測信號進行處理,得到他們各自的最優分離信號Yi(t),再按觀測信號分塊過程的逆向變換得到整個觀測信號的最優分離信號Y(t);
204)去除信號Y(t)中的背景噪音信號部分,保留Y(t)中期望得到的說話人語音信號,得到語音轉換系統需要輸入的源或和目標說話人的語音信號。
3.根據權利要求1所述的一種使用盲語音分離的語音轉換系統和方法,其特征在于,所述步驟3)對分離出的語音信號提取語音特征參數是分別提取源和目標說話人的語音信號的基音頻率和線譜對頻率LSF,提取方式如下:
對分離出的語音信號進行不等長的分幀,對分幀后的語音進行倒譜變換,根據倒譜波形中第二個沖激的位置可求得對應的基音頻率;對分幀后的語音進行線性預測分析LPC,將分析得到的線性預測系數進行等價變換,得到線譜對頻率參數LSF。
4.根據權利要求1所述的一種使用盲語音分離的語音轉換系統和方法,其特征在于,所述步驟4)中對所述語音特征參數輸入進行語音轉換是采用高斯混合模型對源和目標說話人的語音特征參數進行語音轉換,得到轉換后的目標說話人語音的特征參數。
5.根據權利要求1所述的一種使用盲語音分離的語音轉換系統和方法,其特征在于,所述步驟5)中對進行語音轉換后的語音特征參數進行語音合成得到合成語音,具體是指采用激勵源-聲道模型的語音合成器對步驟4中轉換后的目標說話人語音的特征參數進行合成,得到轉換后的目標說話人語音。
6.一種使用盲語音分離的語音轉換系統,其特征在于,該系統包括:
子帶分離單元,將采集到的語音信號利用子帶分解成低頻和高頻部分,且分別將低頻部分轉換得到的語音作為ICA的第一路觀測信號x1(t),將高頻部分轉換得到的語音信號作為ICA的第二路觀測信號x2(t);
語音分離單元,對所述觀測信號進行語音分離;
特征提取單元,對分離出的語音信號提取語音特征參數,獲得的源和目標說話人語音的語音特征參數;
語音轉換單元,對所述語音特征參數輸入進行語音轉換;
語音合成單元,對進行語音轉換后的語音特征參數進行語音合成得到合成語音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京交通大學,未經北京交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210090640.7/1.html,轉載請聲明來源鉆瓜專利網。





