[發明專利]一種基于LPC及RBF神經網絡的聲音轉換的方法無效
| 申請號: | 201210229540.8 | 申請日: | 2012-07-04 |
| 公開(公告)號: | CN102737628A | 公開(公告)日: | 2012-10-17 |
| 發明(設計)人: | 張欽宇;潘振鵬;林威;王喆;付東松;張勇勇;黃立偉 | 申請(專利權)人: | 哈爾濱工業大學深圳研究生院 |
| 主分類號: | G10L11/00 | 分類號: | G10L11/00;G10L13/00;G10L21/02 |
| 代理公司: | 深圳市科吉華烽知識產權事務所 44248 | 代理人: | 胡吉科 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 lpc rbf 神經網絡 聲音 轉換 方法 | ||
技術領域
本發明涉及語音信號處理領域,尤其涉及一種基于LPC及RBF神經網絡的聲音轉換的方法。
背景技術
對語音信號的處理,主要有三種方案:
1、基于矢量量化的碼本映射技術實現方案
用矢量量化算法將源說話人和目標說話人的聲學特征空間進行劃分,用動態時間規整算法將源-目標特征矢量相關聯,從而訓練出一個源到目標說話人的映射碼本。缺陷:盡管計算量較低,但是由于矢量量化作用造成的頻譜的不連續性,轉換語音質量還很低。
2、基于線性多變量回歸的局部函數轉換技術實現方案
說話人語音頻譜空間由矢量量化劃分成許多不同的子空間,每一個空間都訓練一個局部函數,每個局部函數都表述了某一個聲學空間源-目標說話人特征之間的關系,這樣碼本映射方案中的全局映射就被這些局部函數來近似。缺陷:這種局部空間轉換的方法可以產生無窮多目標特征量。然而由于選擇單個局部轉換函數的離散性還存在,不連貫性仍然出現在輸出語音中。
3、基于高斯混合模型的聯合概率分布技術實現方案
通過概率的方法,采用高斯混合模型描述源-目標特征的聯合概率分布,尋找轉換函數來預測目標語音特征。這種技術比碼本映射和局部函數變換有效性、魯棒性也較好,理論上能使回歸問題的混合成分得到更合理的配置。缺陷:這種技術在進行運算時計算量較大,而且存在轉換語音頻譜過分光滑現象,影響了轉換語音目標說話人特征的傾向性。
發明內容
本發明解決的技術問題是:在已有的語音轉換技術方案中,要么轉換語音質量較低,要么計算量過大,本發明設計出一種高質量、計算量適中的語音轉換技術方案。
本發明解決現有技術中存在的問題所采用的技術方案為:提供一種基于LPC及RBF神經網絡的聲音轉換的方法,所述方法包括以下步驟:
A、對語音進行預處理;
?B、對濁音幀進行基頻檢測;
C、對基頻檢測后的濁音幀進行轉換;
D、對轉換后的基頻進行濁音幀參量的提取;
E、對提取到的濁音幀參量進行計算,求得一幀濁音幀,然后對該一幀濁音幀進行合成,得到轉換后的濁音幀。
本發明的進一步技術方案是:所述A步驟還包括以下分步驟:
A1:從待轉換語音中進行分幀;
A2:?運用判斷方法對該幀進行清音和濁音的判斷。
本發明的進一步技術方案是:所述A2步驟中,所述判斷方法包括幀能量和幀過零率,幀能量的計算公式如下:
其中:x(m)為幀中第m個語音點的值,N為該幀的點數,E為幀能量,?Ta為此函數的定義域m的閥值;
幀過零率的計算公式為:
?
其中:z為幀過零率,Tb為此函數的定義域m的閥值;計算出每幀的能量和過零率。通過此公式計算出每幀的能量和過零率,若幀能量大于一定的閥值Ta且過零率小于一定的閥值Tb,判定為濁音幀;否則,判定為清音幀。例如,假設Ta為語音的最大幀能量的10%,Tb約為120。當某一幀的能量大于Ta,過零率小于Tb時,判別為濁音幀,否則,為清音幀。由于語音信號具有清音部分能量低、濁音部分能量高,清音部分過零率高、濁音部分過零率低的特點。
本發明的進一步技術方案是:所述B步驟中,對濁音幀進行基頻檢測是運用平均幅度差函數AMDF來檢測的,其計算公式為:
其中:?l為偏移量。為避免偏移量過小,l的最小取值可設為10,最大取值原則上不超過該幀的點數的一半,可設為N/2;當l等于基頻整數倍時,其平均幅度差函數AMDF值r(l)將達到極小值,尤其是當l等于基頻時,取得最小值;因此,通過求得l的最小值,從而檢測基頻。
本發明的進一步技術方案是:所述D步驟中,對濁音幀進行參量的提取,是用自相關法從最低價線性預測器開始,由低階到高階進行逐階遞推計算,求得濁音幀第P階LPC系數,根據該濁音幀LPC系數求得該濁音幀LSF系數。
本發明的進一步技術方案是:對源說話者與目標說話者的多個相同訓練語音的濁音幀,分別提取出多組相對應LSF系數,獲得轉換后的LSF系數,再求得轉換后的LPC系數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學深圳研究生院,未經哈爾濱工業大學深圳研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210229540.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:控制非法使用應用軟件的方法
- 下一篇:一種單元幕墻上橫梁





