[發明專利]基于Mel-KSVD稀疏表示的自適應內插加權譜模型的語音轉換及重構方法有效
| 申請號: | 201310211046.3 | 申請日: | 2013-05-29 |
| 公開(公告)號: | CN103345920A | 公開(公告)日: | 2013-10-09 |
| 發明(設計)人: | 湯一彬;沈媛;朱昌平;周浩;高遠;單鳴雷;姚澄 | 申請(專利權)人: | 河海大學常州校區 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L21/047 |
| 代理公司: | 南京縱橫知識產權代理有限公司 32224 | 代理人: | 董建林 |
| 地址: | 213022 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 mel ksvd 稀疏 表示 自適應 內插 加權 模型 語音 轉換 方法 | ||
1.基于Mel-KSVD稀疏表示的自適應內插加權譜模型的語音轉換及重構方法,其特征在于,利用Mel-KSVD的方法對經過STRAIGHT分析模型提取的平滑功率譜參數進行稀疏表示,包含以下步驟:
(1)輸入待合成語音信號,將語音信號通過STRAIGHT分析模型提取平滑譜:首先采用時頻補償法提取功率譜,接著再對功率譜進行低頻帶補償和過平滑補償,最后對功率譜無音幀進行處理,以得到平滑功率譜,平滑功率譜的參數構成一數據矩陣,設為Y=[y1,...,yM];
(2)提取出的平滑功率譜參數通過美爾濾波器后進行字典的訓練,再利用Mel-KSVD算法對式:約束條件為進行參數D和X的優化求解,
其中M為美爾濾波器組的系數矩陣,Y=[y1,...,yM]表示功率譜參數矩陣,D=[d1,...,dK]為目標訓練字典,di表示字典的一個原子,xk為yk在D上投影的稀疏矢量,X=[x1,...,xM],ε為重構誤差門限,||·||F為Frobenius范數,||·||0為0范數;
(3)利用優化出的目標訓練字典和通過美爾濾波器和Mel-KSVD算法對STRAIGHT分析模型得到的待合成語音的平滑譜參數進行稀疏表示得到的稀疏矢量xk,并將得到的稀疏系數矩陣X=[x1,...,xM]通過STRAIGHT合成模型進行語音的合成;通過對功率譜參數矩陣進行估計來進行語音的合成,估計矩陣為求解公式為
2.根據權利要求1所述的基于Mel-KSVD稀疏表示的自適應內插加權譜模型的語音轉換及重構方法,其特征在于:步驟(2)所述的算法對式
(2a)在字典訓練階段,目標字典D與重構誤差相關;
在目標函數中的MD被看成一個復雜的字典Deq,字典Deq中的原子dk的優化問題歸為如下公式:
其中deq,k是Deq的第k列,δk是X的第k行;
(2b)采用奇異值分解算法對上式處理,得
Eeq,k=UΣVT,
其中,U和V是酉矩陣,Σ是對角陣,其第k個對角元素為Ek的奇異值,U(:,1)和V(:,1)分別表示U和V的第一列,Σ(1,1)是Σ最大的奇異值;
得到最佳的字典原子優化為
當對于所有k=1,2,...,M,進行稀疏系數和字典更新的迭代,直到時,停止對D的優化求解,此時得到的字典為最佳字典輸出稀疏系數矩陣X=[x1,...,xM]和對應字典進入所述的步驟(3),否則重復步驟(2a)與(2b)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學常州校區,未經河海大學常州校區許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310211046.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種光纖平衡干涉高速測振系統
- 下一篇:一種中型工字鋼梁耐火極限測試裝置





