[發明專利]基于非負低秩和稀疏矩陣分解原理的語音增強方法有效
| 申請號: | 201310548773.9 | 申請日: | 2013-11-07 |
| 公開(公告)號: | CN103559888A | 公開(公告)日: | 2014-02-05 |
| 發明(設計)人: | 孫成立;須明;王希敏;謝堅筱 | 申請(專利權)人: | 航空電子系統綜合技術重點實驗室 |
| 主分類號: | G10L21/0232 | 分類號: | G10L21/0232;G10L21/0272 |
| 代理公司: | 南昌市平凡知識產權代理事務所 36122 | 代理人: | 歐陽沁 |
| 地址: | 200233 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 非負低秩 稀疏 矩陣 分解 原理 語音 增強 方法 | ||
1.基于非負低秩和稀疏矩陣分解原理的語音增強方法,其特征在于,用非負低秩和稀疏矩陣分解方法從含噪語音中分離出語音信號,其實現步驟如下:
(1)對離散含噪語音信號進行預處理,預處理包括信號平滑和分幀;
(2)將分幀后的含噪語音信號進行離散傅里葉變換,得到含噪語音頻譜;
(3)在頻域中,將每幀語音的頻譜幅度作為列向量,按時間順序排列,由若干個語音幀構成含噪語音時頻矩陣;
(4)利用非負低秩和稀疏矩陣分解算法對含噪語音時頻矩陣進行分解,獲得非負的低秩矩陣和稀疏矩陣;分解表達式為:
Y=L+S+E滿足rank(L)≤r,||S||0≤h,L≥0,S≥0;
其中:Y為含噪語音時頻矩陣;L為低秩矩陣,對應噪聲的幅度譜;S為稀疏矩陣,對應語音的幅度譜,||S||0表示稀疏矩陣S含有的非0元素個數,rank(L)表示矩陣L的秩,E為殘差矩陣,r和h表示低秩和稀疏約束上限參數;
(5)利用稀疏矩陣S和含噪語音的相位譜重構增強語音頻譜,然后通過逆傅里葉變換,得到時域形式的增強語音。
2.根據權利要求1所述的基于非負低秩和稀疏矩陣分解原理的語音增強方法,其特征在于,所述步驟(1)中對離散含噪語音信號進行預處理的處理過程為:
(1)采用P點最近鄰信號均值來進行信號平滑,用以平滑含噪語音的幅度波形;
(2)對含噪語音信號分幀,分幀采用的窗函數為Hamming窗,窗長為200點,每次幀間移動的重疊點數為80點。
3.根據權利要求1所述的非負低秩和稀疏矩陣分解算法,其特征在于,計算低秩矩陣L和稀疏矩陣S的步驟如下:
(1)初始化:Y0=Y;L0=S0=[0]N×K;
迭代次數初值i=1;最大迭代次數imax=103;相對誤差閾值δ=10-3;
(2)使用NMF更新低秩矩陣:(W,H)=NMF(Yi-1),Li=WH;W∈RN×r,H∈Rr×K;
NMF表示非負矩陣分解,NMF表示非負矩陣分解,W和H是秩為r的NMF分解結果,NMF的測度函數選擇Itakura-Saito測度;
(3)使用軟門限算子更新稀疏矩陣:Si=(Yi-1-Li+Si-1>λ)□(Yi-1-Li+Si-1-λ);
其中:符號表示矩陣對應位置元素乘積,λ為門限常數;λ與噪聲水平有關,推薦值λ=σ,其中σ為噪聲的均方差;
(4)更新疊加矩陣:Yi=Li+Si;
(5)如果i達到最大迭代次數i=imax或者停止迭代,輸出L和S的估計值Li和Si;否則跳轉到步驟(2),i=i+1;繼續執行迭代過程。
4.根據權利要求1所述的基于非負低秩和稀疏矩陣分解原理的語音增強方法,其特征在于,所述步驟(5)中利用稀疏矩陣和含噪語音的相位譜重構增強語音頻譜:
其中:∠Y(n,k)為含噪語音的頻譜相位,S為稀疏矩陣,|S(n,k)|為稀疏矩陣譜幅度值,為重構的增強語音頻譜,n為時間幀索引,k為頻率索引。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于航空電子系統綜合技術重點實驗室,未經航空電子系統綜合技術重點實驗室許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310548773.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種蛋氨酸的生產方法
- 下一篇:一種方便、即食型甜酒的加工方法





