[發明專利]一種基于有色噪聲的語音增強方法在審
| 申請號: | 201710608441.3 | 申請日: | 2017-07-24 |
| 公開(公告)號: | CN107316648A | 公開(公告)日: | 2017-11-03 |
| 發明(設計)人: | 鄭康麗 | 申請(專利權)人: | 廈門理工學院 |
| 主分類號: | G10L21/02 | 分類號: | G10L21/02;G10L21/0208;G10L21/0216 |
| 代理公司: | 廈門智慧呈睿知識產權代理事務所(普通合伙)35222 | 代理人: | 楊唯 |
| 地址: | 361024 福*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 有色 噪聲 語音 增強 方法 | ||
1.一種基于有色噪聲的語音增強方法,其特征在于,包括以下步驟:
步驟1,建立雙麥克風陣列,接收得到兩個通道的帶噪語音信號,所述帶噪語音信號經過時延補償模塊,以使兩個通道的所述帶噪語音信號同步;
步驟2,得到所述帶噪語音信號數據的協方差矩陣,并進行特征值分解,將帶噪語音信號空間分為信號子空間和噪聲子空間;
步驟3,采用子空間法處理得到相對純凈的語音處理信號;
步驟4,在信號子空間內對所述語音處理信號進行最小均方方差估計,計算最小均方誤差。
2.根據權利要求1所述的基于有色噪聲的語音增強方法,其特征在于,
得到所述帶噪語音信號后,對其進行預處理,包括:對帶噪語音信號進行采樣處理,然后進行分幀處理,將分幀處理后的每幀信號進行加窗處理。
3.根據權利要求1所述的基于有色噪聲的語音增強方法,其特征在于,
步驟1中,時延補償的具體方法為:
雙麥克風陣列采集的兩個通道的帶噪語音信號分別為x0(n)和x1(n),進行傅立葉變換到頻域,然后輸入到時延估計單元計算x0(n)和x1(n)的相位差τ0和τ1,根據相位差計算出兩個通道信號的相對延時ω0,然后進行延時-求和波束形成,表示為:X(n)=ω0(n)x0(n-τ0)+ω1(n)x1(n-τ1)。
4.根據權利要求1所述的基于有色噪聲的語音增強方法,其特征在于,步驟2中,
S21,雙麥克風陣列接收到帶噪語音信號為X(n),計算得到帶噪語音信號的協方差矩陣為:
其中,X(n)表示帶噪語音信號,E[·]表示求矩陣期望,上標H表示共軛轉置,Rs表示純凈語音信號的協方差矩陣,Rn表示噪聲信號的協方差矩陣;
S22,對協方差矩陣進行特征值分解,表示為:
Rx=UΛxUT;
其中,Λx為Rx的K個特征值構成的K維對角陣,Λx的所有特征值中有M個較大的特征值,0<M<K,而其余K-M個特征值很小,都等于σN2,σN2表示噪聲方差;
令U是矩陣Rx的特征向量矩陣,因而U是正交矩陣,滿足:
I=UxUxT+UpUpT
其中,I為K維單位矩陣;Us為信號子空間,包含目標語音信號和噪聲;UP為噪聲子空間,只包含噪聲。
5.根據權利要求1所述的基于有色噪聲的語音增強方法,其特征在于,步驟3中,
對所述帶噪語音信號進行KL變換,表示為:
E{UTX}=0;
cov{UTX}=diag(Λx,1+σN2I,σN2I);
cov{UpTX}=σN2I;
其中,U是矩陣Rx的特征向量矩陣,UP為噪聲子空間,Λx,1為Rx的特征值構成的對角陣。
6.根據權利要求1所述的基于有色噪聲的語音增強方法,其特征在于,
步驟4中,將代表噪聲子空間的KL分量置零,同時在信號子空間內對所述語音處理信號的KL進行最小均方誤差估計。
7.根據權利要求6所述的基于有色噪聲的語音增強方法,其特征在于,
最小均方誤差估計的計算方法為:
先驗信噪比ξk表示為:
后驗信噪比γk表示為:
其中,Xk為帶噪語音信號X的傅里葉變換,λs(k)為第k個頻率分量下的語音方差,λn(k)為第K個頻率分量下的噪聲方差,Sk為純凈語音的傅里葉變化,Nk為噪聲的傅里葉變換;
得到ξk和γk后,定義νk為:則語音幅度譜估計值為:
其MMSE增益可表示為:
最后再經KL逆變換,輸出增強語音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門理工學院,未經廈門理工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710608441.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:頻域包絡的矢量量化方法和裝置
- 下一篇:基于麥克風的音頻處理方法和裝置





