[發明專利]一種基于Kullback-Leibler差異的語音增強方法有效
| 申請號: | 201811246250.8 | 申請日: | 2018-10-25 |
| 公開(公告)號: | CN109346097B | 公開(公告)日: | 2023-07-14 |
| 發明(設計)人: | 王慧;黃青華;張麗麗;柯晨光 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L25/27 |
| 代理公司: | 上海上大專利事務所(普通合伙) 31205 | 代理人: | 陸聰明 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 kullback leibler 差異 語音 增強 方法 | ||
1.一種基于Kullback-Leibler差異的語音增強方法,其特征在于,包括以下步驟:
1)、對含有噪聲的語音信號進行分幀,將每一幀信號看作穩態信號;
2)、對處理后的每一幀語音信號分別進行分析處理,利用KL差異選擇原理依次選出最佳的原子a1,a2,...ak,用選出的最佳原子計算有理正交基函數Bk,然后用權重系數與該基函數組合得到增強后的重構信號;
3)、將N次分解后得到的重構信號疊加得到增強后的純凈語音信號;
4)、根據代價函數得到最佳分解次數;
上述步驟2)中所述的根據KL差異選擇原則選出最佳原子并重構每次分解的增強信號,具體步驟如下:
對于含有噪聲的原始語音信號f(t)表示為如下形式:
f(t)=s(t)+n(t)????????????????????????????????????(1)
其中,s(t)為純凈語音信號,即需要重構得到的信號,n(t)為噪聲信號,以下用f替代f(t);
對于第一次分解,令f1=f,分解后得到重構信號表示為:
其中
為點ak的L2單位模化了的核,ak為模小于1的原子,<f1,e{a1}(z)>表示內積,z為單位圓的邊界,其模為1;R1為第二階標準誤差,進一步寫成:
根據公式(2)和(4),f2表示為:
f2即作為第二次分解時的輸入信號,并對f2重復上述分解過程得到重構信號:
以此類推,經過第k次分解后,重構信號寫為:
其中Bk(z)即為有理正交基函數,表示為:
從公式(7)和(8)看出,該分解算法的核心是選取最佳的原子ak;在每一次分解中,利用KL差異選擇原理來選取最佳原子,KL差異的定義為:
其中yi為原始信號,為重構信號,M為信號長度;KL差異是衡量兩個信號之間相似程度的重要標準,從公式(9)看出DKL值越小,兩個信號越相似,表明重構出的信號越逼近原始信號;所以,在每一次分解后求解重構信號與原始信號的KL差異值并尋找使得該值最小的原子,即:
其中C為能夠選擇原子的集合,即:
Δm是等間隔劃分區間(-1,1)的步長;
至此,已經選取出了最佳的原子,之后利用這些最佳原子重構出增強后的信號;通常情況下,取公式(7)右邊的前半部分作為重構信號,舍棄后半部分的標準誤差,每次分解后的重構信號用如下形式表示:
基函數與權重系數組合得到的重構信號如公式(12)所示,權重系數即為接下來將N次分解后的重構信號疊加即得到最終增強后的純凈語音信號,其公式表示為:
上述步驟4)中所述的根據代價函數得到最佳分解次數,其具體如下:
在步驟2)、3)中另一個關鍵因素就是分解次數的選擇,次數過少會導致降噪效果不理想,次數過多又會導致過大的計算量;因此,用代價函數來確定最佳的分解次數;
均方根誤差是觀測值與真實值偏差的平方和觀測次數比值的平方根,它能夠很好的反映出測量的精密程度,其定義如下:
其中n為數據長度;
利用每次分解的RMSE衰減差值作為代價函數確定最佳分解次數,即:
其中i表示分解次數;由公式(14)得出RMSE越小,信號重構越精確,所以當ΔRi小于0時,則表明重構越接近原始信號;因此,使信號持續分解直到ΔRi大于0則停止分解,此時的分解次數i即為最佳分解次數,此時得到的重構信號也是最純凈的語音信號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811246250.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于語音識別過程的回聲消除方法及裝置
- 下一篇:一種回聲消除方法及終端





