[發(fā)明專利]語音降噪算法在審

申請?zhí)枺?/td>	201810274913.0	申請日：	2018-03-29
公開（公告）號：	CN108428456A	公開（公告）日：	2018-08-21
發(fā)明（設(shè)計）人：	禹深義;婁進(jìn)凱;張勤磊;胥楊;李萬順;高峻峰;丁輝;付琰;于江菊	申請（專利權(quán)）人：	浙江凱池電子科技有限公司
主分類號：	G10L21/0224	分類號：	G10L21/0224;G10L21/0232
代理公司：	鄭州金成知識產(chǎn)權(quán)事務(wù)所(普通合伙) 41121	代理人：	郭增欣
地址：	310012 浙江省杭州市***	國省代碼：	浙江;33
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	能量譜信噪比幀數(shù)據(jù) 語音先驗降噪算法噪聲估計譜估計短時傅里葉變換純凈語音信號傅里葉反變換前一幀數(shù)據(jù) 純凈信號純凈語音端點監(jiān)測仿真軟件頻率分量聲音樣本算法結(jié)合算法模型準(zhǔn)確度相位譜有效幀門限噪聲合成采集檢測
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開了一種語音降噪算法：使用仿真軟件采集聲音樣本，并進(jìn)行A/D轉(zhuǎn)換；將經(jīng)過AD采樣后的帶噪語音進(jìn)行短時傅里葉變換，并對每一幀信號進(jìn)行VAD檢測，根據(jù)VAD門限，得出每一幀信號時有效幀還是無效幀，根據(jù)當(dāng)前幀的帶噪語音的能量譜和噪聲估計的能量譜，計算當(dāng)前幀數(shù)據(jù)每一頻率分量的后驗信噪比，利用當(dāng)前幀的后驗信噪比結(jié)合前一幀數(shù)據(jù)的譜估計器，計算當(dāng)前幀的先驗信噪比，利用先驗信噪比結(jié)合logMMSE算法模型，計算出當(dāng)前幀數(shù)據(jù)的譜估計器，并計算出純凈信號的能量譜，根據(jù)純凈語音能量譜與當(dāng)前幀數(shù)據(jù)的相位譜，進(jìn)行短時傅里葉反變換并合成，形成連續(xù)的純凈語音信號。本發(fā)明利用多種端點監(jiān)測算法結(jié)合噪聲進(jìn)行估計，進(jìn)而提高噪聲估計的準(zhǔn)確度。

技術(shù)領(lǐng)域：

本發(fā)明涉及一種算法，特別是涉及一種語音降噪算法。

背景技術(shù)：

無論身處何處，我們都被噪聲所包圍，噪聲可以是平穩(wěn)的，即不隨時間而改變，如電腦風(fēng)扇噪聲；噪聲也可以是非平穩(wěn)的，比如餐館里面的北京噪聲，很多人說話的同時還夾雜著廚房里傳出來的聲音，這種餐館噪聲的頻域以及時域特征隨著周圍餐桌上人們的對話以及服務(wù)員與顧客交流內(nèi)容的改變而改變。

發(fā)明內(nèi)容：

本發(fā)明所要解決的技術(shù)問題是：克服現(xiàn)有技術(shù)的不足，提供一種能夠提高噪聲估計的準(zhǔn)確度的語音降噪算法。

本發(fā)明為解決技術(shù)問題所采取的技術(shù)方案是：

一種語音降噪算法，包括以下步驟：

(1)使用仿真軟件對聲音樣本進(jìn)行前期的采集與處理，并進(jìn)行A/D轉(zhuǎn)換；

(2)將前級經(jīng)過AD采樣后的一段帶噪語音，經(jīng)過分幀(20ms)加窗后進(jìn)行短時傅里葉變換，由信號的時域處理轉(zhuǎn)換為信號的頻時處理，計算出每一幀信號的短時能量譜和相位譜；

其中x(m)為輸入信號，w(m)是分析窗，此處取漢明窗，它在時間上反轉(zhuǎn)并且有n個樣本的偏移量，ω為頻率變量，N為短時傅里葉變換的分辨率，這里取N＝128,Y_i(k)為第幀數(shù)據(jù)，第k條譜線頻率分量f_k的能量譜；

(3)對經(jīng)過傅里葉分析處理的每一幀信號進(jìn)行VAD檢測，根據(jù)VAD門限，得出每一幀信號時有效幀還是無效幀，如果是無效幀，即不含有效語音的幀，更新噪聲估計的能量譜，如果是有效幀，則不動作；

(4)根據(jù)當(dāng)前幀的帶噪語音的能量譜和噪聲估計的能量譜，計算當(dāng)前幀數(shù)據(jù)每一頻率分量的后驗信噪比，如下式所示：

其中Y_i²(k)為當(dāng)前幀數(shù)據(jù)的頻率分量k的能量值，λ_d(k)為噪聲估計能量譜中頻率分量k的能量值，γ_i(k)為當(dāng)前幀數(shù)據(jù)的k頻率分量的后驗信噪比；

(1)利用當(dāng)前幀的后驗信噪比結(jié)合前一幀數(shù)據(jù)的譜估計器，計算當(dāng)前幀的先驗信噪比，如下式所示：

ξ_i(k)≈αξ_i-1(k)+(1-α)(γ_i(k)-1)

其中α為平滑因子，一般取0.9-1.0，這里取0.95，ξ_i-1(k)為上一幀數(shù)據(jù)頻率分量k的先驗信噪比，γ_i(k)為當(dāng)前幀數(shù)據(jù)頻率分量k的后驗信噪比，ξ_i(k)為當(dāng)前幀數(shù)據(jù)頻率分量k的先驗信噪比；

(2)根據(jù)計算出的當(dāng)前幀的先驗信噪比，結(jié)合logMMSE算法模型，計算出當(dāng)前幀數(shù)據(jù)的譜估計器，并計算出純凈信號的能量譜，如下式所示：

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江凱池電子科技有限公司，未經(jīng)浙江凱池電子科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810274913.0/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：聲紋特征的采集方法及系統(tǒng)
下一篇：音頻去重方法及裝置

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L21-00 為了改變語音信號的質(zhì)量或其可識度而處理語音信號，以產(chǎn)生另一種可聽的或非可聽的信號，例如視覺信號或觸覺信號
G10L21-02 .語音增強，例如降低噪聲或消除回聲
G10L21-04 .時間壓縮或擴展
G10L21-06 .將語音轉(zhuǎn)換成非可聽表達(dá)形式，例如語音可視化、觸覺輔助的語音處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點擊【登陸】【注冊】