[發(fā)明專利]語音降噪算法在審
| 申請?zhí)枺?/td> | 201810274913.0 | 申請日: | 2018-03-29 |
| 公開(公告)號: | CN108428456A | 公開(公告)日: | 2018-08-21 |
| 發(fā)明(設(shè)計)人: | 禹深義;婁進(jìn)凱;張勤磊;胥楊;李萬順;高峻峰;丁輝;付琰;于江菊 | 申請(專利權(quán))人: | 浙江凱池電子科技有限公司 |
| 主分類號: | G10L21/0224 | 分類號: | G10L21/0224;G10L21/0232 |
| 代理公司: | 鄭州金成知識產(chǎn)權(quán)事務(wù)所(普通合伙) 41121 | 代理人: | 郭增欣 |
| 地址: | 310012 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 能量譜 信噪比 幀數(shù)據(jù) 語音 先驗 降噪算法 噪聲估計 譜估計 短時傅里葉變換 純凈語音信號 傅里葉反變換 前一幀數(shù)據(jù) 純凈信號 純凈語音 端點監(jiān)測 仿真軟件 頻率分量 聲音樣本 算法結(jié)合 算法模型 準(zhǔn)確度 相位譜 有效幀 門限 噪聲 合成 采集 檢測 | ||
本發(fā)明公開了一種語音降噪算法:使用仿真軟件采集聲音樣本,并進(jìn)行A/D轉(zhuǎn)換;將經(jīng)過AD采樣后的帶噪語音進(jìn)行短時傅里葉變換,并對每一幀信號進(jìn)行VAD檢測,根據(jù)VAD門限,得出每一幀信號時有效幀還是無效幀,根據(jù)當(dāng)前幀的帶噪語音的能量譜和噪聲估計的能量譜,計算當(dāng)前幀數(shù)據(jù)每一頻率分量的后驗信噪比,利用當(dāng)前幀的后驗信噪比結(jié)合前一幀數(shù)據(jù)的譜估計器,計算當(dāng)前幀的先驗信噪比,利用先驗信噪比結(jié)合logMMSE算法模型,計算出當(dāng)前幀數(shù)據(jù)的譜估計器,并計算出純凈信號的能量譜,根據(jù)純凈語音能量譜與當(dāng)前幀數(shù)據(jù)的相位譜,進(jìn)行短時傅里葉反變換并合成,形成連續(xù)的純凈語音信號。本發(fā)明利用多種端點監(jiān)測算法結(jié)合噪聲進(jìn)行估計,進(jìn)而提高噪聲估計的準(zhǔn)確度。
技術(shù)領(lǐng)域:
本發(fā)明涉及一種算法,特別是涉及一種語音降噪算法。
背景技術(shù):
無論身處何處,我們都被噪聲所包圍,噪聲可以是平穩(wěn)的,即不隨時間而改變,如電腦風(fēng)扇噪聲;噪聲也可以是非平穩(wěn)的,比如餐館里面的北京噪聲,很多人說話的同時還夾雜著廚房里傳出來的聲音,這種餐館噪聲的頻域以及時域特征隨著周圍餐桌上人們的對話以及服務(wù)員與顧客交流內(nèi)容的改變而改變。
發(fā)明內(nèi)容:
本發(fā)明所要解決的技術(shù)問題是:克服現(xiàn)有技術(shù)的不足,提供一種能夠提高噪聲估計的準(zhǔn)確度的語音降噪算法。
本發(fā)明為解決技術(shù)問題所采取的技術(shù)方案是:
一種語音降噪算法,包括以下步驟:
(1)使用仿真軟件對聲音樣本進(jìn)行前期的采集與處理,并進(jìn)行A/D轉(zhuǎn)換;
(2)將前級經(jīng)過AD采樣后的一段帶噪語音,經(jīng)過分幀(20ms)加窗后進(jìn)行短時傅里葉變換,由信號的時域處理轉(zhuǎn)換為信號的頻時處理,計算出每一幀信號的短時能量譜和相位譜;
其中x(m)為輸入信號,w(m)是分析窗,此處取漢明窗,它在時間上反轉(zhuǎn)并且有n個樣本的偏移量,ω為頻率變量,N為短時傅里葉變換的分辨率,這里取N=128,Yi(k)為第幀數(shù)據(jù),第k條譜線頻率分量fk的能量譜;
(3)對經(jīng)過傅里葉分析處理的每一幀信號進(jìn)行VAD檢測,根據(jù)VAD門限,得出每一幀信號時有效幀還是無效幀,如果是無效幀,即不含有效語音的幀,更新噪聲估計的能量譜,如果是有效幀,則不動作;
(4)根據(jù)當(dāng)前幀的帶噪語音的能量譜和噪聲估計的能量譜,計算當(dāng)前幀數(shù)據(jù)每一頻率分量的后驗信噪比,如下式所示:
其中Yi2(k)為當(dāng)前幀數(shù)據(jù)的頻率分量k的能量值,λd(k)為噪聲估計能量譜中頻率分量k的能量值,γi(k)為當(dāng)前幀數(shù)據(jù)的k頻率分量的后驗信噪比;
(1)利用當(dāng)前幀的后驗信噪比結(jié)合前一幀數(shù)據(jù)的譜估計器,計算當(dāng)前幀的先驗信噪比,如下式所示:
ξi(k)≈αξi-1(k)+(1-α)(γi(k)-1)
其中α為平滑因子,一般取0.9-1.0,這里取0.95,ξi-1(k)為上一幀數(shù)據(jù)頻率分量k的先驗信噪比,γi(k)為當(dāng)前幀數(shù)據(jù)頻率分量k的后驗信噪比,ξi(k)為當(dāng)前幀數(shù)據(jù)頻率分量k的先驗信噪比;
(2)根據(jù)計算出的當(dāng)前幀的先驗信噪比,結(jié)合logMMSE算法模型,計算出當(dāng)前幀數(shù)據(jù)的譜估計器,并計算出純凈信號的能量譜,如下式所示:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江凱池電子科技有限公司,未經(jīng)浙江凱池電子科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810274913.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:聲紋特征的采集方法及系統(tǒng)
- 下一篇:音頻去重方法及裝置
- 具有時序控制器的驅(qū)動單元及其驅(qū)動方法
- 錄音機及其加密、解密單元,錄音文件加密、解密方法
- 分發(fā)控制系統(tǒng)、分發(fā)控制方法和計算機可讀存儲介質(zhì)
- 分發(fā)控制系統(tǒng)、分發(fā)控制方法和計算機可讀存儲介質(zhì)
- 數(shù)據(jù)處理裝置及數(shù)據(jù)處理方法
- VR視頻轉(zhuǎn)碼方法及裝置
- 一種摳像方法及系統(tǒng)
- 幀數(shù)據(jù)在線處理方法、裝置和計算機設(shè)備
- 一種屏幕共享方法、裝置、電子設(shè)備及存儲介質(zhì)
- 幀數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲介質(zhì)





