[發(fā)明專利]語(yǔ)音降噪算法在審
| 申請(qǐng)?zhí)枺?/td> | 201810274913.0 | 申請(qǐng)日: | 2018-03-29 |
| 公開(公告)號(hào): | CN108428456A | 公開(公告)日: | 2018-08-21 |
| 發(fā)明(設(shè)計(jì))人: | 禹深義;婁進(jìn)凱;張勤磊;胥楊;李萬(wàn)順;高峻峰;丁輝;付琰;于江菊 | 申請(qǐng)(專利權(quán))人: | 浙江凱池電子科技有限公司 |
| 主分類號(hào): | G10L21/0224 | 分類號(hào): | G10L21/0224;G10L21/0232 |
| 代理公司: | 鄭州金成知識(shí)產(chǎn)權(quán)事務(wù)所(普通合伙) 41121 | 代理人: | 郭增欣 |
| 地址: | 310012 浙江省杭州市*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 能量譜 信噪比 幀數(shù)據(jù) 語(yǔ)音 先驗(yàn) 降噪算法 噪聲估計(jì) 譜估計(jì) 短時(shí)傅里葉變換 純凈語(yǔ)音信號(hào) 傅里葉反變換 前一幀數(shù)據(jù) 純凈信號(hào) 純凈語(yǔ)音 端點(diǎn)監(jiān)測(cè) 仿真軟件 頻率分量 聲音樣本 算法結(jié)合 算法模型 準(zhǔn)確度 相位譜 有效幀 門限 噪聲 合成 采集 檢測(cè) | ||
1.一種語(yǔ)音降噪算法,包括以下步驟:
(1)使用仿真軟件對(duì)聲音樣本進(jìn)行前期的采集與處理,并進(jìn)行A/D轉(zhuǎn)換;
(2)將前級(jí)經(jīng)過(guò)AD采樣后的一段帶噪語(yǔ)音,經(jīng)過(guò)分幀(20ms)加窗后進(jìn)行短時(shí)傅里葉變換,由信號(hào)的時(shí)域處理轉(zhuǎn)換為信號(hào)的頻時(shí)處理,計(jì)算出每一幀信號(hào)的短時(shí)能量譜和相位譜;
其中x(m)為輸入信號(hào),w(m)是分析窗,此處取漢明窗,它在時(shí)間上反轉(zhuǎn)并且有n個(gè)樣本的偏移量,ω為頻率變量,N為短時(shí)傅里葉變換的分辨率,這里取N=128,Yi(k)為第幀數(shù)據(jù),第k條譜線頻率分量fk的能量譜;
(3)對(duì)經(jīng)過(guò)傅里葉分析處理的每一幀信號(hào)進(jìn)行VAD檢測(cè),根據(jù)VAD門限,得出每一幀信號(hào)時(shí)有效幀還是無(wú)效幀,如果是無(wú)效幀,即不含有效語(yǔ)音的幀,更新噪聲估計(jì)的能量譜,如果是有效幀,則不動(dòng)作;
(4)根據(jù)當(dāng)前幀的帶噪語(yǔ)音的能量譜和噪聲估計(jì)的能量譜,計(jì)算當(dāng)前幀數(shù)據(jù)每一頻率分量的后驗(yàn)信噪比,如下式所示:
其中Yi2(k)為當(dāng)前幀數(shù)據(jù)的頻率分量k的能量值,λd(k)為噪聲估計(jì)能量譜中頻率分量k的能量值,γi(k)為當(dāng)前幀數(shù)據(jù)的k頻率分量的后驗(yàn)信噪比;
(5)利用當(dāng)前幀的后驗(yàn)信噪比結(jié)合前一幀數(shù)據(jù)的譜估計(jì)器,計(jì)算當(dāng)前幀的先驗(yàn)信噪比,如下式所示:
ξi(k)≈αξi-1(k)+(1-α)(γi(k)-1)
其中α為平滑因子,一般取0.9-1.0,這里取0.95,ξi-1(k)為上一幀數(shù)據(jù)頻率分量k的先驗(yàn)信噪比,γi(k)為當(dāng)前幀數(shù)據(jù)頻率分量k的后驗(yàn)信噪比,ξi(k)為當(dāng)前幀數(shù)據(jù)頻率分量k的先驗(yàn)信噪比;
(6)根據(jù)計(jì)算出的當(dāng)前幀的先驗(yàn)信噪比,結(jié)合logMMSE算法模型,計(jì)算出當(dāng)前幀數(shù)據(jù)的譜估計(jì)器,并計(jì)算出純凈信號(hào)的能量譜,如下式所示:
其中ξi(k)為當(dāng)前幀數(shù)據(jù)頻率分量k的先驗(yàn)信噪比,為當(dāng)前幀數(shù)據(jù)后驗(yàn)信噪比的維納估計(jì),Yi(k)為當(dāng)前幀數(shù)據(jù)頻率分量k的帶噪語(yǔ)音的能量譜,Xk為當(dāng)前幀數(shù)據(jù)頻率分量k的純凈語(yǔ)音的能量譜;
(7)根據(jù)計(jì)算出的純凈語(yǔ)音能量譜與計(jì)算出的當(dāng)前幀數(shù)據(jù)的相位譜,進(jìn)行短時(shí)傅里葉反變換,將信號(hào)從頻域轉(zhuǎn)換到時(shí)域,再對(duì)每一幀數(shù)據(jù)進(jìn)行合成,形成連續(xù)的純凈語(yǔ)音信號(hào)。
2.根據(jù)權(quán)利要求1所述的語(yǔ)音降噪算法,其特征是:步驟(3)中的VAD檢測(cè),使用能熵比進(jìn)行檢測(cè),具體能熵比計(jì)算過(guò)程如下所示:
(1)計(jì)算當(dāng)前幀數(shù)據(jù)的每個(gè)頻率分量的歸一化譜概率密度函數(shù),如下式所示:
其中Yi(k)為第k條譜線頻率分量fk的能量譜,為所有頻率分量的能量和,pi(k)為第i幀第k個(gè)頻率分量fk對(duì)應(yīng)的概率密度,N為短時(shí)傅里葉變換的分辨率,這里取N=128;
(2)計(jì)算當(dāng)前幀數(shù)據(jù)的短時(shí)譜熵,如下式所示:
其中Hi為當(dāng)前幀數(shù)據(jù)的短時(shí)譜熵;
(3)計(jì)算當(dāng)前幀數(shù)據(jù)的能量,如下式所示:
LEi=log10(1+AMPi/a)
其中Yi2(k)是當(dāng)前幀數(shù)據(jù)的能量,AMPi為當(dāng)前幀數(shù)據(jù)的能量,LEi是改進(jìn)的能量關(guān)系,a是一個(gè)常數(shù),這里取1.5:
(4)計(jì)算當(dāng)前幀數(shù)據(jù)的能熵比,如下式所示:
其中EEFi就是當(dāng)前幀數(shù)據(jù)的能熵比,根據(jù)EEFi的值,判斷是否為有效語(yǔ)音,如果是,則不更新噪聲估計(jì)的能量譜,如果不是,這里取EEFi<1.6為無(wú)效語(yǔ)音,則更新噪聲能量譜λd(k),λd(k)=0.9*λd-1(k)+0.1*Yi2(k)
3.根據(jù)權(quán)利要求1所述的語(yǔ)音降噪算法,其特征是:在進(jìn)行語(yǔ)音降噪算法的過(guò)程中,選擇使用數(shù)字信號(hào)處理器TMS320VC5509A作為主處理芯片,使用音頻編解碼器TLV320AIC23B作為AD/DA芯片。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江凱池電子科技有限公司,未經(jīng)浙江凱池電子科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810274913.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:聲紋特征的采集方法及系統(tǒng)
- 下一篇:音頻去重方法及裝置
- 同類專利
- 專利分類
- 具有時(shí)序控制器的驅(qū)動(dòng)單元及其驅(qū)動(dòng)方法
- 錄音機(jī)及其加密、解密單元,錄音文件加密、解密方法
- 分發(fā)控制系統(tǒng)、分發(fā)控制方法和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 分發(fā)控制系統(tǒng)、分發(fā)控制方法和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 數(shù)據(jù)處理裝置及數(shù)據(jù)處理方法
- VR視頻轉(zhuǎn)碼方法及裝置
- 一種摳像方法及系統(tǒng)
- 幀數(shù)據(jù)在線處理方法、裝置和計(jì)算機(jī)設(shè)備
- 一種屏幕共享方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 幀數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)





