[發(fā)明專利]語音增強方法有效
| 申請?zhí)枺?/td> | 201910296437.7 | 申請日: | 2016-01-14 |
| 公開(公告)號: | CN110070883B | 公開(公告)日: | 2023-07-28 |
| 發(fā)明(設(shè)計)人: | 張軍;陳鑫源;潘偉鏘;寧更新;馮義志;余華;季飛;陳芳炯 | 申請(專利權(quán))人: | 深圳市韶音科技有限公司 |
| 主分類號: | G10L21/0272 | 分類號: | G10L21/0272;G10L21/038 |
| 代理公司: | 深圳市威世博知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44280 | 代理人: | 李慶波 |
| 地址: | 518108 廣東省深圳市寶安區(qū)石*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 增強 方法 | ||
1.一種語音增強方法,其特征在于,包括:
同步采集氣導(dǎo)檢測語音和非氣導(dǎo)檢測語音,檢測氣導(dǎo)檢測語音的端點,然后利用氣導(dǎo)檢測語音的純噪聲段建立氣導(dǎo)噪聲統(tǒng)計模型;
利用所述氣導(dǎo)噪聲統(tǒng)計模型修正聯(lián)合統(tǒng)計模型,并對氣導(dǎo)檢測語音幀進行分類;
根據(jù)分類結(jié)果對應(yīng)的氣導(dǎo)語音線性頻譜統(tǒng)計模型和氣導(dǎo)噪聲統(tǒng)計模型計算最佳氣導(dǎo)語音濾波器;
利用所述最佳氣導(dǎo)語音濾波器對氣導(dǎo)檢測語音進行濾波增強后得到濾波增強語音,
根據(jù)非氣導(dǎo)語音到氣導(dǎo)語音的映射模型,將非氣導(dǎo)檢測語音轉(zhuǎn)換為氣導(dǎo)的映射語音;
計算第幀的濾波增強語音的權(quán)重和第幀的映射語音的權(quán)重;
通過以下公式將濾波增強語音與映射語音加權(quán)疊加,得到融合增強語音:
;
其中,所述濾波增強語音是對同步采集的氣導(dǎo)檢測語音和非氣導(dǎo)檢測語音中的氣導(dǎo)檢測語音進行增強濾波獲得,所述映射語音是對非氣導(dǎo)檢測語音進行非氣導(dǎo)語音到氣導(dǎo)語音的轉(zhuǎn)換獲得;所述聯(lián)合統(tǒng)計模型和所述氣導(dǎo)語音線性頻譜統(tǒng)計模型由同步采集的干凈的氣導(dǎo)訓(xùn)練語音和非氣導(dǎo)訓(xùn)練語音預(yù)先建立,所述聯(lián)合統(tǒng)計模型為倒頻域聯(lián)合統(tǒng)計模型;所述映射模型由所述同步采集的干凈的氣導(dǎo)訓(xùn)練語音和非氣導(dǎo)訓(xùn)練語音預(yù)先建立;
其中,將所述氣導(dǎo)的映射語音與所述濾波增強語音進行加權(quán)融合的步驟之前,進一步包括:
根據(jù)對氣導(dǎo)檢測語音進行端點檢測得到的語音信號起點時刻,截取濾波增強語音中信號起點前的所有數(shù)據(jù)幀,求平均功率作為噪聲幀的功率;
信噪比通過以下公式計算:
其中是第幀濾波增強語音的功率。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述權(quán)重和通過以下公式計算:
;
;
其中,和分別為第幀濾波增強語音和映射語音的幅度方差,為第幀濾波增強語音的信噪比,、為預(yù)設(shè)的常數(shù)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述同步采集氣導(dǎo)檢測語音和非氣導(dǎo)檢測語音,檢測氣導(dǎo)檢測語音的端點,然后利用氣導(dǎo)檢測語音的純噪聲段建立氣導(dǎo)噪聲統(tǒng)計模型的步驟包括:
同步采集氣導(dǎo)檢測語音和非氣導(dǎo)檢測語音并分幀;
根據(jù)非氣導(dǎo)檢測語音幀的短時自相關(guān)函數(shù)和短時能量,計算每幀非氣導(dǎo)檢測語音幀的短時平均過門限率,當(dāng)所述短時平均過門限率大于預(yù)設(shè)的門限值時,判斷所述非氣導(dǎo)檢測語音幀為語音信號,否則為噪聲;
根據(jù)每個所述非氣導(dǎo)檢測語音幀的判決結(jié)果得到非氣導(dǎo)檢測語音信號的端點位置;
將檢測到的所述非氣導(dǎo)檢測語音信號端點對應(yīng)的時刻作為氣導(dǎo)檢測語音的端點,提取氣導(dǎo)檢測語音中的純噪聲段;
計算氣導(dǎo)檢測語音中純噪聲段信號的線性頻譜均值,保存該均值為氣導(dǎo)噪聲的統(tǒng)計模型參數(shù)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述短時平均過門限率通過以下公式計算:
;
其中為取符號運算,為調(diào)節(jié)因子,為窗函數(shù),為門限初值,為所述短時自相關(guān)函數(shù),為所述短時能量,為所述短時平均過門限率。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述聯(lián)合統(tǒng)計模型通過以下步驟進行修正:
將聯(lián)合統(tǒng)計模型的參數(shù)轉(zhuǎn)換到線性頻譜域;
按氣導(dǎo)干凈語音和氣導(dǎo)噪聲在線性頻譜域是加性關(guān)系對聯(lián)合統(tǒng)計模型中的氣導(dǎo)語音數(shù)據(jù)流參數(shù)進行修正;
將修正后的線性頻譜域聯(lián)合統(tǒng)計模型參數(shù)轉(zhuǎn)換回原來的特征域,得到修正后的聯(lián)合統(tǒng)計模型;
其中,所述聯(lián)合統(tǒng)計模型中的所述氣導(dǎo)語音數(shù)據(jù)流參數(shù)為混合高斯模型或隱馬爾科夫模型中高斯分量的均值和協(xié)方差。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市韶音科技有限公司,未經(jīng)深圳市韶音科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910296437.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





