[發(fā)明專利]語音增強(qiáng)方法有效
| 申請?zhí)枺?/td> | 201910296437.7 | 申請日: | 2016-01-14 |
| 公開(公告)號: | CN110070883B | 公開(公告)日: | 2023-07-28 |
| 發(fā)明(設(shè)計)人: | 張軍;陳鑫源;潘偉鏘;寧更新;馮義志;余華;季飛;陳芳炯 | 申請(專利權(quán))人: | 深圳市韶音科技有限公司 |
| 主分類號: | G10L21/0272 | 分類號: | G10L21/0272;G10L21/038 |
| 代理公司: | 深圳市威世博知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44280 | 代理人: | 李慶波 |
| 地址: | 518108 廣東省深圳市寶安區(qū)石*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 增強(qiáng) 方法 | ||
本發(fā)明公開一種語音增強(qiáng)方法,包括:計算第m幀的濾波增強(qiáng)語音xsubgt;m/subgt;的權(quán)重和第m幀的映射語音ysubgt;m/subgt;的權(quán)重通過以下公式將濾波增強(qiáng)語音xsubgt;m/subgt;與映射語音ysubgt;m/subgt;加權(quán)疊加,得到融合增強(qiáng)語音:其中濾波增強(qiáng)語音是對同步采集的氣導(dǎo)檢測語音和非氣導(dǎo)檢測語音中的氣導(dǎo)檢測語音進(jìn)行增強(qiáng)濾波獲得,映射語音是對非氣導(dǎo)檢測語音進(jìn)行非氣導(dǎo)語音到氣導(dǎo)語音的轉(zhuǎn)換獲得。
技術(shù)領(lǐng)域
本發(fā)明是申請人于2016年01月14日提出的名為“一種基于統(tǒng)計模型的雙傳感器語音增強(qiáng)方法與裝置”、申請?zhí)枮?01610025390的專利申請的分案申請,本發(fā)明涉及數(shù)字信號處理領(lǐng)域,特別涉及一種語音增強(qiáng)方法。
背景技術(shù)
通信是現(xiàn)代人與人之間進(jìn)行交流的重要手段,而語音作為通信系統(tǒng)中最常見的形式,其質(zhì)量直接影響了人們獲取信息的準(zhǔn)確性。語音在傳播的過程中,難免受到各種各樣環(huán)境噪聲的干擾,其音質(zhì)、可懂度都將明顯下降,因此在實際應(yīng)用中往往會利用語音增強(qiáng)技術(shù)對噪聲環(huán)境下的語音進(jìn)行處理。
語音增強(qiáng)技術(shù)能從噪聲背景中提取有用的語音信號,是抑制、降低噪聲干擾的基本手段。傳統(tǒng)的語音增強(qiáng)對象是基于空氣傳導(dǎo)傳感器(如麥克風(fēng)等)采集的語音信號,根據(jù)處理方式的不同,常用的語音增強(qiáng)技術(shù)可以分為基于模型的方法和非基于模型的方法兩類。非基于模型的增強(qiáng)方法有譜減法、濾波法、小波變換法等,它們通常假定噪聲是相對平穩(wěn)的,當(dāng)噪聲變化過快時,其增強(qiáng)效果并不能令人滿意。基于模型的語音增強(qiáng)方法則首先對語音信號和噪聲信號建立統(tǒng)計模型,然后通過模型獲取干凈語音的最小均方誤差估計或最大后驗概率估計。這類方法能夠避免音樂噪聲的產(chǎn)生,并能處理非平穩(wěn)噪聲。但由于上述的基于模型和非基于模型的方法均基于麥克風(fēng)等空氣傳導(dǎo)語音傳感器,其信號容易受環(huán)境中的聲學(xué)噪聲影響,特別是在強(qiáng)噪聲環(huán)境下,系統(tǒng)性能會大幅度下降。
為解決強(qiáng)噪聲對語音處理系統(tǒng)的影響,有別于傳統(tǒng)的空氣傳導(dǎo)傳感器,非空氣傳導(dǎo)的語音傳感器利用說話人聲帶、顎骨等部位的振動來帶動傳感器中的簧片或者碳膜發(fā)生變化,改變其電阻值,使其兩端的電壓發(fā)生變化,從而將振動信號轉(zhuǎn)化為電信號,即語音信號。由于空氣中傳導(dǎo)的聲波無法使非空氣傳導(dǎo)傳感器的簧片或者碳膜發(fā)生形變,因此非空氣傳導(dǎo)傳感器不受空氣傳導(dǎo)聲音的影響,具有很強(qiáng)的抗環(huán)境聲學(xué)噪聲干擾的能力。但因非空氣傳導(dǎo)傳感器采集的是通過顎骨、肌肉、皮膚等的振動傳播的語音,表現(xiàn)為發(fā)悶、含糊不清,其高頻部分丟失嚴(yán)重,語音可懂度較差,制約了非空氣傳導(dǎo)技術(shù)的實際應(yīng)用。
鑒于空氣傳導(dǎo)與非空氣傳導(dǎo)傳感器的單獨應(yīng)用都存在一定的缺陷,近年來出現(xiàn)了一些結(jié)合兩者優(yōu)點的語音增強(qiáng)方法。這些方法利用空氣傳導(dǎo)傳感器語音和非空氣傳導(dǎo)傳感器語音的互補(bǔ)性,采用多傳感器融合技術(shù)來實現(xiàn)語音增強(qiáng)的目的,通常能取得比單傳感器語音增強(qiáng)系統(tǒng)更好的效果。但現(xiàn)有的空氣傳導(dǎo)傳感器與非空氣傳導(dǎo)傳感器結(jié)合的語音增強(qiáng)方法還存在以下不足:(1)空氣傳導(dǎo)傳感器語音與非空氣傳導(dǎo)傳感器語音通常獨立地進(jìn)行恢復(fù)處理,然后再將兩者恢復(fù)后的語音進(jìn)行融合,未能在空氣傳導(dǎo)傳感器語音和非空氣傳導(dǎo)傳感器語音的恢復(fù)過程中充分利用兩者之間的互補(bǔ)性;(2)在多變的強(qiáng)噪音環(huán)境下,空氣傳導(dǎo)傳感器語音純語音段的統(tǒng)計特性會被嚴(yán)重干擾,增強(qiáng)語音的信噪比也會降低,導(dǎo)致融合后語音增強(qiáng)效果不明顯。
發(fā)明內(nèi)容
本發(fā)明提供一種語音增強(qiáng)方法,包括:計算第m幀的濾波增強(qiáng)語音xm的權(quán)重和第m幀的映射語音ym的權(quán)重通過以下公式將濾波增強(qiáng)語音xm與映射語音ym加權(quán)疊加,得到融合增強(qiáng)語音:其中濾波增強(qiáng)語音是對同步采集的氣導(dǎo)檢測語音和非氣導(dǎo)檢測語音中的氣導(dǎo)檢測語音進(jìn)行增強(qiáng)濾波獲得,映射語音是對非氣導(dǎo)檢測語音進(jìn)行非氣導(dǎo)語音到氣導(dǎo)語音的轉(zhuǎn)換獲得。
本發(fā)明相對于現(xiàn)有技術(shù)具有如下的優(yōu)點及效果:
1、本發(fā)明在氣導(dǎo)語音增強(qiáng)過程中,結(jié)合非氣導(dǎo)傳感器語音和氣導(dǎo)傳感器語音來構(gòu)建當(dāng)前用于分類的語音統(tǒng)計模型以及進(jìn)行端點檢測,并據(jù)此構(gòu)造最佳氣導(dǎo)語音濾波器,提高了氣導(dǎo)語音的增強(qiáng)效果,顯著增加了整個系統(tǒng)的魯棒性;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市韶音科技有限公司,未經(jīng)深圳市韶音科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910296437.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 增強(qiáng)片及增強(qiáng)方法
- 圖像增強(qiáng)設(shè)備和圖像增強(qiáng)方法
- 圖像增強(qiáng)裝置、圖像增強(qiáng)方法
- 粉狀增強(qiáng)減水劑及摻有粉狀增強(qiáng)減水劑的增強(qiáng)水泥
- 增強(qiáng)片、增強(qiáng)構(gòu)件、增強(qiáng)套件、增強(qiáng)片的制造方法及增強(qiáng)構(gòu)件的制造方法
- 增強(qiáng)片、增強(qiáng)構(gòu)件、增強(qiáng)套件、增強(qiáng)片的制造方法及增強(qiáng)構(gòu)件的制造方法
- 使用增強(qiáng)模型的增強(qiáng)現(xiàn)實系統(tǒng)
- 增強(qiáng)片及增強(qiáng)結(jié)構(gòu)體
- 圖像增強(qiáng)方法和圖像增強(qiáng)裝置
- 增強(qiáng)現(xiàn)實鏡片、增強(qiáng)現(xiàn)實眼鏡及增強(qiáng)現(xiàn)實成像方法





