[發(fā)明專利]一種消除語音信號中的環(huán)境噪聲的方法無效
| 申請?zhí)枺?/td> | 200910020840.3 | 申請日: | 2009-01-08 |
| 公開(公告)號: | CN101458931A | 公開(公告)日: | 2009-06-17 |
| 發(fā)明(設(shè)計)人: | 趙仁宏;陳淮琰 | 申請(專利權(quán))人: | 無敵科技(西安)有限公司 |
| 主分類號: | G10L21/02 | 分類號: | G10L21/02 |
| 代理公司: | 西安智邦專利商標代理有限公司 | 代理人: | 商宇科 |
| 地址: | 710075陜西省*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 消除 語音 信號 中的 環(huán)境噪聲 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種消除噪聲的方法,尤其是一種消除語音信號中的環(huán)境噪聲的方法。
背景技術(shù)
噪聲(Noise)為一種干擾及妨礙人們正常工作、學(xué)習(xí)及休息的聲音。信號在傳輸過程中,多少都會受到一些不需要的額外能量(即為噪聲)的干擾,噪聲的干擾,通常都會造成信號的失真,其來源通常來自系統(tǒng)外部或內(nèi)部。
就外部噪聲來源而言,人為噪聲是語音辨識中影響最大的噪聲,人為產(chǎn)生的噪聲來源如汽、機車、飛機的點火系統(tǒng)、電動機、交換式設(shè)備,高壓電纜線及利用電弧放電的熒光燈等,此種噪聲干擾范圍介于0至600MHz。
內(nèi)部噪聲來源甚多,其一是所謂的熱噪聲(Thermal?Noise或White?Noise)。此種噪聲的來源來自電阻性組件內(nèi)部電子移動隨機所生的,其強度與電阻的環(huán)境絕對溫度成正比。對于語音辨識系統(tǒng)而言,計算機主機的內(nèi)部組件運轉(zhuǎn)時所產(chǎn)生的聲音,例如:風(fēng)扇,為干擾語音辨識準確性的主要影響因素。
目前利用預(yù)估包含環(huán)境噪聲的語音信號的信噪比以調(diào)整噪聲強度因子,且在一特定音框內(nèi),設(shè)定強度因子為固定不變;此設(shè)定是假設(shè)噪聲對于語音信號的整個頻譜的影響是為一致。然而,現(xiàn)實生活中的噪聲多為色(color)噪聲,色噪聲對語音信號整個頻譜的影響不具有一致性,語音信號某些頻段受到噪聲影響比別的頻段要大得多,故大大降低了信號辨識的準確性。
有鑒于現(xiàn)有技術(shù)存在的技術(shù)問題,為了能夠兼顧解決之,本發(fā)明人基于多年研究開發(fā)與諸多實務(wù)經(jīng)驗,提出一種消除語音信號中的環(huán)境噪聲的法,以作為改善上述缺點的現(xiàn)方式與依據(jù)。
發(fā)明內(nèi)容
本發(fā)明的目的就是提供一種消除語音信號中的環(huán)境噪聲的方法,以提高語音辨識系統(tǒng)對于不同環(huán)境噪音的適應(yīng)性,提高信號辨識的準確性。
本發(fā)明的技術(shù)解決方案是:本發(fā)明是一種消除語音信號中的環(huán)境噪聲的方法,其中,語音信號包含一環(huán)境噪聲及一純語音信號,其特殊之處在于:該方法包含下列步驟:
1)在語音信號中設(shè)定一音框;
2)偵測該音框的上限頻率值F及信噪比SNR;
3)分別根據(jù)該上限頻率值F及信噪比SNR以決定對應(yīng)該音框的第一調(diào)整參數(shù)α及第二調(diào)整參數(shù)β;
4)利用第一調(diào)整參數(shù)α及第二調(diào)整參數(shù)β與預(yù)設(shè)的噪聲強度因子M進行運算,以產(chǎn)生一修正的噪聲強度因子M’,噪聲強度因子M’=M×α×β;
5)使用頻譜減法及已修正的噪聲強度因子M’利用能量譜公式進行運算以從語音信號中消除環(huán)境噪聲。
上述步驟3)中第一調(diào)整參數(shù)α是根據(jù)音框的上限頻率值而設(shè)定,第二調(diào)整參數(shù)β是依據(jù)此音框的信噪比而設(shè)定。
上述步驟3)中所述第一調(diào)整參數(shù)α及第二調(diào)整參數(shù)β的設(shè)定值分別由下述二式表達:
式一:
α=1.5,F(xiàn)i≦1kHz;或α=0.5,F(xiàn)i>1kHz;
式二:
β=1.6,SNRi<2db;或β=1.0,2db≦SNRi<8db;或
β=0.5,8db≦SNRi<13db;β=0.3,SNRi≧13db;
其中,F(xiàn)i表示第i音框的上限頻率值,SNRi表示第i音框的信噪比。
上述步驟5)中能量譜公式如下:
如果Ni(f)×M’>Oi(f),
則更新Ni(f)’=Ni(f)×L+(1-L)×Oi(f),且Si(f)=0,0≦L≦1(0<L<1);從而得到更新后的該環(huán)境噪聲的頻譜振幅Ni(f)’;
如果Ni(f)×M’≦Oi(f),
則Ni(f)保持不變,且Si(f)=Oi(f)-Ni(f)×M’,M’=M×α×β;即該純語音信號的頻譜振幅等于該語音頻譜振幅減去該已修正的噪聲強度因子與該環(huán)境噪聲的頻譜振幅相乘后的值;
其中,其中,Oi(f)為語音信號在第i個音框中的頻譜振幅,Si(f)為純語音信號在第i個音框中的頻譜振幅;Ni(f)為環(huán)境噪聲在第i個音框中的頻譜振幅;L為平滑因子。
該方法適用于嵌入式平臺的語音辨識系統(tǒng)。
上述嵌入式平臺是個人移動數(shù)字助理機、手機、手提電腦或電子辭典。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于無敵科技(西安)有限公司,未經(jīng)無敵科技(西安)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910020840.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 亮度信號/色信號分離裝置和亮度信號/色信號分離方法
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 雙耳信號的信號生成
- 雙耳信號的信號生成
- 信號處理裝置、信號處理方法、信號處理程序
- USBTYPEC信號轉(zhuǎn)HDMI信號的信號轉(zhuǎn)換線
- 信號盒(信號轉(zhuǎn)換)
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置





