[發明專利]用于分類的聯合統計模型的建立方法及應用方法有效
| 申請號: | 201910296427.3 | 申請日: | 2016-01-14 |
| 公開(公告)號: | CN110070880B | 公開(公告)日: | 2023-07-28 |
| 發明(設計)人: | 張軍;陳鑫源;潘偉鏘;寧更新;馮義志;余華;季飛;陳芳炯 | 申請(專利權)人: | 深圳市韶音科技有限公司 |
| 主分類號: | G10L21/02 | 分類號: | G10L21/02;G10L21/038;G10L25/24;G10L25/30;G10L25/87;G10L15/06;G10L15/16 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 李慶波 |
| 地址: | 518108 廣東省深圳市寶安區石*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 分類 聯合 統計 模型 建立 方法 應用 | ||
本發明公開一種用于分類的聯合統計模型的建立方法及應用方法,建立方法包括以下步驟:同步采集干凈的氣導訓練語音和非氣導訓練語音并進行分幀,提取每幀語音的特征參數;將氣導訓練語音和非氣導訓練語音的特征參數拼接得到干凈的聯合語音特征參數;利用聯合語音特征參數,訓練用于分類的聯合統計模型。
技術領域
本發明是申請人于2016年01月14日提出的名為“一種基于統計模型的雙傳感器語音增強方法與裝置”、申請號為201610025390的專利申請的分案申請,本發明涉及數字信號處理領域,特別涉及一種用于分類的聯合統計模型的建立方法及應用方法。
背景技術
通信是現代人與人之間進行交流的重要手段,而語音作為通信系統中最常見的形式,其質量直接影響了人們獲取信息的準確性。語音在傳播的過程中,難免受到各種各樣環境噪聲的干擾,其音質、可懂度都將明顯下降,因此在實際應用中往往會利用語音增強技術對噪聲環境下的語音進行處理。
語音增強技術能從噪聲背景中提取有用的語音信號,是抑制、降低噪聲干擾的基本手段。傳統的語音增強對象是基于空氣傳導傳感器(如麥克風等)采集的語音信號,根據處理方式的不同,常用的語音增強技術可以分為基于模型的方法和非基于模型的方法兩類。非基于模型的增強方法有譜減法、濾波法、小波變換法等,它們通常假定噪聲是相對平穩的,當噪聲變化過快時,其增強效果并不能令人滿意。基于模型的語音增強方法則首先對語音信號和噪聲信號建立統計模型,然后通過模型獲取干凈語音的最小均方誤差估計或最大后驗概率估計。這類方法能夠避免音樂噪聲的產生,并能處理非平穩噪聲。但由于上述的基于模型和非基于模型的方法均基于麥克風等空氣傳導語音傳感器,其信號容易受環境中的聲學噪聲影響,特別是在強噪聲環境下,系統性能會大幅度下降。
為解決強噪聲對語音處理系統的影響,有別于傳統的空氣傳導傳感器,非空氣傳導的語音傳感器利用說話人聲帶、顎骨等部位的振動來帶動傳感器中的簧片或者碳膜發生變化,改變其電阻值,使其兩端的電壓發生變化,從而將振動信號轉化為電信號,即語音信號。由于空氣中傳導的聲波無法使非空氣傳導傳感器的簧片或者碳膜發生形變,因此非空氣傳導傳感器不受空氣傳導聲音的影響,具有很強的抗環境聲學噪聲干擾的能力。但因非空氣傳導傳感器采集的是通過顎骨、肌肉、皮膚等的振動傳播的語音,表現為發悶、含糊不清,其高頻部分丟失嚴重,語音可懂度較差,制約了非空氣傳導技術的實際應用。
鑒于空氣傳導與非空氣傳導傳感器的單獨應用都存在一定的缺陷,近年來出現了一些結合兩者優點的語音增強方法。這些方法利用空氣傳導傳感器語音和非空氣傳導傳感器語音的互補性,采用多傳感器融合技術來實現語音增強的目的,通常能取得比單傳感器語音增強系統更好的效果。但現有的空氣傳導傳感器與非空氣傳導傳感器結合的語音增強方法還存在以下不足:空氣傳導傳感器語音與非空氣傳導傳感器語音通常獨立地進行恢復處理,然后再將兩者恢復后的語音進行融合,未能在空氣傳導傳感器語音和非空氣傳導傳感器語音的恢復過程中充分利用兩者之間的互補性。
發明內容
本發明提供了一種用于分類的聯合統計模型的建立方法,方法包括以下步驟:同步采集干凈的氣導訓練語音和非氣導訓練語音并進行分幀,提取每幀語音的特征參數;將所述氣導訓練語音和非氣導訓練語音的特征參數拼接得到干凈的聯合語音特征參數;利用所述聯合語音特征參數,訓練用于分類的聯合統計模型。
本發明還提供一種用于分類的聯合統計模型的應用方法,所述方法包括:同步采集氣導檢測語音和非氣導檢測語音,檢測氣導檢測語音的端點,然后利用氣導檢測語音的純噪聲段建立氣導噪聲統計模型;利用所述氣導噪聲統計模型修正上述聯合統計模型,并對氣導檢測語音幀進行分類。
本發明相對于現有技術具有如下的優點及效果:
1、本發明在氣導語音增強過程中,結合非氣導傳感器語音和氣導傳感器語音來構建當前用于分類的語音統計模型以及進行端點檢測,并據此構造最佳氣導語音濾波器,提高了氣導語音的增強效果,顯著增加了整個系統的魯棒性;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市韶音科技有限公司,未經深圳市韶音科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910296427.3/2.html,轉載請聲明來源鉆瓜專利網。





