[發明專利]一種基于子帶噪聲分析的自適應降噪方法與系統有效
| 申請號: | 201410106985.6 | 申請日: | 2014-03-21 |
| 公開(公告)號: | CN103871421B | 公開(公告)日: | 2018-02-02 |
| 發明(設計)人: | 梁維謙;薛行棟 | 申請(專利權)人: | 廈門萊亞特醫療器械有限公司 |
| 主分類號: | G10L21/0232 | 分類號: | G10L21/0232;G10L21/0224;G10L19/02 |
| 代理公司: | 廈門市精誠新創知識產權代理有限公司35218 | 代理人: | 戚東升 |
| 地址: | 361000 福建省廈門市湖*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 噪聲 分析 自適應 方法 系統 | ||
技術領域
本發明涉及語音技術領域,具體涉及一種基于子帶噪聲分析的自適應降噪方法與系統。
背景技術
在語音通信與錄制領域,背景噪聲是影響聲音音質與辨識度的最大障礙。通過網絡與親友視頻聊天時會有電腦的“嗡嗡”聲;錄制課堂講座時會有寫字聲與學生們的閑聊聲;戶外做采訪時道路交通噪聲以及風噪聲等,日常生活中我們離不開這些噪聲。
為了提高采集聲音信號的音質,信噪比,以及可懂度,國際上已經研究出了很多降噪算法,可分為兩大類。一種是通過多路麥克風輸入在空間上選取目標聲源的方式,叫指向性麥克風技術。另一種是單麥克風輸入,通過語音信號和干擾噪聲信號的頻譜特性差異,濾除噪聲信號,提高信噪比。理論上,指向性麥克風方式的降噪效果要比單麥克風降噪算法要好,目前已經有很多筆記本電腦,平板電腦,部分智能手機均采用這類技術。但是,一個產品同時要配置多路麥克風的技術實現需求,在高集成度的迷你產品的研發中受到限制,同時也會提高生產成本,且運算復雜度較高,不適于如數字助聽器等極低功耗系統的應用。
一般我們會通過以下方式進行單麥克風降噪。第一類是通過自適應增益調節進行噪聲判斷,并進行衰減,其中最為典型的算法為低增益擴展降噪算法,如圖1所示,如果當前輸入的聲壓級小于擴展臨界值,即輸入處于擴展閾的范圍內,則判斷為噪聲,并進行增益衰減;如果輸入聲壓級大于此臨界值進行線性輸出,或進行增益壓縮。第二類是通過語音激活檢測(Voice Activity Detection)等方式對信號進行語音段與噪聲段的分類。此算法自動平均噪聲段的信號能量,并在判斷為噪聲段的信號進行相應衰減,得到降噪效果。第三類為通過自適應濾波器的方式進行降噪,如圖2所示。自適應濾波器以系統輸出信號無限接近于原信號為條件進行收斂。在實際應用中,因為我們得不到原信號,通常使用實際輸入信號與長時能量的差值代替原信號進行收斂,其中長時能量代表噪聲等級。
上述三類降噪方式均有相應的降噪效果,但都存在缺陷。第一類降噪方式只能應用于噪聲能量明顯小于信號能量的場景,而能量較小的語音信號會被誤認為噪聲,因此被衰減。第二類的降噪方式效果要好于第一類,但在噪聲段存在明顯的音樂噪聲(Musical noise)。第三類的降噪算法比前兩類更為復雜,但自適應濾波器方法由于收斂關系會影響輸出音質,也就是說收斂速度越快會提高降噪效果,但同時會降低音質,同時也存在濾波器發散的危險。
總之,需要本領域技術人員迫切解決的一個技術問題就是:如何能夠提供一種自適應降噪算法,要求較高的降噪效果同時保證輸出音質。
發明內容
為了解決上述技術問題,本發明提供了一種基于子帶噪聲分析的自適應降噪方法,可以大幅度降低目標信號中的類穩定噪聲,同時提供幾乎無失真(經過40dB以上的放大處理仍無聽感失真)的語音音質,本發明的方法在多種噪聲環境下,均能提供較好的降噪效果。
為了達到上述目的,本發明所采用的技術方案是,一種基于子帶噪聲分析的自適應降噪方法,包括以下步驟:
步驟1,對輸入的時域帶噪音頻信號進行分幀和短時頻域變換,生成頻域帶噪音頻信號;
步驟2,對頻域帶噪音頻信號,采用最小值跟蹤方法(Minimum Tracking)估計出噪聲能量譜;
步驟3,計算出該噪聲能量譜的后驗信噪比和先驗信噪比;
步驟4,通過非線性增益擴展方法,利用所述的后驗信噪比和先驗信噪比計算步驟1所述的帶噪音頻信號的降噪增益;
步驟5,對所述的各個時頻單元的降噪增益進行平滑濾波,以降低音質失真;
步驟6,將所述的平滑濾波后的降噪增益與步驟1所述的頻域帶噪音頻信號的各個時頻單元相乘,得到降噪后的頻域音頻信號;
步驟7,對步驟6所述的降噪后的頻域音頻信號進行短時頻域逆變換,得到最終的降噪后的時域音頻信號輸出。
進一步的,所述步驟1中,短時頻域變換為加權重疊相加分析算法。
進一步的,所述步驟7中,短時頻域逆變換為加權重疊相加合成算法。
進一步的,所述步驟2中,所述最小值跟蹤方法包括以下步驟:
步驟21:計算短時頻域變換后的帶噪音頻信號Sin(n,k)的能量譜|Sin(n,k)|2的短時最大值PST_max(n,k),如式(1)所示,
其中n代表時間幀,k代表頻域子帶(一個子帶可是單個頻段也可由多個相鄰的頻段構成),T1代表短時幀數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門萊亞特醫療器械有限公司,未經廈門萊亞特醫療器械有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410106985.6/2.html,轉載請聲明來源鉆瓜專利網。





