[發明專利]用于語音增強系統的背景噪聲估計方法有效
| 申請號: | 201310538432.3 | 申請日: | 2013-11-04 |
| 公開(公告)號: | CN103559887A | 公開(公告)日: | 2014-02-05 |
| 發明(設計)人: | 張勇;劉軼 | 申請(專利權)人: | 深港產學研基地 |
| 主分類號: | G10L21/0216 | 分類號: | G10L21/0216 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 何平 |
| 地址: | 518057 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 語音 增強 系統 背景 噪聲 估計 方法 | ||
技術領域
本發明涉及語音增強處理技術領域,特別是涉及一種用于語音增強系統的背景噪聲估計方法。
背景技術
在語音增強處理的過程中,比較關鍵的一步就是對背景噪聲的估計。噪聲估計過高,在濾除噪聲時微弱語音將被去掉,使得經過增強處理的語音產生大的失真;而噪聲估計過低,在濾除噪聲后會殘留過多的背景噪聲。當背景噪聲為平穩噪聲時,通過對靜音段的噪聲功率譜取均值可得噪聲的估計值。當背景噪聲為非平穩噪聲時,由于噪聲隨時間快速變化,噪聲的估計就比較困難,要克服這個問題,需要對噪聲進行連續跟蹤與修正。
傳統的噪聲估計法是基于語音活動檢測(Voice?Activity?Detector,VAD)的噪聲估計方法。該方法在信噪比較高的情況下可以得到較好的噪聲估計,但是在低信噪比的情況下,對語音信號的檢測變得比較難,VAD的誤檢率很高,噪聲估計不準確。
實際噪聲通常是非平穩的,在語音存在期間噪聲也可能發生變化,要想取得好的語音增強效果,就必須隨時跟蹤噪聲的變化,及時更新噪聲估計。Doblinger通過比較前幀帶噪語音子帶平滑功率譜最小值和后幀帶噪語音子帶平滑功率譜之間大小,對帶噪語音子帶平滑功率譜最小值每幀進行追蹤和更新,并將其作為估計的噪聲譜,該噪聲譜估計方法計算效率高,能快速適應背景噪聲的變化,但它直接把帶噪語音子帶平滑功率譜最小值作為估計的噪聲譜,使得估計的噪聲譜準確度不高,同時它會將帶噪語音中語音電平的突然上升當作噪聲電平突變的情況來處理,造成噪聲的過估計。
Martin提出了基于最優平滑和最小統計的噪聲估計算法,它依據帶噪語音能量可以衰減到噪聲能量級的思想,通過對平滑后的帶噪語音的短時功率譜取最小值來獲得噪聲功率估計。然而,該方法在估計噪聲時,當搜索窗較小時會削弱語音能量,當搜索窗太大時,其噪聲估計更新較慢難以實時估計噪聲。
Israel?Cohen提出了改進的最小受控遞歸平均(Improved?Minima?Controlled?Recursive?Average,IMCRA)噪聲估計法,其可以進行連續的噪聲估計。算法使用一個時變頻率依賴的平滑因子對過去信號幀的功率譜進行平均后估計噪聲,該平滑因子依據語音信號存在概率調整。語音出現概率的估計基于高斯統計模型,但受平滑周期圖的最小值控制控制。該算法包括兩次平滑和最小值跟蹤過程。第一次平滑過程對每個頻帶語音出現情況做粗略的估計,然后在第二次平滑過程中通過最小值跟蹤剔除強語音分量,對噪聲譜進行平滑。但是,現有的IMCRA噪聲估計方法是在語音缺失段對噪聲進行遞歸平滑而在語音段則對噪聲的估計保持不變。然而,在實際情況中,噪聲通常是非平穩的,即使在語音信號存在期間,噪聲也可能會發生變化。
發明內容
基于此,有必要提供一種能夠實時跟蹤帶噪語音中的噪聲變化的背景噪聲估計方法。
一種語音噪聲估計方法,包括如下步驟:
對目標信號利用窗函數分成相互疊加的幀并對每幀進行短時傅立葉變換,得到目標信號的頻域表示:Y(k,l)=X(k,l)+D(k,l);其中Y(k,l)是帶噪語音信號進行快速傅立葉變換變換后的頻譜,X(k,l)是純語音信號進行快速傅立葉變換變換后的頻譜,D(k,l)是與語音信號無關的加性噪聲進行快速傅立葉變換變換后的頻譜;k表示頻譜序號,l表示幀序號;
將所述目標信號根據語音出現與否劃分為語音出現狀態H1(k,l)和語音缺失狀態H0(k,l),并按照如下公式估計噪聲:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深港產學研基地,未經深港產學研基地許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310538432.3/2.html,轉載請聲明來源鉆瓜專利網。





