[發明專利]一種室內混響消除的方法有效
| 申請號: | 201310317200.5 | 申請日: | 2013-07-23 | 
| 公開(公告)號: | CN103413547A | 公開(公告)日: | 2013-11-27 | 
| 發明(設計)人: | 陳喆;殷福亮;彭雯雯 | 申請(專利權)人: | 大連理工大學 | 
| 主分類號: | G10K11/16 | 分類號: | G10K11/16;G10K15/08 | 
| 代理公司: | 大連東方專利代理有限責任公司 21212 | 代理人: | 曲永祚;李洪福 | 
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 一種 室內 混響 消除 方法 | ||
1.一種室內混響消除的方法,其特征在于:包括后期混響功率譜估計模塊,譜減模塊,有音/無音檢測模塊,能量衰減模塊以及自適應譜線增強模塊;所述的后期混響功率譜估計模塊輸入為混響語音,輸出與譜減模塊連接;譜減模塊的輸入為混響語音和后期混響功率譜估計模塊的輸出,輸出與有音/無音檢測模塊相連;有音/無音檢測模塊輸出控制譜減模塊的輸出選擇可連接能量衰減模塊或連接自適應譜線增強模塊;能量衰減模塊和自適應譜線增強模塊輸出最終的增強后的語音。
2.根據權利要求1所述的一種室內混響消除的方法,其特征在于:所述后期混響功率譜估計模塊的方法如下:
后期混響功率譜估計模塊的輸入為混響語音即語音含有混響成分,通過此混響語音估計出混響能量比以及混響語音功率譜,根據混響能量比和混響語音功率譜之間的映射關系,得到后期混響功率譜;
對輸入采樣頻率為fs=16kHz的混響語音x(n),采用重疊分幀方式進行分幀,重疊約75%;分幀用窗函數為漢明窗w(n)=0.54-0.46cos[(2n+1)π/N],n=0,1,…,N-1;對第l幀混響語音x(l,n)進行加窗處理,加窗后的語音為xw(l,n)=x(l,n)·w(n),n=0,1,…,N-1;用離散傅里葉變換將加窗后的混響語音變換到頻域,X(l,k)表示第l幀混響語音頻譜,
混響語音功率譜的估算公式為
其中,N為語音幀長度包含采樣點的數目和窗口長度,N取值512,平滑系數ηx與平均衰減系數有關,具體關系如下
其中,e為自然對數的底數,R為幀率,即每秒語音數據中語音幀的數量,設置R=128,RT60是混響時間,是描述室內聲音衰減快慢程度的客觀物理參數,它是指聲源在擴散聲場中停止發聲后,殘余的聲能經過往返反射,聲能量衰減60dB所需的時間,即相當于平均聲能密度降為原來的10-6所需的時間,RT60可使用Sabine公式近似估算出來;
定義混響分量的功率譜、后期混響分量的功率譜分別為
其中,Tl為前期混響到達的時間,設置Tl=32ms;Tr=R/fs,表示直達信號到達的時間,Tr≤Tl<<RT60;參數κ與混響能量比有關,用來防止后期混響的過估計;采用自適應方法估計參數κ;當|X(l,k)|2<λx(l,k)時,減小參數κ的值;當|X(l,k)|2>λx(l,k)時,增大參數κ的值;當|X(l,k)|2=λx(l,k)時,參數κ不變;參數κ在第l幀計算方法為
其中,0<μ<1,表示更新步長,設置μ=0.01,參數κ的初始值κ(0)設置為κ(0)=0.01。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310317200.5/1.html,轉載請聲明來源鉆瓜專利網。





