[發明專利]基于維納濾波的語音混響消減方法無效
| 申請號: | 200810040707.X | 申請日: | 2008-07-17 | 
| 公開(公告)號: | CN101315772A | 公開(公告)日: | 2008-12-03 | 
| 發明(設計)人: | 張德會;陳光冶 | 申請(專利權)人: | 上海交通大學 | 
| 主分類號: | G10L21/02 | 分類號: | G10L21/02;H04M9/08 | 
| 代理公司: | 上海交達專利事務所 | 代理人: | 周文娟 | 
| 地址: | 200240*** | 國省代碼: | 上海;31 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 基于 濾波 語音 混響 消減 方法 | ||
1.一種基于維納濾波的語音混響消減方法,其特征在于,該方法包括下述步驟:
步驟1、輸入處理(1):首先預存純凈起始語音信號,采集混響信號,通過采樣單元(100)、端點檢測單元(102)、字存儲單元(104)和分幀單元(112)對該信號采樣、端點檢測、存儲和分幀;
步驟2、混響分析(2):對經過預處理的純凈起始音及其混響信號,基于維納濾波反卷積,即第一次反卷積運算(214)得出混響環境的房間沖擊響應信息,以維納反濾波因子(216)的形式輸出,每輸入一次純凈起始音的混響信號就能得到一組維納反濾波因子(216),房間沖擊響應信息通過平均或加權方法進行整合;
步驟3、混響處理(3):利用步驟2混響分析中得到的維納反濾波因子(216),進行第二次反卷積運算(322),通過濾波單元(320)對混響信號進行濾波得到去混響信號;
步驟4、輸出處理(4):對去混響信號進行語音重構(402),并進行數模轉換、信號傳輸,以及記錄去混響評測指標。
2.根據權利要求1所述的基于維納濾波的語音混響消減方法,其特征是所述的步驟1中,采樣單元(100)中采樣頻率的選擇以能捕捉足夠多的語音信息為標準,對于語音,采樣頻率在8KHz到11KHz范圍內或更高;端點檢測單元(102)識別每個字節的起始點位置,排除無語音段,保留包含有語音段信息的單個字節信息,并將單個字節信息送入字存儲單元(104);分幀單元(112)將端點檢測后的語音信號進行分幀,并將子幀信息送入幀存儲單元(204),幀長大約為20到30ms,相鄰兩幀起始點之間間隔為10ms,即兩幀之間有10到20ms的交疊,對于10KHz采樣頻率,30ms的幀長對應300點,10ms的幀移為100點,分幀時加漢明窗。
3.根據權利要求1所述的基于維納濾波的語音混響消減方法,其特征是所述的步驟2中,維納反濾波因子(216)由托布里茲方程(212)求得。
4.根據權利要求1所述的基于維納濾波的語音混響消減方法,其特征是所述的步驟3中,濾波時以維納反濾波因子(216)作為濾波器系數,使用myfilter函數濾波,其中myfilter函數是基于差分方程的遞推解法,參考MATLAB內部程序filter函數編出。
5.根據權利要求1所述的基于維納濾波的語音混響消減方法,其特征是所述的步驟4中,語音重構(402),主要是幀與幀之間的串接,如果是多字節語音的去混響,語音重構還包括字節與字節之間的連接,該步驟是分幀和端點檢測的逆運算;經過數模轉換模塊處理后的語音信號,由揚聲器或耳機傳至人耳;評測單元(406)對去混響度進行評測,評測指標包括時域信混噪比改善指標ΔSRNR,線性預測倒譜系數距離改善指標ΔLPCC、MEL頻率倒譜系數距離改善指標ΔMFCC,其中ΔLPCC、ΔMFCC為兩種頻域客觀評測系數,是譜失真測度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810040707.X/1.html,轉載請聲明來源鉆瓜專利網。





