[發明專利]帶聲源方向跟蹤功能的麥克風陣列語音增強裝置及其方法有效
| 申請號: | 201210320004.9 | 申請日: | 2012-08-31 |
| 公開(公告)號: | CN102831898A | 公開(公告)日: | 2012-12-19 |
| 發明(設計)人: | 童峰;洪青陽;周躍海 | 申請(專利權)人: | 廈門大學 |
| 主分類號: | G10L21/02 | 分類號: | G10L21/02 |
| 代理公司: | 廈門南強之路專利事務所 35200 | 代理人: | 馬應森 |
| 地址: | 361005 *** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲源 方向 跟蹤 功能 麥克風 陣列 語音 增強 裝置 及其 方法 | ||
技術領域
本發明涉及一種語音信號處理,尤其是涉及一種帶聲源方向跟蹤功能的麥克風陣列語音增強裝置及其方法。
背景技術
基于麥克風陣列的研究和應用是當前語音信號處理的一個新領域。在語音識別、語音控制、語音合成等語音信號處理領域中麥克風接收到的語音信號受到環境噪聲和干擾的影響很大,嚴重影響了語音信號的處理質量,一般的基于單麥克風的語音增強系統難以獲得較好的增強效果。麥克風陣列由于利用了目標信號、噪聲和干擾的空間信息,基于麥克風陣列的語音增強系統能提供更好的增強效果。
陣列麥克風,可將多個麥克風按照設計的拓撲結構組成一個陣列,這樣采集到的信號在時頻域的基礎上又增加一個空間域,可以對采集到的多徑信號進行空時分集處理,麥克風陣列可對不同方向上的信號形成不同響應,也即陣列的空間指向特性,使陣列麥克風具有聲源定位和跟蹤、語音提取和分離以及去噪等功能,從而提高在復雜背景下的語音信號質量,彌補孤立麥克風無法獲取和利用空間信息的缺陷。
1982年Griffiths和Jim(1、L.J.Griffiths,C.W.Jim.An?alternative?approach?to?linearly?constrained?adaptive?beamforming.IEEE?Transactions?on?Antennas?and?Propagation.January,1982,30,27-34)提出修正線性波束形成器,即廣義旁瓣消除器(Generalized?Sidelobe?Canceller,簡稱GSC)。廣義旁瓣消除器允許對波束形成器的響應進行廣泛的控制,尤其是可把線性約束的受限問題轉化為非受限的自適應求解,因而更具有一般意義,在麥克風陣列語音增強處理中得到了廣泛的研究和應用。針對經典GSC算法在實際應用中的不足,Gannot等人(2、Sharon?Gannot,Israel?Cohen.Speech?Enhancement?Based?on?the?General?TransferFunction?GSC?and?Postfiltering.IEEE?Transactions?on?Speech?and?Audio?Processing.2004,12(6))以經典的廣義旁瓣消除器算法為基礎,提出了一種基于有用信號非平穩性的聲學轉移函數廣義旁瓣消除器。Abad等人(3.A?Abad,J?Hernando.Speech?Enhancement?and?recognition?by?Integrating?Adaptive?Beamforming?and?Wiener?Filtering.IEEE?Sensor?Array?and?Multichannel?Signal?Processing?Workshop,SAM,Sitges,2004)則提出將維納濾波引入GSC的非自適應支路進一步改善旁瓣消除的效果。
需要指出的是,獲取聲源的準確方向是利用廣義旁瓣消除器技術進行麥克風陣列語音增強處理的前提,只有獲取了目標聲源方位后才能在最小化輸出方差準則下通過自適應算法訓練麥克風陣列在期望聲源方向形成波束實現語音增強。
中國專利ZL?200510105526.7公開一種使用噪聲降低的多通道自適應語音信號處理方法,該方法通過對GSC的固定波束通路增加一個自適應處理器改善信號通道的信噪比。但該方法仍然需要借助頻域時延估計來補償各通道時延,以使得波束對準期望聲源方向。
但是,經典的廣義旁瓣消除器算法在語音增強處理過程中始終對準期望通道的波束保持不變,只有當定位算法重新計算目標方向后才可再次設定算法對準的預期信號方向。在視頻會議、語音識別、說話人識別等麥克風陣列語音增強的實際應用過程中,往往會有說話人在說話過程中移動的場合。此時,從麥克風陣列語音增強的角度,要求麥克風陣列的指向波束能始終對準移動的目標說話人以獲取最佳的語音增強效果。而根據傳統的廣義旁瓣消除器算法結構,需要先進行聲源定位運算,然后再根據獲取的目標聲源方位進行GSC麥克風陣列語音增強處理,會導致GSC對準的預期聲源方位與實際聲源方位間存在滯后,從而影響語音增強效果。
同時,由于經典的廣義旁瓣消除器需要獲得目標聲源方向作為算法運行前提條件,當獲得目標聲源方向與實際聲源方向有一定誤差時的聲源方向(DOA,Direction?ofarrival)失配會影響到阻塞矩陣對聲源方向期望信號的阻塞效果,即非自適應支路的部分信號泄漏到自適應支路的噪聲抵消器輸入端,造成語音信號被削弱,從而影響到語音增強效果。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門大學,未經廈門大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210320004.9/2.html,轉載請聲明來源鉆瓜專利網。





