[發明專利]基于分頻和改進的廣義互相關雙耳時延估計方法有效
| 申請號: | 201710574614.4 | 申請日: | 2017-07-14 |
| 公開(公告)號: | CN107479030B | 公開(公告)日: | 2020-11-17 |
| 發明(設計)人: | 胡章芳;樂聰聰;羅元;張毅;劉宇 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G01S5/22 | 分類號: | G01S5/22;G10L21/0208 |
| 代理公司: | 重慶市恒信知識產權代理有限公司 50102 | 代理人: | 劉小紅 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 分頻 改進 廣義 互相 關雙耳時延 估計 方法 | ||
本發明請求保護一種混響環境下基于分頻和改進廣義互相關雙耳時延估計方法,涉及聲源定位領域,它利用Gammatone濾波器能有效的模擬人耳基底膜特性,將語音信號分頻處理,在混響環境下進行雙耳互相關時延估計,相比于廣義互相關時延估計方法,該方法具有更準確的時延估計,該聲源定位系統在混響環境下具有更好的魯棒性。使用Gammatone濾波器對雙耳信號進行分頻處理,對每個子帶信號進行倒譜預濾波的去混響處理后反變換到時域,左右耳各子帶信號進行廣義互相關運算,廣義互相關算法中采用改進的相位變換加權函數,得到的每個子帶的互相關值進行求和運算,獲得最大互相關值對應的雙耳時間差。
技術領域
本發明屬于聲源定位領域,特別是一種基于分頻和改進的廣義互相關雙耳時延估計方法。
背景技術
隨著人類社會的進步,人們對機器的人機交互性能要求越來越高。人機交互真正所需的是人與機器或計算機之間更好的耦合,全面直觀地進行溝通和交流,而不是簡單地更好地設計交互界面的表面特性。人與機器之間日益增長的溝通需要定位和跟蹤聲源,用于視頻音頻應用的自動相機跟蹤,用于抑制噪聲和混響的麥克風陣列波束成形,遠程講話語音識別和機器人音頻系統是語音源定位的示例應用。
隨著語音識別、聲紋識別等技術的快速發展,基于語音的人機交互技術涉及到各個應用領域。以室內的智能服務機器人為例,智能有趣的家居生活情景的構建,都是通過機器人的智能自動化,給人們帶來更加輕松方便的生活方式。在室內環境中工作的機器人應該意識到給定的命令,為此,他們需要認識到如來自電器的噪聲輻射和來自其周圍的無線電或電視的不明的聲音事件。因此,能夠使機器人捕獲空間信息(即在其環境中發生聲音事件的方向)的聲源定位是相當基本和必要的技術,其必須在機器人采取動作之前被處理。在語音信號處理中,獲取聲源位置的信息具有重要作用。在封閉的家居室內環境中采集語音時,往往攜帶著周圍環境的各種噪聲、房間混響以及其它聲源的干擾,這些干擾的存在使聲音清晰度下降,聲源定位的誤差增大,阻止系統充分提取任何語音特征,妨礙人機語音交互技術的廣泛使用。
在各種非常不利的聲學環境下,人耳都能精確地進行聲源定位。例如,“雞尾酒會效應”中,兩個客人可以在一群人的旁邊正常的交流,聽者還可以根據感興趣的語音信號判斷出目標聲源的方向,當聽者聽到有人叫喚他名字時會將頭面向說話者。由此可見,人耳可以從嘈雜的多聲源環境中定位出目標聲源的位置。這一事實表明可以通過模仿人耳聽覺系統的機制,實現有效的人工雙耳聲源定位。雙耳聲源定位是實現人機交互的重要組成部分,因為它配備了兩個麥克風作為人類聽覺定位,能夠準確快速地定位聲源。聲源定位的廣適性使其應用于多個領域,在聲學通信、人工智能和助聽器等方面有著重要的研究意義和實用價值。
發明內容
本發明旨在解決以上現有技術的問題。提出了一種在混響環境下提高聲源定位的準確度的基于分頻和改進的廣義互相關雙耳時延估計方法。本發明的技術方案如下:
一種基于分頻和改進的廣義互相關雙耳時延估計方法,其包括以下步驟:
S1:獲取包含混響的雙耳語音信號,分別用兩個麥克風放到人工頭的左右耳上,兩個麥克風采集到的信號卷積上頭部脈沖響應即為雙耳語音信號;
S2:對步驟S1得到的含混響的雙耳語音信號,使用Gammatone濾波器組對雙耳信號進行分頻處理,得到不同頻率的子帶雙耳信號;
S3:步驟S2得到的子帶語音信號變換到倒譜域,進行倒譜預濾波去混響處理,獲得去混響的左右耳各子帶信號;
S4:步驟S3得到的去混響的左右耳各子帶信號采用改進的廣義互相關時延估計方法求取雙耳時間差,所述改進廣義互相關時延估計方法主要包括:在傳統廣義互相關法的基礎上采用改進的相位加權(MPHAT);
S5:根據雙耳時間差幾何模型,采用步驟S4得到的雙耳時間差獲取目標聲源的方位。
進一步的,所述步驟S1采用雙麥克風模擬人耳聽覺系統獲取包含混響的雙耳語音信號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710574614.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:傘式水下聲源檢測裝置及其校準與檢測方法
- 下一篇:一種隱蔽的水下被動定位方法





