[發明專利]一種適用于聲源定位的時延估計方法有效
| 申請號: | 201910242080.4 | 申請日: | 2019-03-28 |
| 公開(公告)號: | CN109901114B | 公開(公告)日: | 2020-10-27 |
| 發明(設計)人: | 張承云;梁龍騰 | 申請(專利權)人: | 廣州大學 |
| 主分類號: | G01S5/22 | 分類號: | G01S5/22 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 顏希文;麥小嬋 |
| 地址: | 510000 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 適用于 聲源 定位 估計 方法 | ||
本發明公開了一種適用于聲源定位的時延估計方法,包括對通過兩個傳聲器獲得的語音信號進行信號處理,獲得最小相位分量的復倒譜;根據所述最小相位分量的復倒譜計算信號最小相位分量頻譜和全通分量頻譜;利用所述最小相位分量的頻譜的模值與所述全通分量信號的頻譜計算得到改進的全通分量頻譜,并根據所述改進的全通分量頻譜計算得到改進的相位加權函數,結合所述改進的全通分量頻譜和所述改進的相位加權函數計算互功率譜;通過快速傅里葉反變換方法求解所述互功率譜的互相關函數,并根據所述互相關函數計算得到延遲時間。本發明提供的時延估計方法能夠在混響和噪聲環境下,有效地減少由噪聲和混響帶來的影響,從而提高對于噪聲的適應性和時延估計的準確度。
技術領域
本發明涉及聲源定位技術領域,具體涉及到一種適用于聲源定位的時延估計方法。
背景技術
近幾年來,基于傳聲器陣列的聲源定位技術被廣泛應用于各種場景,聲源定位技術確定的時延和位置信息為波束成形、語音增強、語音識別、盲信號分離等各種語音算法提供重要的信息。基于時延估計的聲源定位技術具備運算成本少、所需要傳聲器數量較少等優點,因此被廣泛應用于各種實時處理環境中。聲源定位技術的定位方法分為兩步,第一步是估計聲波從聲源傳播到兩個傳聲器之間的時間差,第二步是根據時間差對聲源位置進行估計,其中,第一步時間差估計的準確度決定了第二步聲源定位的準確度。
現有技術中,基于互功率譜的時延估計方法因其具備運算成本少、定位精確度較高、在低混響(0ms-300ms)下能夠估計的優點而被廣泛的研究,但其估計性能在混響較高的環境下會下降,從而導致時延估計的準確度降低。針對于此,有學者提出了基于倒譜預濾波的時延估計方法,但是這種方法雖然能夠很好的降低混響對時延估計的影響,卻容易受到噪聲的影響。
發明內容
本發明提供了一種適用于聲源定位的時延估計方法,以解決現有技術難以減少噪聲和混響帶來的影響的技術問題,本發明能夠在混響和噪聲環境下,有效地減少由噪聲和混響帶來的影響,從而提高對于噪聲的適應性和時延估計的準確度。
為了解決上述技術問題,本發明實施例提供了一種適用于聲源定位的時延估計方法,包括:
對通過兩個傳聲器獲得的語音信號進行信號處理,獲得最小相位分量的復倒譜;
根據所述最小相位分量的復倒譜計算信號最小相位分量的頻譜和全通分量信號的頻譜;
利用所述最小相位分量的頻譜的模值與所述全通分量信號的頻譜計算得到改進的全通分量頻譜,并根據所述改進的全通分量頻譜計算得到改進的相位加權函數,結合所述改進的全通分量頻譜和所述改進的相位加權函數計算互功率譜;
通過快速傅里葉反變換方法求解所述互功率譜的互相關函數,并根據所述互相關函數計算得到延遲時間。
作為優選方案,所述利用所述最小相位分量的頻譜的模值與所述全通分量信號的頻譜計算得到改進的全通分量頻譜,并根據所述改進的全通分量頻譜計算得到改進的相位加權函數,結合所述改進的全通分量頻譜和所述改進的相位加權函數計算互功率譜,具體為:
利用所述最小相位分量的頻譜的模值與所述全通分量信號的頻譜相乘得到所述改進的全通分量頻譜;
根據所述改進的全通分量頻譜計算得到所述改進的相位加權函數,結合所述改進的全通分量頻譜和所述改進的相位加權函數計算得到所述互功率譜。
作為優選方案,所述對通過兩個傳聲器獲得的語音信號進行信號處理,獲得最小相位分量的復倒譜,具體為:
通過兩個傳聲器分別獲得第一通道語音信號和第二通道語音信號;
對所述第一通道語音信號和所述第二通道語音信號進行信號處理,得到第一通道復倒譜和第二通道復倒譜;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州大學,未經廣州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910242080.4/2.html,轉載請聲明來源鉆瓜專利網。





