[發(fā)明專利]一種聲源定位方法及裝置在審
| 申請?zhí)枺?/td> | 202310531175.4 | 申請日: | 2023-05-11 |
| 公開(公告)號: | CN116609726A | 公開(公告)日: | 2023-08-18 |
| 發(fā)明(設計)人: | 彭博;黃偉隆;馮津偉 | 申請(專利權)人: | 釘釘(中國)信息技術有限公司 |
| 主分類號: | G01S5/22 | 分類號: | G01S5/22 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 李威 |
| 地址: | 310023 浙江省杭州市余杭*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 聲源 定位 方法 裝置 | ||
1.一種聲源定位方法,其特征在于,所述方法包括:
獲取目標聲源對應的多路波束信號;
計算所述多路波束信號所用頻點的信噪比,并將信噪比大于預設信噪比閾值的頻點作為有效頻點;
從所述多路波束信號中選取對應的有效頻點數量相對更大的預設個數的目標波束信號,并對所述目標波束信號進行聲源定位。
2.根據權利要求1所述的方法,其特征在于,
還包括:對所述多路波束信號進行時頻轉換處理;
所述計算所述多路波束信號所用頻點的信噪比,包括:計算時頻轉換處理后的所述多路波束信號所用頻點的信噪比。
3.根據權利要求1所述的方法,其特征在于,
所述方法還包括:對所述目標波束信號進行降噪處理;
所述對所述目標波束信號進行聲源定位,包括:對降噪處理后的目標波束信號進行聲源定位。
4.根據權利要求3所述的方法,其特征在于,
所述對所述目標波束信號進行降噪處理,包括:計算所述目標音頻信號中帶噪語音信號對應的第一互功率譜密度以及噪聲信號對應的第二互功率譜密度,并將所述第一互功率譜密度和所述第二互功率譜密度的差值作為所述目標音頻信號的信噪差;
所述對降噪處理后的目標波束信號進行聲源定位,包括:將所述信噪差作為聲源定位算法的輸入,并根據所述聲源定位算法對所述降噪處理后的目標波束信號進行聲源定位。
5.根據權利要求1所述的方法,其特征在于,所述預設個數至少為兩個;
所述方法還包括:對所述目標波束信號進行語音活動檢測,以確定所述目標波束信號中語音活動對應的波束信號;
所述對所述目標波束信號進行聲源定位,包括:對所述目標波束信號中語音活動對應的信號進行聲源定位。
6.根據權利要求5所述的方法,其特征在于,所述方法還包括:
在所述目標波束信號均不為語音活動對應的信號的情況下,停止計算。
7.一種會議場景下的聲源標記方法,其特征在于,所述方法包括:
獲取會議過程中由發(fā)言用戶產生的音頻信號;
根據獲取到的音頻信號進行聲源定位,以確定所述發(fā)言用戶的位置信息;
在針對參會現場的視頻播放界面中,將所述位置信息對應的用戶標記為所述發(fā)言用戶。
8.一種音頻設備的測試方法,其特征在于,所述方法包括:
獲取待測試音頻設備針對目標聲源確定的預測位置信息,所述預測位置信息由所述待測試音頻設備根據采集到的所述目標聲源對應的音頻信號進行聲源定位而得到;
根據所述目標聲源的實際位置信息和所述預測位置信息之間的誤差,生成所述待測試音頻設備的聲源定位功能的測試結果。
9.一種基于音頻定位的拍攝控制方法,其特征在于,所述方法包括:
通過圖像采集設備上裝配的音頻采集模塊進行音頻采集;
根據采集到的音頻信號進行聲源定位,以得到目標聲源的位置信息;
控制攝像頭的拍攝角度和/或焦距進行變化,以對所述目標聲源進行拍攝。
10.一種電子設備,其特征在于,包括:
處理器;
用于存儲處理器可執(zhí)行指令的存儲器;
其中,所述處理器通過運行所述可執(zhí)行指令以實現如權利要求1-9中任一項所述方法的步驟。
11.一種計算機可讀存儲介質,其上存儲有計算機指令,其特征在于,該指令被處理器執(zhí)行時實現如權利要求1-9中任一項所述方法的步驟。
12.一種計算機程序,其特征在于,該程序被處理器執(zhí)行時實現如權利要求1-9中任一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于釘釘(中國)信息技術有限公司,未經釘釘(中國)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310531175.4/1.html,轉載請聲明來源鉆瓜專利網。





