[發明專利]一種聲源分析方法及系統在審

申請號：	202011333240.5	申請日：	2020-11-24
公開（公告）號：	CN112562730A	公開（公告）日：	2021-03-26
發明（設計）人：	程佳;李驪	申請（專利權）人：	北京華捷艾米科技有限公司
主分類號：	G10L25/51	分類號：	G10L25/51;G10L21/0216;G10L21/0264;G06K9/00;G01S5/20
代理公司：	北京集佳知識產權代理有限公司 11227	代理人：	錢娜
地址：	100193 北京市海淀區***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種聲源分析方法系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種聲源分析方法，其特征在于，包括：

獲取高信噪比音頻角度；

獲取低信噪比音頻角度；

基于所述高信噪比音頻角度進行投票統計，得到第一說話人位置；

基于所述低信噪比音頻角度和所述第一說話人位置進行投票統計，得到噪聲位置。

2.根據權利要求1所述的方法，其特征在于，還包括：

獲取視頻角度；

基于所述高信噪比音頻角度和所述視頻角度進行投票統計，得到第二說話人位置；

基于所述低信噪比音頻角度和所述第二說話人位置進行投票統計，得到噪聲位置。

3.根據權利要求1或2所述的方法，其特征在于，所述獲取高信噪比音頻角度，包括：

獲取原始角度；

當信噪比大于預設值時，基于信噪比高低對所述原始角度進行篩選，得到高信噪比音頻角度。

4.根據權利要求1或2所述的方法，其特征在于，所述獲取低信噪比音頻角度，包括：

獲取原始角度；

基于信噪比高低對所述原始角度進行篩選，得到高信噪比音頻角度。

5.根據權利要求2所述的方法，其特征在于，所述獲取視頻角度包括：

基于人臉識別得到人臉坐標或基于骨架識別得到頭部坐標；

將所述人臉坐標或頭部坐標轉化到與麥克風陣列統一的坐標系中，得到視頻角度。

6.一種聲源分析系統，其特征在于，包括：

第一獲取模塊，用于獲取高信噪比音頻角度；

第二獲取模塊，用于獲取低信噪比音頻角度；

第一分析模塊，用于基于所述高信噪比音頻角度進行投票統計，得到第一說話人位置；

第二分析模塊，用于基于所述低信噪比音頻角度和所述第一說話人位置進行投票統計，得到噪聲位置。

7.根據權利要求6所述的系統，其特征在于，還包括：

第三獲取模塊，用于獲取視頻角度；

第三分析模塊，用于基于所述高信噪比音頻角度和所述視頻角度進行投票統計，得到第二說話人位置；

第四分析模塊，用于基于所述低信噪比音頻角度和所述第二說話人位置進行投票統計，得到噪聲位置。

8.根據權利要求6或7所述的系統，其特征在于，所述第一獲取模塊具體用于：

獲取原始角度；

當信噪比大于預設值時，基于信噪比高低對所述原始角度進行篩選，得到高信噪比音頻角度。

9.根據權利要求6或7所述的系統，其特征在于，所述第二獲取模塊具體用于：

獲取原始角度；

基于信噪比高低對所述原始角度進行篩選，得到高信噪比音頻角度。

10.根據權利要求7所述的系統，其特征在于，所述第三獲取模塊具體用于：

基于人臉識別得到人臉坐標或基于骨架識別得到頭部坐標；

將所述人臉坐標或頭部坐標轉化到與麥克風陣列統一的坐標系中，得到視頻角度。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京華捷艾米科技有限公司，未經北京華捷艾米科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202011333240.5/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種富含慢消化和抗性淀粉的食品原料及其制備方法與應用
下一篇：一種信息回溯方法、裝置、存儲介質及電子設備

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】