[發明專利]聲源定位方法和裝置有效
| 申請號: | 201910146086.1 | 申請日: | 2019-02-27 |
| 公開(公告)號: | CN111624554B | 公開(公告)日: | 2023-05-02 |
| 發明(設計)人: | 劉魯鵬;占凱;陳宇;耿嶺;白二偉;劉穎;元海明;鄭勇超;仇璐 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G01S5/28 | 分類號: | G01S5/28 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100086 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲源 定位 方法 裝置 | ||
本申請實施例公開了聲源定位方法和裝置。該方法的一具體實施方式包括:對回聲消除后的目標音頻進行波束形成處理,統計所形成的各個方向波束的高頻能量和低頻能量;將各個方向的波束表示于同一個圓中;利用預先設置的區域波束數量和區域間隔,在該圓中確定多個扇形區域;基于扇形區域中各個方向波束的高頻能量和低頻能量,確定各個扇形區域的能量和,將能量和最大的扇形區域的對稱軸自圓心向外延伸的延伸方向作為聲源方向。本申請實施例能夠確定出各個扇形區域的高頻能量和低頻能量,以得到各個扇形區域的能量和從而定位出聲源位置。該方法不需要很高的信號采樣頻率,具有較高的定位精度。
技術領域
本申請實施例涉及計算機技術領域,具體涉及互聯網技術領域,尤其涉及聲源定位方法和裝置。
背景技術
隨著計算機技術的發展,人類與機器信息交流的需求越來越迫切。語音作為人類最自然的交互方式之一,也成為人們希望能替代鼠標鍵盤與計算機交流的最重要方式之一。而隨著智能家居、智能車輛、智能會議系統等智能終端的發展需求越來越迫切,作為智能終端入口的智能語音系統技術受到了越來越多的關注。
聲源定位技術是應用于智能語音系統的重要技術,聲源定位的精準度直接影響智能語音系統的用戶體驗。
發明內容
本申請實施例提出了聲源定位方法和裝置。
第一方面,本申請實施例提供了一種聲源定位方法,包括:對回聲消除后的目標音頻進行波束形成處理,確定所形成的各個方向波束的高頻能量和低頻能量;將各個方向的波束表示于同一個圓中,其中,圓的圓心基于接收目標音頻的接收裝置所處的位置確定;利用預先設置的區域波束數量和區域間隔,在圓中確定多個扇形區域,其中,區域波束數量為在扇形區域中的波束的數量,區域間隔為相鄰兩個扇形區域相隔的波束的數量;基于扇形區域中各個方向波束的高頻能量和低頻能量,確定各個扇形區域的能量和,將能量和最大的扇形區域的對稱軸自圓心向外延伸的延伸方向作為聲源方向。
在一些實施例中,利用預先設置的區域波束數量和區域間隔,在圓中確定多個扇形區域,包括:在圓中,以區域波束數量個相鄰波束所在的扇形區域為滑動窗口,以圓心為軸心,以區域間隔為滑動步長,向順時針或逆時針方向滑動,得到各個扇形區域,其中,每滑動一次得到一個扇形區域。
在一些實施例中,扇形區域的兩側邊緣分別與兩個波束重合;各個扇形區域的尺寸相同。
在一些實施例中,基于扇形區域中各個方向波束的高頻能量和低頻能量,確定各個扇形區域的能量和,包括:對于扇形區域中的每個方向,對該方向的高頻能量和低頻能量進行加權,得到該方向的方向能量值;對扇形區域中各個方向的方向能量值進行加權,得到扇形區域的能量和。
在一些實施例中,高頻能量為音頻的多個幀的平均高頻能量,低頻能量為音頻的多個幀的平均低頻能量;在基于扇形區域中各個方向波束的高頻能量和低頻能量,確定各個扇形區域的能量和之前,方法還包括:對于每個方向,確定目標音頻的前預設數量幀的各幀的高頻能量和低頻能量;確定各幀的平均高頻能量和平均低頻能量。
第二方面,本申請實施例提供了一種聲源定位裝置,包括:波束形成單元,被配置成對回聲消除后的目標音頻進行波束形成處理,確定所形成的各個方向波束的高頻能量和低頻能量;表示單元,被配置成將各個方向的波束表示于同一個圓中,其中,圓的圓心基于接收目標音頻的接收裝置所處的位置確定;區域確定單元,被配置成利用預先設置的區域波束數量和區域間隔,在圓中確定多個扇形區域,其中,區域波束數量為在扇形區域中的波束的數量,區域間隔為相鄰兩個扇形區域同一側邊緣之間相隔的距離;方向確定單元,被配置成基于扇形區域中各個方向波束的高頻能量和低頻能量,確定各個扇形區域的能量和,將能量和最大的扇形區域的對稱軸自圓心向外延伸的延伸方向作為聲源方向。
在一些實施例中,區域確定單元進一步被配置成:在圓中,以區域波束數量個相鄰波束所在的扇形區域為滑動窗口,以圓心為軸心,以區域間隔為滑動步長,向順時針或逆時針方向滑動,得到各個扇形區域,其中,每滑動一次得到一個扇形區域。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910146086.1/2.html,轉載請聲明來源鉆瓜專利網。





