[發明專利]一種波達方向估計方法和裝置有效
| 申請號: | 201711386119.7 | 申請日: | 2017-12-20 |
| 公開(公告)號: | CN108107403B | 公開(公告)日: | 2020-07-03 |
| 發明(設計)人: | 馮大航;陳孝良;陳日林;蘇少煒;常樂 | 申請(專利權)人: | 北京聲智科技有限公司 |
| 主分類號: | G01S3/00 | 分類號: | G01S3/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 100080 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 方向 估計 方法 裝置 | ||
本發明實施例公開了一種波達方向估計方法和裝置,應用于終端設備,該方法,包括:播放并接收測試音頻;根據接收到的測試音頻,預測反射體相對于所述終端設備的方向,得到至少一個相對方向;依據接收到的語音指令和所述至少一個相對方向,對所述語音指令的波達方向進行估計。本發明實施例在接收到語音指令時,可以利用該語音指令和預先得到的反射體對應的至少一個相對方向,排除反射體的方向,準確的對該語音指令的波達方向進行估計,避免了反射波對DOA估計的干擾,進而提高了后續處理的準確性。
技術領域
本發明涉及數據處理技術領域,尤其涉及一種波達方向估計方法及裝置。
背景技術
目前,智能音響、機器人等智能語音設備的應用越來越廣泛,這些智能語音設備一般通過麥克風陣列獲取語音指令后,經信號處理后再對語音指令進行識別,從而提高語音識別的準確率,主要涉及回聲消除技術、波達方向(Direction of Arrival,DOA)估計技術、波束形成技術和去混響技術等。
然而,在語音識別過程中,當智能語音設備距離墻壁、顯示屏等反射體較近時,語音指令的反射波會對DOA估計的結果產生干擾,進而使得后續處理過程中存在將實際的語音指令視為噪聲而消除的情況,導致對語音指令的識別率下降、智能語音設備無法準確對語音指令做出響應等問題。
因此,本領域技術人員需要提供一種波達方向估計方法及裝置,能夠對語音指令的方向做出準確的識別,避免反射波對DOA估計的干擾。
發明內容
為了解決現有技術問題,本發明提供了一種波達方向估計方法及裝置,能夠對語音指令的方向做出準確的識別,避免反射波對DOA估計的干擾。
本發明實施例提供的一種波達方向估計方法,應用于終端設備,所述方法,包括:
播放并接收測試音頻;
根據接收到的測試音頻,預測反射體相對于所述終端設備的方向,得到至少一個相對方向;
依據接收到的語音指令和所述至少一個相對方向,對所述語音指令的波達方向進行估計。
可選的,所述終端設備配置有多個麥克風;所述根據接收到的測試音頻,預測反射體相對于所述終端設備的方向,得到至少一個相對方向,具體包括:
估計所述測試音頻對所述終端設備的每個麥克風的沖擊響應函數;
根據所述每個麥克風的沖擊響應函數,確定所述至少一個相對方向。
可選的,所述根據所述每個麥克風的沖擊響應函數,確定所述至少一個相對方向,具體包括:
獲取每個沖擊響應函數中幅值大于第一預設閾值的波峰,得到該沖擊響應函數的直達波峰和至少一個反射波峰;
其中,所述直達波峰為該沖擊響應函數中第一個幅值大于所述第一預設閾值的波峰;對每個沖擊響應函數的反射波峰,按照時間順序依次定義為第一反射波峰、第二反射波峰、……、第M反射波峰;
確定每兩個第i反射波峰之間的時間延遲,i∈[1,M];
依據所述時間延遲和該時間延遲對應的兩個麥克風的相對位置,利用代價函數,獲得所述至少一個相對方向;每個反射波峰對應一個相對方向。
可選的,所述獲取每個沖擊響應函數中幅值大于第一預設閾值的波峰,得到至少兩個波峰,之后還包括:
查找每個沖擊響應函數中與直達波峰之間的時間差小于第二預設閾值的反射波峰,得到該沖擊響應函數的至少一個參考波峰;
其中,對每個沖擊響應函數的參考波峰,按照時間順序依次定義為第一參考波峰、第二參考波峰、……、第N參考波峰,N≤M;
則,所述確定每兩個第i反射波峰之間的時間延遲,具體為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京聲智科技有限公司,未經北京聲智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711386119.7/2.html,轉載請聲明來源鉆瓜專利網。





