[發明專利]音頻信號處理設備、方法和電子設備在審
| 申請號: | 201611233909.7 | 申請日: | 2016-12-28 |
| 公開(公告)號: | CN106782584A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 徐榮強 | 申請(專利權)人: | 北京地平線信息技術有限公司 |
| 主分類號: | G10L21/02 | 分類號: | G10L21/02;G10L21/0216 |
| 代理公司: | 北京市正見永申律師事務所11497 | 代理人: | 黃小臨,王懷章 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 信號 處理 設備 方法 電子設備 | ||
技術領域
本申請涉及音頻技術領域,且更具體地,涉及一種音頻信號處理設備、音頻信號處理方法、電子設備、計算機程序產品和計算機可讀存儲介質。
背景技術
無論是智能化的語音識別系統(例如,智能家電、機器人等),還是傳統的語音通信系統(例如,會議系統、因特網協議傳送話音VoIP系統等),都會遇到回聲抵消的問題。
例如,在單講模式下:在智能設備應用場景中,設備不希望自己所播放的內容中包括的喚醒詞或識別詞再次進入自己的識別系統從而造成誤報,影響體驗和浪費資源;在傳統通信系統中,遠端用戶不希望聽到自己說話的回音。在雙講模式下:在智能設備應用場景中,希望設備可以聽到用戶說話的聲音,但不被自己播放的內容所干擾;在傳統通信系統中,希望即使近端和遠端用戶同時說話,也能夠保證清晰的通信質量和較高的可懂度。以上都是在語音體驗中非常重要的場景,也是當今音頻信號處理中的難題。
目前現有的回聲消除技術是基于單麥克風和回聲抑制算法的結合?;芈曇种扑惴▋H僅從時域和頻域的角度來處理輸入信號,使得在處理回聲的時候也會同時損傷語音,從而影響后續的識別率。并且,在存在大回聲的情況下,就會面臨要么回聲處理不干凈而影響識別率,要么算法抑制過強而損傷語音成分,二者都會影響識別效果。
發明內容
為了解決上述技術問題,提出了本申請。本申請的實施例提供了一種音頻信號處理設備、音頻信號處理方法、電子設備、計算機程序產品和計算機可讀存儲介質,其可以利用指向麥克風陣列的特性來實現無損的關注信號增強和回聲信號抑制。
根據本申請的一個方面,提供了一種音頻信號處理設備,所述設備包括:揚聲器;麥克風陣列,包括具有不同拾音區的多個指向麥克風,每個指向麥克風用于在自身的拾音區內采集分路輸入信號,所述分路輸入信號包括來自信號源的關注信號分量和來自所述揚聲器的回聲信號分量;復用器,與每個指向麥克風電連接,用于將每個指向麥克風所采集的分路輸入信號合并為總輸入信號;聲源定位器件,用于確定所述信號源的位置和所述揚聲器的位置;以及增益控制器件,與所述聲源定位器件和每個指向麥克風電連接,用于根據所述信號源的位置和所述揚聲器的位置來調整每個指向麥克風的增益,以使得在所述總輸入信號中從所述信號源接收到的關注信號分量的功率與從所述揚聲器接收到的回聲信號分量的功率之間的信回比最大。
在本申請的一個實施例中,所述聲源定位器件包括:信號源定位器件,用于檢測在當前場景中是否存在正在輸出關注信號的信號源、所述信號源的數量及其相應位置;以及揚聲器定位器件,用于檢測在所述當前場景中是否存在正在播放聲音信號的揚聲器、所述揚聲器的數量及其相應位置。
在本申請的一個實施例中,所述信號源定位器件包括:攝像頭,用于捕捉所述當前場景的場景圖像;以及圖像識別單元,用于在所述場景圖像中識別所述信號源,確定所述信號源的數量,并且確定所述信號源與所述音頻信號處理設備的基準位置之間的相對位置。
在本申請的一個實施例中,所述圖像識別單元根據所述信號源在所述場景圖像中的位置來確定所述信號源與所述信號源定位器件的基準位置之間的相對位置,并且根據所述信號源定位器件的基準位置與所述音頻信號處理設備的基準位置之間的配準關系來確定所述信號源與所述音頻信號處理設備的基準位置之間的相對位置。
在本申請的一個實施例中,所述信號源定位器件包括:信號分離單元,用于接收由至少兩個指向麥克風所采集的至少兩路分路輸入信號,并且從所述至少兩路分路輸入信號中分離來自所述信號源的關注信號分量;以及聲音識別單元,用于根據分離出的所述信號源的關注信號分量的相位來確定所述信號源與所述音頻信號處理設備的相對位置。
在本申請的一個實施例中,所述揚聲器定位器件包括:信號分離單元,用于接收由至少兩個指向麥克風所采集的至少兩路分路輸入信號,并且從所述至少兩路分路輸入信號中分離來自所述揚聲器的關注信號分量;以及聲音識別單元,用于根據分離出的所述揚聲器的關注信號分量的相位來確定所述揚聲器與所述音頻信號處理設備的相對位置。
在本申請的一個實施例中,所述增益控制器件包括:比較單元,用于響應于存在正在輸出關注信號的一個或多個信號源且不存在正在播放聲音信號的揚聲器,比較所述一個或多個信號源與每個指向麥克風的拾音區之間的第一位置關系;以及增益調整單元,用于根據所述第一位置關系來調整每個指向麥克風的增益,以使得在所述總輸入信號中從所述一個或多個信號源接收到的關注信號分量的功率最大。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京地平線信息技術有限公司,未經北京地平線信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611233909.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于核范數的魯棒音階輪廓特征提取算法
- 下一篇:一種音頻信號處理方法及裝置





