[發明專利]用于音頻模式識別的系統和方法有效
| 申請號: | 201880036812.8 | 申請日: | 2018-05-10 |
| 公開(公告)號: | CN110709931B | 公開(公告)日: | 2020-12-11 |
| 發明(設計)人: | 阿舒托什·潘迪;羅伯特·措普夫 | 申請(專利權)人: | 賽普拉斯半導體公司 |
| 主分類號: | G10L21/0232 | 分類號: | G10L21/0232;G10L25/84;G10L15/22;G10L15/30;G10L15/20 |
| 代理公司: | 北京安信方達知識產權代理有限公司 11262 | 代理人: | 陸建萍;楊明釗 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 音頻 模式識別 系統 方法 | ||
一個示例裝置基于由一個或更多個麥克風接收的聲波提供輸入信號。輸入信號包括語音命令分量和一個或更多個干擾分量。該裝置通過一個或更多個計算機網絡接收音頻數據,并且該音頻數據對應于一個或更多個干擾分量。該裝置使用音頻數據從輸入信號中去除一個或更多個干擾分量的一部分以生成輸出信號,并提供輸出信號作為語音命令分量的估計,用于話音識別。
相關申請
本申請是于2017年9月26日提交的第15/716,173號美國專利申請的國際申請,其要求于2017年6月6日提交的第62/515,712號美國臨時申請的優先權,這兩個申請都通過引用以其整體并入本文。
技術領域
本主題涉及連接解決方案領域。更具體地,但不是作為限制,本主題公開了用于促進音頻模式識別的技術。
背景
音頻模式識別通常包括音頻處理設備接收預定音頻模式(例如通過麥克風),并本地地或遠程地執行音頻模式識別,以將預定音頻模式與相應的語意匹配。音頻處理設備的環境不僅可以包括預定音頻模式的源,還可以包括干擾音頻輸入的源。當干擾音頻輸入在音頻處理設備的麥克風處被作為聲波接收時,干擾音頻輸入與預定音頻模式的聲波結合,使得模式識別成為技術挑戰。
發明概述
本公開提供以下方面:
1)一種方法,包括:
基于由一個或更多個麥克風接收的聲波提供輸入信號,所述輸入信號包括語音命令分量和一個或更多個干擾分量;
經由一個或更多個計算機網絡接收音頻數據,所述音頻數據對應于所述一個或更多個干擾分量;
使用所述音頻數據,從所述輸入信號中去除所述一個或更多個干擾分量的至少一部分,以生成輸出信號;和
提供所述輸出信號作為所述語音命令分量的估計,用于話音識別。
2)根據1)所述的方法,其中,所述音頻數據的使用包括通過組合所述音頻數據的第一音頻數據和所述音頻數據的第二音頻數據來生成參考信號,其中,所述第一音頻數據對應于所述一個或更多個干擾分量的第一干擾分量,并且所述第二音頻數據對應于所述一個或更多個干擾分量的第二干擾分量,其中,從所述輸入信號中去除所述一個或更多個干擾分量的至少一部分包括從所述輸入信號中減去所述參考信號。
3)根據2)所述的方法,其中,從所述輸入信號中去除所述一個或更多個干擾分量的至少一部分包括將所述音頻數據的至少一部分與所述輸入信號的至少一部分進行組合。
4)根據1)所述的方法,其中,從所述輸入信號中去除所述一個或更多個干擾分量的至少一部分包括將所述音頻數據的至少一部分與所述輸入信號的至少一部分進行比較。
5)根據1)所述的方法,還包括緩沖所述輸入信號,并且使用所緩沖的輸入信號的至少一部分來使所述音頻數據的定時與所述輸入信號的定時同步。
6)根據1)所述的方法,還包括:
緩沖所述輸入信號,至少直到接收到所述音頻數據為止;
檢測接收音頻數據的指示;和
響應于檢測到所述指示,經由所述一個或更多個計算機網絡接收所述音頻數據,其中,所述音頻數據的接收響應于所述指示的檢測。
7)根據6)所述的方法,還包括檢測停止接收音頻數據的指示,并響應地停止所述音頻數據的接收,以及緩沖所述輸入信號。
8)根據1)所述的方法,其中,經由所述一個或更多個計算機網絡接收所述音頻數據包括通過一個或更多個射頻信道無線地接收所述音頻數據的第一音頻數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于賽普拉斯半導體公司,未經賽普拉斯半導體公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880036812.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于提供有關檢測到的事件的信息的方法、系統和介質
- 下一篇:記錄控制裝置





