[發明專利]級聯音頻檢出系統在審
| 申請號: | 202310033628.0 | 申請日: | 2023-01-10 |
| 公開(公告)號: | CN116416979A | 公開(公告)日: | 2023-07-11 |
| 發明(設計)人: | S·莫賽耶波卡斯卡里;邱洪;A·普亞 | 申請(專利權)人: | 辛納普蒂克斯公司 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G06N20/00;G10L15/22;G10L21/0208;G10L21/0216;G10L15/16;G10L15/06;G10L25/30;G10L25/51 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 董婕;陳嵐 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 級聯 音頻 檢出 系統 | ||
用于識別一個或多個音頻流中的音頻事件的系統和方法包括使用級聯音頻檢出系統(諸如級聯關鍵詞檢出系統(KWS))來降低功耗,同時保持期望的性能。示例級聯音頻檢出系統可以包括第一模塊和高功率子系統。第一模塊用于從一個或多個音頻流接收音頻流,處理音頻流以檢測音頻流中的第一目標聲音活動,并且響應于檢測到音頻流中的第一目標聲音活動而提供第一信號。高功率子系統用于(響應于由第一模塊提供的第一信號)接收一個或多個音頻流并處理一個或多個音頻流以檢測一個或多個音頻流中的第二目標聲音活動。
技術領域
本實施例總體上涉及音頻信號處理,并且更具體地例如涉及用于識別音頻流中的特定音頻事件的級聯音頻檢出(spotting)系統。
背景技術
近年來,諸如智能揚聲器、移動電話、用于各種電子設備(例如,汽車、電器等)的話音啟用的接口、以及各種物聯網(IoT)設備之類的音頻控制設備已經變得流行。這些設備通常被配置為通過一個或多個麥克風感測環境聲音,然后處理所接收的音頻輸入以檢測要用于使一個或多個操作被執行(諸如智能揚聲器調整音量或停止回放、移動電話執行互聯網搜索、或智能電視調諧到特定節目)的一個或多個話音命令或其他音頻事件。為了節省功率,許多音頻控制設備在不活動時進入低功率模式。然而,當設備處于低功率模式時,用于檢測一個或多個口頭關鍵詞(諸如Siri、Alexa、或Google)或其他音頻事件的設備的音頻處理部分以始終開啟的方式保持在活動模式。如果音頻處理部分檢測到關鍵詞或其他音頻事件,則設備從低功率模式喚醒到活動模式,以使得能夠進一步處理一個或多個后續話音命令或其他音頻事件,以便執行與話音命令或音頻事件相關聯的一個或多個操作。
因為許多音頻控制設備是電池受限的或以其他方式具有低功耗(諸如許多IoT設備),所以需要降低設備的音頻處理部分的功耗以檢測口頭關鍵詞或其他音頻事件,同時保持期望的性能水平。
發明內容
提供本發明內容是為了以簡化的形式介紹下面在具體實施方式中進一步描述的概念的選擇。本發明內容不旨在標識所要求保護的主題的關鍵特征或必要特征,也不旨在限制所要求保護的主題的范圍。
本文公開的系統和方法包括級聯音頻檢出系統,其包括被設計為在級聯過程中順序操作以降低操作期間的功耗的多個模塊。級聯音頻檢出系統中的初始模塊比級聯音頻檢出系統中的稍后的模塊消耗更少的功率,其中稍后的模塊實現比初始模塊更期望的性能水平。級聯模塊使得稍后的模塊僅基于先前模塊的性能來使用降低了功耗而不犧牲整體性能。
本公開的一些方面涉及操作級聯音頻檢出系統的示例方法。該方法包括由級聯音頻檢出系統的第一模塊從一個或多個音頻流接收音頻流。該方法還包括由第一模塊處理音頻流以檢測音頻流中的第一目標聲音活動。該方法還包括響應于檢測到音頻流中的第一目標聲音活動,由第一模塊提供第一信號。該方法還包括響應于第一信號由第一模塊提供,由高功率子系統接收一個或多個音頻流,并且由高功率子系統處理一個或多個音頻流以檢測一個或多個音頻流中的第二目標聲音活動。
在一些實現方式中,該方法還包括響應于第一信號由第一模塊提供而將高功率子系統從低功率模式切換到活動模式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于辛納普蒂克斯公司,未經辛納普蒂克斯公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310033628.0/2.html,轉載請聲明來源鉆瓜專利網。





