[發(fā)明專利]級聯(lián)音頻檢出系統(tǒng)在審
| 申請?zhí)枺?/td> | 202310033628.0 | 申請日: | 2023-01-10 |
| 公開(公告)號: | CN116416979A | 公開(公告)日: | 2023-07-11 |
| 發(fā)明(設計)人: | S·莫賽耶波卡斯卡里;邱洪;A·普亞 | 申請(專利權)人: | 辛納普蒂克斯公司 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G06N20/00;G10L15/22;G10L21/0208;G10L21/0216;G10L15/16;G10L15/06;G10L25/30;G10L25/51 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 董婕;陳嵐 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 級聯(lián) 音頻 檢出 系統(tǒng) | ||
1.一種操作級聯(lián)音頻檢出系統(tǒng)的方法,包括:
由所述級聯(lián)音頻檢出系統(tǒng)的第一模塊從一個或多個音頻流接收音頻流;
由所述第一模塊處理所述音頻流以檢測所述音頻流中的第一目標聲音活動;
響應于檢測到所述音頻流中的所述第一目標聲音活動,由所述第一模塊提供第一信號;
響應于由所述第一模塊提供的所述第一信號:
由高功率子系統(tǒng)接收所述一個或多個音頻流;以及
由所述高功率子系統(tǒng)處理所述一個或多個音頻流以檢測所述一個或多個音頻流中的第二目標聲音活動。
2.根據(jù)權利要求1所述的方法,還包括響應于由所述第一模塊提供的所述第一信號,將所述高功率子系統(tǒng)從低功率模式切換到活動模式。
3.根據(jù)權利要求1所述的方法,其中所述第一模塊包括以下之一:
模擬話音活動檢測器VAD,其中所述音頻流包括模擬音頻流;
數(shù)字VAD,其中所述音頻流包括從所述模擬音頻流轉換的數(shù)字音頻幀流;或者
低功率觸發(fā)器,其中所述音頻流包括從所述模擬音頻流轉換的所述數(shù)字音頻幀流。
4.根據(jù)權利要求3所述的方法,其中所述低功率觸發(fā)器包括用于識別所述音頻流中的所述第一目標聲音活動的一個或多個檢測模型的第一集合,其中:
所述一個或多個檢測模型的第一集合與用于所述低功率觸發(fā)器的一個或多個超參數(shù)的第一集合相關聯(lián);以及
所述第一目標聲音活動包括所述音頻流中的一個或多個口頭關鍵詞。
5.根據(jù)權利要求4所述的方法,其中所述高功率子系統(tǒng)包括用于檢測所述一個或多個音頻流中的第二目標聲音活動的高功率觸發(fā)器,其中:
所述高功率觸發(fā)器包括用于識別所述第二目標聲音活動的一個或多個檢測模型的第二集合;所述一個或多個檢測模型的第二集合與用于所述高功率觸發(fā)器的一個或多個超參數(shù)的第二集合相關聯(lián);以及
所述第二目標聲音活動與所述第一目標聲音活動相同。
6.根據(jù)權利要求5所述的方法,其中:
用于所述高功率觸發(fā)器的所述一個或多個檢測模型的第二集合包括所述一個或多個檢測模型的第一集合;以及
與用于所述高功率觸發(fā)器的所述一個或多個檢測模型的第一集合相關聯(lián)的一個或多個超參數(shù)的集合不同于所述一個或多個超參數(shù)的第一集合。
7.根據(jù)權利要求5所述的方法,其中所述一個或多個檢測模型的第一集合和所述一個或多個檢測模型的第二集合被存儲在用于所述低功率觸發(fā)器和所述高功率觸發(fā)器的共享存儲器中。
8.根據(jù)權利要求1所述的方法,還包括:
由所述高功率子系統(tǒng)接收與所述一個或多個音頻流相關聯(lián)的參考信號,其中由所述高功率子系統(tǒng)處理所述一個或多個音頻流包括:
檢測所述第二目標聲音活動是否被包括在所述參考信號中;以及
響應于在所述參考信號中檢測到所述第二目標聲音活動,防止在所述一個或多個音頻流中檢測所述第二目標聲音活動。
9.根據(jù)權利要求1所述的方法,其中由所述高功率子系統(tǒng)處理所述一個或多個音頻流包括:基于參考信號對所述一個或多個音頻流執(zhí)行回波消除以生成一個或多個經(jīng)回波消除的音頻流;以及
檢測所述第二目標聲音活動是否包括在所述一個或多個經(jīng)回波消除的音頻流中。
10.根據(jù)權利要求9所述的方法,其中由所述高功率子系統(tǒng)處理所述一個或多個音頻流包括:對所述一個或多個經(jīng)回波消除的音頻流執(zhí)行多聲道降噪MCNR以生成一個或多個MCNR輸出;以及
檢測所述第二目標聲音活動是否被包括在所述一個或多個MCNR輸出中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于辛納普蒂克斯公司,未經(jīng)辛納普蒂克斯公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310033628.0/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





