[發(fā)明專利]音頻定位系統(tǒng)的靈敏度模式在審
| 申請?zhí)枺?/td> | 202310033633.1 | 申請日: | 2023-01-10 |
| 公開(公告)號: | CN116416977A | 公開(公告)日: | 2023-07-11 |
| 發(fā)明(設(shè)計(jì))人: | S·莫賽耶波卡斯卡里 | 申請(專利權(quán))人: | 辛納普蒂克斯公司 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/22;G10L25/87;G10L21/0208;G10L15/28 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 董婕;陳嵐 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 定位 系統(tǒng) 靈敏度 模式 | ||
1.一種操作級聯(lián)音頻定位系統(tǒng)的高功率子系統(tǒng)的方法,包括:
使用所述高功率子系統(tǒng)的高功率觸發(fā)器的一個(gè)或多個(gè)檢測模型來檢測目標(biāo)聲音活動是否包括在一個(gè)或多個(gè)音頻流中,其中:
當(dāng)所述級聯(lián)音頻定位系統(tǒng)處于常規(guī)模式時(shí),所述一個(gè)或多個(gè)檢測模型與超參數(shù)的第一集合相關(guān)聯(lián);以及
當(dāng)所述級聯(lián)音頻定位系統(tǒng)處于靈敏度模式時(shí),所述一個(gè)或多個(gè)檢測模型與超參數(shù)的第二集合相關(guān)聯(lián);以及
響應(yīng)于在所述目標(biāo)聲音活動中檢測所述一個(gè)或多個(gè)音頻流,提供一個(gè)或多個(gè)經(jīng)處理的音頻流中的至少一個(gè)以用于進(jìn)一步處理。
2.根據(jù)權(quán)利要求1所述的方法,還包括:
以所述常規(guī)模式操作所述級聯(lián)音頻定位系統(tǒng),其中用于所述一個(gè)或多個(gè)檢測模型的所述超參數(shù)的第一集合用于檢測所述目標(biāo)聲音活動是否包括在所述一個(gè)或多個(gè)音頻流中;
使用所述超參數(shù)的第一集合確定在第一時(shí)間量內(nèi)在所述一個(gè)或多個(gè)音頻流中檢測到所述目標(biāo)聲音活動的第一次數(shù);
如果將使用所述超參數(shù)的第二集合而不是如果將使用所述超參數(shù)的第一集合,則確定在所述第一時(shí)間量內(nèi)將在所述一個(gè)或多個(gè)音頻流中檢測到所述目標(biāo)聲音活動的第二次數(shù);以及
基于所述第一次數(shù)和所述第二次數(shù)將所述級聯(lián)音頻定位系統(tǒng)從所述常規(guī)模式切換到所述靈敏度模式,其中用于所述一個(gè)或多個(gè)檢測模型的所述超參數(shù)的第二集合用于檢測所述目標(biāo)聲音活動是否包括在所述一個(gè)或多個(gè)音頻流中。
3.根據(jù)權(quán)利要求2所述的方法,還包括:
以所述靈敏度模式操作所述級聯(lián)音頻定位系統(tǒng);
確定在第二時(shí)間量內(nèi)在所述一個(gè)或多個(gè)音頻流中檢測到所述目標(biāo)聲音活動的次數(shù);以及
基于所述次數(shù)將所述級聯(lián)音頻定位系統(tǒng)從所述靈敏度模式切換到所述常規(guī)模式。
4.根據(jù)權(quán)利要求1所述的方法,其中使用所述一個(gè)或多個(gè)檢測模型來檢測所述目標(biāo)聲音活動是否包括在所述一個(gè)或多個(gè)音頻流中包括:
使用第一檢測模型來生成所述一個(gè)或多個(gè)音頻流包括所述目標(biāo)聲音活動的第一概率;以及
將所述第一概率與第一檢測閾值進(jìn)行比較,其中檢測所述一個(gè)或多個(gè)音頻流中的所述目標(biāo)聲音活動是基于所述比較。
5.根據(jù)權(quán)利要求4所述的方法,還包括在以所述常規(guī)模式和所述靈敏度模式操作的所述級聯(lián)音頻定位系統(tǒng)之間進(jìn)行切換,其中:
在以所述常規(guī)模式和所述靈敏度模式操作的所述級聯(lián)音頻定位系統(tǒng)之間進(jìn)行切換包括在使用所述第一檢測閾值和使用第二檢測閾值進(jìn)行與所述第一概率的所述比較之間進(jìn)行切換;
所述超參數(shù)的第一集合包括所述第一檢測閾值;以及
所述超參數(shù)的第二集合包括所述第二檢測閾值。
6.根據(jù)權(quán)利要求4所述的方法,其中使用所述一個(gè)或多個(gè)檢測模型來檢測所述目標(biāo)聲音活動是否包括在所述一個(gè)或多個(gè)音頻流中包括:
使用一個(gè)或多個(gè)附加檢測模型,其中所述一個(gè)或多個(gè)附加檢測模型中的每一個(gè)用于生成所述一個(gè)或多個(gè)音頻流包括所述目標(biāo)聲音活動的附加概率;
對于每個(gè)附加概率,將所述附加概率和與所述附加檢測模型相關(guān)聯(lián)的檢測閾值進(jìn)行比較,以由相關(guān)聯(lián)的檢測模型檢測所述目標(biāo)聲音活動是否包括在所述一個(gè)或多個(gè)音頻流中;
對檢測所述目標(biāo)聲音活動包括在所述一個(gè)或多個(gè)音頻流中的檢測模型的數(shù)量進(jìn)行計(jì)數(shù);以及
將所述數(shù)量與第一集成閾值進(jìn)行比較,其中檢測所述一個(gè)或多個(gè)音頻流中的所述目標(biāo)聲音活動是基于所述數(shù)量與所述第一集成閾值的所述比較。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于辛納普蒂克斯公司,未經(jīng)辛納普蒂克斯公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310033633.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





