[發(fā)明專利]用于基于多個(gè)音頻饋源來(lái)標(biāo)識(shí)來(lái)自興趣源的聲音的方法和系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201680058801.0 | 申請(qǐng)日: | 2016-09-14 |
| 公開(kāi)(公告)號(hào): | CN108140398B | 公開(kāi)(公告)日: | 2021-08-24 |
| 發(fā)明(設(shè)計(jì))人: | S·扎德伊薩 | 申請(qǐng)(專利權(quán))人: | 微軟技術(shù)許可有限責(zé)任公司 |
| 主分類號(hào): | G10L25/78 | 分類號(hào): | G10L25/78;G10L21/034;H04R3/00;G10L21/0216;G10L21/0208;G10L15/22;G10L15/08 |
| 代理公司: | 上海專利商標(biāo)事務(wù)所有限公司 31100 | 代理人: | 錢盛赟;顧嘉運(yùn) |
| 地址: | 美國(guó)華*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 基于 音頻 饋源 標(biāo)識(shí) 來(lái)自 興趣 聲音 方法 系統(tǒng) | ||
1.一種聲音處理系統(tǒng),包括:
第一音頻捕捉設(shè)備和第二音頻捕捉設(shè)備,其中所述第一音頻捕捉設(shè)備比所述第二音頻捕捉設(shè)備更鄰近興趣點(diǎn);
語(yǔ)音活動(dòng)檢測(cè)模塊,其:
接收分別由所述第一音頻捕捉設(shè)備和所述第二音頻捕捉設(shè)備捕捉到的第一音頻饋源和第二音頻饋源;
基于所述第二音頻饋源的相應(yīng)部分來(lái)衰減所述第一音頻饋源的至少一部分以生成第一經(jīng)衰減音頻饋源;
基于所述第一音頻饋源的相應(yīng)部分來(lái)衰減所述第二音頻饋源的至少一部分以生成第二經(jīng)衰減音頻饋源;
將所述第一經(jīng)衰減音頻饋源的頻帶與所述第二經(jīng)衰減音頻饋源的相應(yīng)頻帶相比較;以及
基于來(lái)自所述第一經(jīng)衰減音頻饋源的、與所述第二經(jīng)衰減音頻饋源的相應(yīng)頻帶相差超過(guò)預(yù)定義差別閾值的頻帶的數(shù)量來(lái)確定源置信水平,其中所述源置信水平指示聲音是否源自所述興趣點(diǎn)。
2.如權(quán)利要求1所述的聲音處理系統(tǒng),其特征在于,所述源置信水平的較高值比所述源置信水平的較低值更多地指示所述第一經(jīng)衰減音頻饋源內(nèi)的聲音源自所述興趣點(diǎn)。
3.如權(quán)利要求1所述的聲音處理系統(tǒng),其特征在于,基于所述第二音頻饋源的所述相應(yīng)部分來(lái)衰減所述第一音頻饋源的至少所述部分是衰減被包含在所述第一音頻饋源內(nèi)且被包含在所述第二音頻饋源內(nèi)的一個(gè)或多個(gè)頻率,并且其中基于所述第一音頻饋源的所述相應(yīng)部分來(lái)衰減所述第二音頻饋源的至少所述部分是衰減被包含在所述第二音頻饋源內(nèi)且被包含在所述第一音頻饋源內(nèi)的一個(gè)或多個(gè)頻率。
4.如權(quán)利要求1所述的聲音處理系統(tǒng),其特征在于,所述語(yǔ)音活動(dòng)檢測(cè)模塊還:
在衰減所述第一音頻饋源的至少所述部分之前將所述第一音頻饋源與所述第二音頻饋源進(jìn)行時(shí)間同步;以及
在衰減所述第二音頻饋源的至少所述部分之前將所述第二音頻饋源與所述第一音頻饋源進(jìn)行時(shí)間同步。
5.如權(quán)利要求1所述的聲音處理系統(tǒng),其特征在于,進(jìn)一步包括:
語(yǔ)音識(shí)別模塊,其:
接收所述第一經(jīng)衰減音頻饋源;
監(jiān)視所述第一經(jīng)衰減音頻饋源以標(biāo)識(shí)所述第一經(jīng)衰減音頻饋源內(nèi)所包含的一個(gè)或多個(gè)觸發(fā);以及
響應(yīng)于標(biāo)識(shí)出所述一個(gè)或多個(gè)觸發(fā)來(lái)執(zhí)行一個(gè)或多個(gè)動(dòng)作。
6.如權(quán)利要求5所述的聲音處理系統(tǒng),其特征在于,所述語(yǔ)音活動(dòng)檢測(cè)模塊還:響應(yīng)于確定所述源置信水平超過(guò)預(yù)配置界限來(lái)將所述第一經(jīng)衰減音頻饋源輸出到所述語(yǔ)音識(shí)別模塊。
7.如權(quán)利要求6所述的聲音處理系統(tǒng),其特征在于,所述預(yù)配置界限基于主存所述聲音處理系統(tǒng)的計(jì)算設(shè)備的功率電平而變化。
8.如權(quán)利要求1所述的聲音處理系統(tǒng),其特征在于,所述語(yǔ)音活動(dòng)檢測(cè)模塊還:
基于來(lái)自所述第一音頻饋源的、與所述第二音頻饋源的相應(yīng)頻帶相差在預(yù)定義差別閾值內(nèi)的頻帶的數(shù)量來(lái)確定噪聲置信水平,其中所述噪聲置信水平的較高值比所述噪聲置信水平的較低值更多地指示所述第一音頻饋源內(nèi)的聲音是噪聲。
9.如權(quán)利要求1所述的聲音處理系統(tǒng),其特征在于,進(jìn)一步包括聲學(xué)回音消除(AEC)模塊,其:減少所述第一經(jīng)衰減音頻饋源內(nèi)所包含的回應(yīng)量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微軟技術(shù)許可有限責(zé)任公司,未經(jīng)微軟技術(shù)許可有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201680058801.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置





