[發(fā)明專利]聲源跟蹤方法、裝置、設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010790561.1 | 申請日: | 2020-08-07 |
| 公開(公告)號: | CN111933182A | 公開(公告)日: | 2020-11-13 |
| 發(fā)明(設(shè)計)人: | 王備 | 申請(專利權(quán))人: | 北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G01S5/20 |
| 代理公司: | 北京鍾維聯(lián)合知識產(chǎn)權(quán)代理有限公司 11579 | 代理人: | 金愛靜 |
| 地址: | 100041 北京市石景山區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 聲源 跟蹤 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
本申請涉及聲源跟蹤方法、裝置、設(shè)備和存儲介質(zhì)。該方法包括:利用麥克風(fēng)陣列采集音頻信號;其中,所述麥克風(fēng)陣列中的多個麥克風(fēng)分別設(shè)置于音頻采集設(shè)備的不同方向,用于從多個不同方向采集音頻信號;從所述多個不同方向中確定所述音頻信號中目標(biāo)音頻幀的聲源方向;若所述目標(biāo)音頻幀的聲源方向與所述目標(biāo)音軌中已關(guān)聯(lián)的其他音頻幀的聲源方向相匹配,將所述目標(biāo)音頻幀關(guān)聯(lián)至目標(biāo)音軌,以便在所述目標(biāo)音軌中對所述聲源方向上的音頻信號進行跟蹤采集。如此,來實現(xiàn)對多聲源的跟蹤。
技術(shù)領(lǐng)域
本申請涉及音頻處理領(lǐng)域,特別是涉及一種聲源跟蹤方法、裝置、設(shè)備和存儲介質(zhì)。
背景技術(shù)
目前,遠(yuǎn)程會議場景中常使用麥克風(fēng)陣列,常采用能量估計方式來進行音頻傳輸,即利麥克風(fēng)陣列波束形成技術(shù),在預(yù)先設(shè)定的多個不同方向的固定波束中,選擇采集到的能量最大的固定波束的信號作為目標(biāo)信號來完成音頻傳輸。這種方法雖然實現(xiàn)簡單,但是現(xiàn)有麥克風(fēng)陣列只能對一個參會人的聲音進行跟蹤,也即只能進行單聲源跟蹤,當(dāng)多個聲源同時出現(xiàn)時,能量相對較弱的聲源會被忽略,而會議場景中必然存在多個聲源,因此,現(xiàn)有聲源跟蹤方式無法滿足會議場景的需求。
發(fā)明內(nèi)容
為解決上述問題,本發(fā)明提出了一種聲源跟蹤方法、裝置、設(shè)備和存儲介質(zhì)。
第一方面,本申請實施例提供一種聲源跟蹤方法,所述方法包括:
利用麥克風(fēng)陣列采集音頻信號;其中,所述麥克風(fēng)陣列中的多個麥克風(fēng)分別設(shè)置于音頻采集設(shè)備的不同方向,用于從多個不同方向采集音頻信號;
從所述多個不同方向中確定所述音頻信號中目標(biāo)音頻幀的聲源方向;
若所述目標(biāo)音頻幀的聲源方向與所述目標(biāo)音軌中已關(guān)聯(lián)的其他音頻幀的聲源方向相匹配,將所述目標(biāo)音頻幀關(guān)聯(lián)至目標(biāo)音軌,以便在所述目標(biāo)音軌中對所述聲源方向上的音頻信號進行跟蹤采集。
在本申請方案的一具體示例中,所述方法還包括:
基于所述目標(biāo)音軌中所關(guān)聯(lián)的音頻幀輸出所述音頻信號。
在本申請方案的一具體示例中,所述方法還包括:
檢測所述目標(biāo)音頻幀的聲源方向與處于激活狀態(tài)的目標(biāo)音軌中已關(guān)聯(lián)的其他音頻幀的聲源方向是否相匹配;
基于匹配結(jié)果確定是否將所述目標(biāo)音頻幀關(guān)聯(lián)至與目標(biāo)音軌。
在本申請方案的一具體示例中,所述方法還包括:
若所述目標(biāo)音頻幀的聲源方向與所述目標(biāo)音軌中已關(guān)聯(lián)的其他音頻幀的聲源方向不匹配,將所述目標(biāo)音頻幀關(guān)聯(lián)至其他音軌,以使該其他音軌關(guān)聯(lián)與所述目標(biāo)音頻幀的聲源方向相匹配的音頻幀。
在本申請方案的一具體示例中,所述將所述目標(biāo)音頻幀關(guān)聯(lián)至其他音軌,包括:
將所述目標(biāo)音頻幀關(guān)聯(lián)至處于激活狀態(tài)的其他音軌;或者,
將所述目標(biāo)音頻幀關(guān)聯(lián)至處于空閑狀態(tài)的其他音軌。
在本申請方案的一具體示例中,所述目標(biāo)音軌和/或其他音軌的狀態(tài)隨關(guān)聯(lián)音頻幀的關(guān)聯(lián)特征而變化。
第二方面,本申請實施例提供一種聲源跟蹤裝置,所述裝置包括:
采集單元,用于利用麥克風(fēng)陣列采集音頻信號;其中,所述麥克風(fēng)陣列中的多個麥克風(fēng)分別設(shè)置于音頻采集設(shè)備的不同方向,用于從多個不同方向采集音頻信號;
聲源方向確定單元,用于從所述多個不同方向中確定所述音頻信號中目標(biāo)音頻幀的聲源方向
音軌關(guān)聯(lián)單元,用于若所述目標(biāo)音頻幀的聲源方向與所述目標(biāo)音軌中已關(guān)聯(lián)的其他音頻幀的聲源方向相匹配,將所述目標(biāo)音頻幀關(guān)聯(lián)至目標(biāo)音軌,以便在所述目標(biāo)音軌中對所述聲源方向上的音頻信號進行跟蹤采集。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司,未經(jīng)北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010790561.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 移動通信系統(tǒng)中標(biāo)準(zhǔn)接口的消息跟蹤方法及其系統(tǒng)
- 網(wǎng)絡(luò)跟蹤系統(tǒng)及跟蹤控制方法
- 同步跟蹤自動調(diào)節(jié)裝置
- 業(yè)務(wù)信令跟蹤方法、系統(tǒng)及裝置
- 超聲波診斷裝置
- 一種自動跟蹤方法、自動跟蹤設(shè)備及自動跟蹤系統(tǒng)
- 多目標(biāo)跟蹤方法、系統(tǒng)、計算設(shè)備及存儲介質(zhì)
- 一種軌跡跟蹤方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種目標(biāo)跟蹤方法、裝置及存儲介質(zhì)
- 信號跟蹤方法、濾波方法、裝置及醫(yī)療設(shè)備





