[發(fā)明專利]一種基于雙麥克風陣列的定向拾音方法及計算設(shè)備有效

申請?zhí)枺?/td>	201810070108.6	申請日：	2018-01-24
公開（公告）號：	CN108269582B	公開（公告）日：	2021-06-01
發(fā)明（設(shè)計）人：	方博偉;卓鵬鵬;張康;尤嘉華;張偉	申請（專利權(quán)）人：	廈門美圖之家科技有限公司
主分類號：	G10L21/0216	分類號：	G10L21/0216;G10L21/0232
代理公司：	北京思睿峰知識產(chǎn)權(quán)代理有限公司 11396	代理人：	謝建云;趙愛軍
地址：	361008 福建省廈門***	國省代碼：	福建;35
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種基于麥克風陣列定向方法計算設(shè)備
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開了一種基于雙麥克風陣列的定向拾音方法，其中雙麥克風陣列包含第一麥克風和第二麥克風，通過第一麥克風獲取第一聲道的音頻數(shù)據(jù)，通過第二麥克風獲取第二聲道的音頻數(shù)據(jù)，包括步驟：對獲取的第一聲道的音頻數(shù)據(jù)和第二聲道的音頻數(shù)據(jù)分別進行預(yù)處理，得到每個音頻幀在第一聲道的頻譜及對應(yīng)在第二聲道的頻譜；計算每個音頻幀的入射角；根據(jù)每個音頻幀的入射角計算該音頻幀的目標噪音比；利用每個音頻幀的入射角和目標噪音比計算該音頻幀的濾波器系數(shù)；根據(jù)濾波器系數(shù)生成各音頻幀的濾波后頻譜；以及通過對濾波后頻譜作逆傅里葉變換，來生成期望拾音范圍內(nèi)的音頻數(shù)據(jù)的時域波形。本發(fā)明一并公開了用于執(zhí)行上述定向拾音方法的計算設(shè)備。

技術(shù)領(lǐng)域

本發(fā)明涉及音頻處理技術(shù)領(lǐng)域，尤其是一種基于雙麥克風陣列的定向拾音方法及計算設(shè)備。

背景技術(shù)

在拍攝視頻或錄音時，麥克風陣列所接收到的語音信號是期望信號與非期望的噪音信號疊加的結(jié)果。由于錄音環(huán)境常常伴隨著各種不同類型的噪音，有穩(wěn)態(tài)的高斯白噪聲，也有非穩(wěn)態(tài)的噪聲，如食堂、超市、餐廳等聲音場所，環(huán)境聲音組成比較復雜，導致錄音結(jié)果往往非常嘈雜，影響聽音感受，嚴重的情況下期望的聲音甚至會被噪音掩蔽，無法獲取期望的語音內(nèi)容。

針對音頻降噪，單麥降噪的基本思想都是采用譜減法，通過語音活動檢測獲取噪音段音頻數(shù)據(jù)，進一步估計出噪音頻譜，從錄音結(jié)果中減去估計的噪音譜來得到期望語音成分。考慮到環(huán)境的多樣性，有的錄音設(shè)備會內(nèi)置許多不同環(huán)境下的背景噪音樣本，計算匹配最相似的噪音樣本，來應(yīng)對不同的錄音環(huán)境。由于錄音環(huán)境隨機性很大，且相同環(huán)境中的錄音成分更是千差萬別，這種內(nèi)置噪音樣本的降噪方式對穩(wěn)態(tài)噪音有一定效果，但是要采集很多噪音樣本，工作量較大，對于非穩(wěn)態(tài)噪音抑制效果很弱。同時單麥并不能定位聲源，無法實現(xiàn)定向地增強某一個拾音范圍內(nèi)的聲音。

因此，在一些小型通信設(shè)備或者錄音設(shè)備中，常需要利用雙麥克風陣列來實現(xiàn)增強期望聲音、抑制噪音，其基本思想是依賴聲源定位檢測結(jié)果，通過波束成形來提取期望區(qū)域的聲源，傳統(tǒng)的延時加成(delay and sum)的方法通過估計聲源定位結(jié)果來糾正兩個聲道直接的延時，再疊加兩個聲道數(shù)據(jù)在一定程度上抵消環(huán)境噪音。但是，在混響較大或嘈雜環(huán)境的中提取效果并不理想，還是需要借助譜減法達到最終降噪的目的，影響聽音感受。

鑒于上述原因，需要一種在嘈雜環(huán)境中也能夠準確地獲取期望的語音內(nèi)容的定向拾音方案。

發(fā)明內(nèi)容

為此，本發(fā)明提供了一種基于雙麥克風陣列的定向拾音方法，雙麥克風陣列包含第一麥克風和第二麥克風，該方法適于對通過第一麥克風獲取的第一聲道的音頻數(shù)據(jù)和通過第二麥克風獲取的第二聲道的音頻數(shù)據(jù)進行處理，該方法適于在計算設(shè)備中執(zhí)行，包括步驟：對獲取的第一聲道的音頻數(shù)據(jù)和第二聲道的音頻數(shù)據(jù)分別進行預(yù)處理，得到每個音頻幀在第一聲道的頻譜及對應(yīng)在第二聲道的頻譜；根據(jù)每個音頻幀對應(yīng)在第一聲道和第二聲道上的頻譜間的延時，計算該音頻幀的入射角；根據(jù)每個音頻幀的入射角計算該音頻幀的目標噪音比；利用每個音頻幀的入射角和目標噪音比計算該音頻幀的濾波器系數(shù)；根據(jù)濾波器系數(shù)生成各音頻幀的濾波后頻譜；以及通過對濾波后頻譜作逆傅里葉變換，來生成期望拾音范圍內(nèi)的音頻數(shù)據(jù)的時域波形。

可選地，在根據(jù)本發(fā)明的方法中，根據(jù)每個音頻幀對應(yīng)在第一聲道和第二聲道上的頻譜間的延時、計算該音頻幀的入射角的步驟包括：對于每個音頻幀，根據(jù)音頻幀對應(yīng)在第一聲道和第二聲道上的頻譜計算音頻幀的協(xié)方差矩陣；根據(jù)協(xié)方差矩陣計算音頻幀的相角譜；以及從相角譜中取最大值對應(yīng)的角度作為該音頻幀的入射角。

可選地，在根據(jù)本發(fā)明的方法中，根據(jù)每個音頻幀的入射角計算該音頻幀的目標噪音比的步驟包括：根據(jù)雙麥克風的間距、采樣率和聲速計算得到第一參數(shù)；根據(jù)每個音頻幀的入射角及第一參數(shù)計算得到音頻幀對應(yīng)的第二參數(shù)；以及根據(jù)第一參數(shù)和每個音頻幀的第二參數(shù)計算得到每個音頻幀的目標信噪比。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門美圖之家科技有限公司，未經(jīng)廈門美圖之家科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810070108.6/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：回聲消除方法及裝置
下一篇：一種基于時間延遲直方圖的語音分離方法

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L21-00 為了改變語音信號的質(zhì)量或其可識度而處理語音信號，以產(chǎn)生另一種可聽的或非可聽的信號，例如視覺信號或觸覺信號
G10L21-02 .語音增強，例如降低噪聲或消除回聲
G10L21-04 .時間壓縮或擴展
G10L21-06 .將語音轉(zhuǎn)換成非可聽表達形式，例如語音可視化、觸覺輔助的語音處理

免登錄下載普通用戶下載升級VIP會員，免費下載

[發(fā)明專利]一種基于雙麥克風陣列的定向拾音方法及計算設(shè)備有效

專利文獻下載