[發明專利]一種基于雙麥克風陣列的目標語音提取方法在審
| 申請號: | 202110630288.0 | 申請日: | 2021-06-07 |
| 公開(公告)號: | CN113096684A | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 曾帆 | 申請(專利權)人: | 成都啟英泰倫科技有限公司 |
| 主分類號: | G10L21/0272 | 分類號: | G10L21/0272;G10L21/0216;G10L15/20;G10L15/05;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610041 四川省成都市高*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 麥克風 陣列 目標 語音 提取 方法 | ||
一種基于雙麥克風陣列的目標語音提取方法,包括如下步驟:S1.將兩個麥克風接收的時域信號轉化為頻域信號;S2.然后對頻域信號進行頻域盲源分離算法處理;處理后得到兩個源信號的估計信號;S3.利用兩個源信號的估計信號求出各自的累加語音存在概率和功率譜值,并根據語音存在概率和功率譜值選擇概率值高和功率譜值大的估計信號作為目標語音傳輸到后端語音識別系統進行識別。本發明對盲源分離算法分離后的兩個信號通過語音存在概率和功率譜值的綜合比較,提取出目標語音信號;該方法相對傳統方法,不需要利用DOA提供目標聲源先驗信息,且不需要采用深度學習方法提取,對系統資源要求降低。
技術領域
本發明屬于人工智能技術領域,涉及語音提取技術,具體涉及一種基于雙麥克風陣列的目標語音提取方法。
背景技術
在人工智能技術領域,語音增強、語音識別一直都是專家學者及語音交互產品市場關注的熱點話題。其中,雙麥克風陣列以其顯而易見的優勢成為技術人員研究的主要對象。原因在于相比于單麥克風,雙麥克風陣列在降噪處理及遠距離拾音等方面具有較大優勢;而與多麥克風陣列相比,雙麥克風陣列又極大簡化了語音交互產品的硬件設計方案及語音前端算法處理的復雜度。因此,雙麥克風陣列以其小巧靈活的構型以及電路、算力、成本要求都比較低而廣泛應用于智能家居、智能家電、智能玩具等領域。
在語音增強技術上,基于雙麥克風陣列的語音信號處理算法主要有基于波束形成的算法,如延時累加波束形成(Delay-Sum Beamforming,DSB)方法、最小方差無失真響應(Minimum Variance Distortionless Response,MVDR)波束形成方法等,基于盲源分離的算法以及基于深度學習的方法等。其中,基于盲源分離的算法相比于傳統波束形成方法降噪效果好、相比于深度學習方法算力小,易集成在嵌入式系統上。因此,盲源分離算法在雙麥克風陣列降噪處理上具有很好的應用前景。
雖然盲源分離算法在雙麥降噪處理上可以取得較好的效果,但由于盲源分離算法只是將語音與噪聲或者語音與干擾分離開,對于如何在盲源分離處理后提取目標語音仍是需要解決的難題。目前,對于目標語音的提取,主要的方法有基于目標聲源的波達方向(Direction of Arrival,DOA)、基于深度學習的訓練、基于音視頻融合等方法。但是對于雙麥克風而言,由于其麥克風數量較少,空間指向性較弱,利用DOA的方法會使目標語音提取時信號頻譜失真甚至無法提取到目標語音,而深度學習的方法又對嵌入式系統的性能和資源要求較高。
發明內容
為克服現有方案技術存在的缺陷,本發明公開了一種基于雙麥克風陣列的目標語音提取方法。
本發明所述基于雙麥克風陣列的目標語音提取方法,其特征在于,包括如下步驟:
S1. 將兩個麥克風接收的時域信號轉化為頻域信號;
S2. 然后對頻域信號進行頻域盲源分離算法處理;處理后得到兩個源信號的估計信號;
S3. 利用兩個源信號的估計信號求出各自的累加語音存在概率和功率譜值,并以功率譜值比值和概率值差值進行綜合比較,設置不同的閾值范圍,將功率譜值大和概率值高的信號作為目標語音傳輸到后端語音識別系統進行識別。
優選的:如果步驟S3中識別不成功,則更換另一估計信號進行識別。
優選的:所述S1步驟具體為:
S11.對時域信號做分幀加窗處理,設置每幀長度為K個采樣點;
S12. 進行分幀加窗處理后的時域信號進行端點識別處理,檢測輸入信號是否為語音信號,是則進入下一步驟S13,否則終止進程;
S13.對時域信號進行短時傅里葉變換,得到頻域信號。
優選的:所述S2步驟具體為:
S21.對雙麥克風陣列,以2 * 2單位矩陣作為分離矩陣W(k,l)的初始化矩陣,對分離矩陣W(k,l)進行逐幀更新;即幀數增加1,更新一次;
W(k,l)的更新規則為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都啟英泰倫科技有限公司,未經成都啟英泰倫科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110630288.0/2.html,轉載請聲明來源鉆瓜專利網。





