[發明專利]一種音頻信號處理方法、裝置、終端及存儲介質有效

申請號：	201911302374.8	申請日：	2019-12-17
公開（公告）號：	CN111128221B	公開（公告）日：	2022-09-02
發明（設計）人：	侯海寧	申請（專利權）人：	北京小米智能科技有限公司
主分類號：	G10L21/0224	分類號：	G10L21/0224;G10L21/0232;G10L21/0272
代理公司：	北京善任知識產權代理有限公司 11650	代理人：	康艷青
地址：	100085 北京市海淀區清河***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種音頻信號處理方法裝置終端存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本公開是關于一種音頻信號處理方法，所述方法包括：由至少兩個麥克風獲取至少兩個聲源各自發出的音頻信號，以獲得所述至少兩個麥克風各自的原始帶噪信號；對所述至少兩個麥克風各自的原始帶噪信號進行聲源分離，以獲得所述至少兩個聲源各自的時頻估計信號；基于所述至少兩個聲源各自的時頻估計信號，確定每一個聲源的時頻估計信號分別在每一個麥克風的原始帶噪信號中的掩蔽值；基于所述至少兩個麥克風各自的原始帶噪信號及所述掩蔽值，更新所述至少兩個聲源各自的時頻估計信號；基于所述至少兩個聲源各自的更新后的時頻估計信號，確定所述至少兩個聲源各自發出的音頻信號。本公開還公開了一種音頻信號處理裝置、終端及存儲介質。

技術領域

本公開涉及通信技術領域，尤其涉及一種音頻信號處理方法、裝置、終端及存儲介質。

背景技術

相關技術中，智能產品設備拾音多采用麥克風陣列，應用麥克風波束形成技術提高語音信號處理質量，以提高真實環境下的語音識別率。但多個麥克風的波束形成技術對麥克風位置誤差敏感，性能影響較大，另外麥克風個數增多了也會導致產品成本升高。

因此，目前越來越多的智能產品設備只配置兩個麥克風；兩個麥克風常采用完全不同于多個麥克風波束形成技術的盲源分離技術對語音進行增強，而如何使得基于盲源分離技術分離后信號的語音質量更高是目前的迫切需要解決的問題。

發明內容

本公開提供一種音頻信號處理方法、裝置、終端及存儲介質。

由至少兩個麥克風獲取至少兩個聲源各自發出的音頻信號，以獲得所述至少兩個麥克風各自的原始帶噪信號；

對所述至少兩個麥克風各自的原始帶噪信號進行聲源分離，以獲得所述至少兩個聲源各自的時頻估計信號；

基于所述至少兩個聲源各自的時頻估計信號，確定每一個聲源的時頻估計信號分別在每一個麥克風的原始帶噪信號中的掩蔽值；

基于所述至少兩個麥克風各自的原始帶噪信號及所述掩蔽值，更新所述至少兩個聲源各自的時頻估計信號；

基于所述至少兩個聲源各自的更新后的時頻估計信號，確定所述至少兩個聲源各自發出的音頻信號。