[發明專利]一種音頻信號處理方法、裝置、終端及存儲介質有效

申請號：	201911302374.8	申請日：	2019-12-17
公開（公告）號：	CN111128221B	公開（公告）日：	2022-09-02
發明（設計）人：	侯海寧	申請（專利權）人：	北京小米智能科技有限公司
主分類號：	G10L21/0224	分類號：	G10L21/0224;G10L21/0232;G10L21/0272
代理公司：	北京善任知識產權代理有限公司 11650	代理人：	康艷青
地址：	100085 北京市海淀區清河***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種音頻信號處理方法裝置終端存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種音頻信號處理方法，其特征在于，所述方法包括：

由至少兩個麥克風獲取至少兩個聲源各自發出的音頻信號，以獲得所述至少兩個麥克風各自的原始帶噪信號；

對所述至少兩個麥克風各自的原始帶噪信號進行聲源分離，以獲得所述至少兩個聲源各自的時頻估計信號；

基于所述至少兩個聲源各自的時頻估計信號，確定每一個聲源的時頻估計信號分別在每一個麥克風的原始帶噪信號中的掩蔽值；其中，所述基于所述至少兩個聲源各自的時頻估計信號，確定每一個聲源的時頻估計信號分別在每一個麥克風的原始帶噪信號中的掩蔽值，包括：基于任意所述聲源在所述時頻估計信號，以及每一個麥克風的原始帶噪信號，獲得占比值；基于所述占比值，獲得任意所述聲源分別在每一個麥克風的遮蔽值；

基于所述至少兩個麥克風各自的原始帶噪信號及所述掩蔽值，更新所述至少兩個聲源各自的時頻估計信號；

基于所述至少兩個聲源各自的更新后的時頻估計信號，確定所述至少兩個聲源各自發出的音頻信號。

2.根據權利要求1所述的方法，其特征在于，所述對所述至少兩個麥克風各自的原始帶噪信號進行聲源分離，以獲得所述至少兩個聲源各自的時頻估計信號，包括：

基于分離矩陣與當前幀的原始帶噪信號，獲取當前幀的第一分離信號；其中，所述分離矩陣為所述當前幀的分離矩陣，或者所述當前幀的前一幀的分離矩陣；

組合每一幀的所述第一分離信號，以獲得各所述聲源的所述時頻估計信號。

3.根據權利要求2所述的方法，其特征在于，當所述當前幀為第一幀時，所述第一幀的分離矩陣為單位矩陣；

所述基于分離矩陣與當前幀的原始帶噪信號，獲取當前幀的第一分離信號，包括：

基于所述單位矩陣及所述第一幀的原始帶噪信號，獲取所述第一幀的所述第一分離信號。

4.根據權利要求2所述的方法，其特征在于，所述方法還包括：

若所述當前幀為第一幀以后的音頻幀時，基于所述當前幀的前一幀的分離矩陣及當前幀的原始帶噪信號確定所述當前幀的分離矩陣。

5.根據權利要求1至4任一項所述的方法，其特征在于，所述基于所述占比值，獲得任意所述聲源分別在每一個麥克風的遮蔽值，包括：

對所述占比值進行非線性映射，獲得任意所述聲源分別在每一個麥克風的掩蔽值。