[發明專利]音頻處理方法、裝置及存儲介質有效
| 申請號: | 201810878964.4 | 申請日: | 2018-08-03 |
| 公開(公告)號: | CN110797042B | 公開(公告)日: | 2022-04-15 |
| 發明(設計)人: | 錢能鋒;陳揚坤;陳展 | 申請(專利權)人: | 杭州海康威視數字技術股份有限公司 |
| 主分類號: | G10L21/0216 | 分類號: | G10L21/0216 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 韓東艷 |
| 地址: | 310051 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 處理 方法 裝置 存儲 介質 | ||
1.一種音頻處理方法,其特征在于,所述方法包括:
獲取多個音頻采樣頻點對應的波束形成系數矩陣,獲取到的多個波束形成系數矩陣是基于從麥克風陣列對應的圓形區域內選取的目標扇形區域確定的,所述圓形區域用于指代所述麥克風陣列的音頻采集區域,所述多個波束形成系數矩陣用于控制在所述目標扇形區域指代的音頻采集區域內采集的音頻信號為靜音狀態;
分別確定所述麥克風陣列中每個麥克風采集的音頻信號在所述多個音頻采樣頻點下的頻域信號;
將每個波束形成系數矩陣作為所述每個麥克風在對應音頻采樣頻點下的頻域信號的系數,對所確定的頻域信號進行變換處理,得到目標音頻信號;
其中,所述方法還包括:
獲取所述多個音頻采樣頻點對應的預設陣列流形矩陣;
基于所述目標扇形區域,生成目標響應向量,所述目標響應向量包括與所述圓形區域內預先劃分的K個單位扇形區域一一對應的K個響應數值,K為正整數,所述目標扇形區域不包括的單位扇形區域對應的響應數值為第一數值,所述目標扇形區域包括的單位扇形區域對應的響應數值為第二數值,所述第一數值用于表示非靜音,所述第二數值用于表示靜音;
基于所述目標響應向量和獲取到的預設陣列流形矩陣,獲取所述多個音頻采樣頻點對應的波束形成系數矩陣。
2.如權利要求1所述的方法,其特征在于,所述基于所述目標響應向量和獲取到的預設陣列流形矩陣,獲取所述多個音頻采樣頻點對應的波束形成系數矩陣,包括:
基于所述目標響應向量和獲取到的預設陣列流形矩陣,通過指定公式,獲取所述多個音頻采樣頻點對應的波束形成系數矩陣,所述指定公式為:
其中,所述A(i)為第i個預設陣列流形矩陣,所述pd(Θ)為所述目標響應向量,所述wi為第i個波束形成系數矩陣。
3.如權利要求1所述的方法,其特征在于,所述將每個波束形成系數矩陣作為所述每個麥克風在對應音頻采樣頻點下的頻域信號的系數,對所確定的頻域信號進行變換處理,得到目標音頻信號,包括:
對于所述多個音頻采樣頻點中的每個音頻采樣頻點,將所述每個麥克風采集的音頻信號在所述音頻采樣頻點下的頻域信號進行組合,得到組合矩陣;
確定所述組合矩陣與所述音頻采樣頻點對應的預設波束形成系數矩陣之間的乘積,得到所述麥克風陣列在所述音頻采樣頻點下的頻域信號;
對所述麥克風陣列在所述多個音頻采樣頻點下的頻域信號進行組合,并將組合后的頻域信號進行傅里葉反變換處理,得到所述目標音頻信號。
4.如權利要求1所述的方法,其特征在于,所述分別確定所述麥克風陣列中每個麥克風采集的音頻信號在所述多個音頻采樣頻點下的頻域信號,包括:
分別對所述麥克風陣列中每個麥克風采集的音頻信號進行分幀處理,得到所述每個麥克風采集的音頻信號的分幀信號;
按照預設窗口大小,對所述每個麥克風采集的音頻信號的分幀信號進行加窗處理,得到所述每個麥克風采集的音頻信號的加窗信號;
基于所述多個音頻采樣頻點,分別對所述每個麥克風采集的音頻信號的加窗信號進行傅里葉變換處理,得到所述每個麥克風采集的音頻信號在所述多個音頻采樣頻點下的頻域信號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州海康威視數字技術股份有限公司,未經杭州海康威視數字技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810878964.4/1.html,轉載請聲明來源鉆瓜專利網。





