[發明專利]音頻處理方法及裝置在審

申請號：	202011022357.1	申請日：	2020-09-25
公開（公告）號：	CN112151055A	公開（公告）日：	2020-12-29
發明（設計）人：	陳佳路;王曉紅;劉魯鵬;元海明;高強;夏龍;郭常圳	申請（專利權）人：	北京猿力未來科技有限公司
主分類號：	G10L21/0208	分類號：	G10L21/0208;G10L21/0216;G10L21/0232
代理公司：	北京智信禾專利代理有限公司 11637	代理人：	劉曉楠
地址：	100102 北京市朝陽區廣順南大***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	音頻處理方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本說明書提供音頻處理方法及裝置，其中所述音頻處理方法包括：獲取待檢測音頻文件；對所述待檢測音頻文件進行分幀處理獲得多個音頻幀，并在所述多個音頻幀中篩選出滿足噴麥檢測條件的目標音頻幀；根據所述目標音頻幀和所述目標音頻幀的下一音頻幀生成頻率幅度譜，以及根據所述目標音頻幀的上一音頻幀和上二音頻幀生成參考頻率幅度譜；將所述頻率幅度譜和所述參考頻率幅度譜進行比對，根據比對結果確定所述待檢測音頻文件的噴麥音頻幀。

技術領域

本說明書涉及音頻處理技術領域，特別涉及音頻處理方法及裝置。

背景技術

隨著互聯網技術的發展，音頻的噪聲處理被應用到越來越多的場景中，如在直播場景、通話場景、語音播報場景等，都需要實時或離線的完成對音頻中的噪聲進行消除，從而使得用戶能夠收聽到較為優質的音頻。然而，現有技術在實現噪聲消除時，大多數實現方案都是對音頻中的主要聲源和次要聲源進行分辨，通過保留主要聲源刪除次要聲源的方式實現消除不需要的噪聲，然而因為噴麥是由主要聲源在發聲過程中產生的噪聲，所以該種方式并不能夠消除噴麥噪聲產生的影響，導致優化后的音頻還存在部分不利于收聽的其他聲音內容，故亟需一種有效的方案以解決該問題。

發明內容

有鑒于此，本說明書實施例提供了一種音頻處理方法。本說明書同時涉及一種音頻處理裝置，一種計算設備，以及一種計算機可讀存儲介質，以解決現有技術中存在的技術缺陷。

根據本說明書實施例的第一方面，提供了一種音頻處理方法，包括：

獲取待檢測音頻文件；

對所述待檢測音頻文件進行分幀處理獲得多個音頻幀，并在所述多個音頻幀中篩選出滿足噴麥檢測條件的目標音頻幀；

根據所述目標音頻幀和所述目標音頻幀的下一音頻幀生成頻率幅度譜，以及根據所述目標音頻幀的上一音頻幀和上二音頻幀生成參考頻率幅度譜；

將所述頻率幅度譜和所述參考頻率幅度譜進行比對，根據比對結果確定所述待檢測音頻文件的噴麥音頻幀。

可選的，所述在所述多個音頻幀中篩選出滿足噴麥檢測條件的目標音頻幀，包括：

確定所述多個音頻幀分別對應的音量幅度特征，并選擇所述音量幅度特征滿足預設音量幅度特征條件的音頻幀確定為初始音頻幀；

基于預設的降采樣策略或幅度異常策略對所述初始音頻幀進行篩選，獲得中間音頻幀；

構建所述中間音頻幀對應的中間頻率幅度譜；

基于所述中間頻率幅度譜確定所述中間音頻幀滿足預設幅度譜分布條件的情況下，將所述中間音頻幀作為所述目標音頻幀。