[發明專利]音頻處理方法及裝置在審
| 申請號: | 202011022357.1 | 申請日: | 2020-09-25 |
| 公開(公告)號: | CN112151055A | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 陳佳路;王曉紅;劉魯鵬;元海明;高強;夏龍;郭常圳 | 申請(專利權)人: | 北京猿力未來科技有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/0216;G10L21/0232 |
| 代理公司: | 北京智信禾專利代理有限公司 11637 | 代理人: | 劉曉楠 |
| 地址: | 100102 北京市朝陽區廣順南大*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 處理 方法 裝置 | ||
本說明書提供音頻處理方法及裝置,其中所述音頻處理方法包括:獲取待檢測音頻文件;對所述待檢測音頻文件進行分幀處理獲得多個音頻幀,并在所述多個音頻幀中篩選出滿足噴麥檢測條件的目標音頻幀;根據所述目標音頻幀和所述目標音頻幀的下一音頻幀生成頻率幅度譜,以及根據所述目標音頻幀的上一音頻幀和上二音頻幀生成參考頻率幅度譜;將所述頻率幅度譜和所述參考頻率幅度譜進行比對,根據比對結果確定所述待檢測音頻文件的噴麥音頻幀。
技術領域
本說明書涉及音頻處理技術領域,特別涉及音頻處理方法及裝置。
背景技術
隨著互聯網技術的發展,音頻的噪聲處理被應用到越來越多的場景中,如在直播場景、通話場景、語音播報場景等,都需要實時或離線的完成對音頻中的噪聲進行消除,從而使得用戶能夠收聽到較為優質的音頻。然而,現有技術在實現噪聲消除時,大多數實現方案都是對音頻中的主要聲源和次要聲源進行分辨,通過保留主要聲源刪除次要聲源的方式實現消除不需要的噪聲,然而因為噴麥是由主要聲源在發聲過程中產生的噪聲,所以該種方式并不能夠消除噴麥噪聲產生的影響,導致優化后的音頻還存在部分不利于收聽的其他聲音內容,故亟需一種有效的方案以解決該問題。
發明內容
有鑒于此,本說明書實施例提供了一種音頻處理方法。本說明書同時涉及一種音頻處理裝置,一種計算設備,以及一種計算機可讀存儲介質,以解決現有技術中存在的技術缺陷。
根據本說明書實施例的第一方面,提供了一種音頻處理方法,包括:
獲取待檢測音頻文件;
對所述待檢測音頻文件進行分幀處理獲得多個音頻幀,并在所述多個音頻幀中篩選出滿足噴麥檢測條件的目標音頻幀;
根據所述目標音頻幀和所述目標音頻幀的下一音頻幀生成頻率幅度譜,以及根據所述目標音頻幀的上一音頻幀和上二音頻幀生成參考頻率幅度譜;
將所述頻率幅度譜和所述參考頻率幅度譜進行比對,根據比對結果確定所述待檢測音頻文件的噴麥音頻幀。
可選的,所述在所述多個音頻幀中篩選出滿足噴麥檢測條件的目標音頻幀,包括:
確定所述多個音頻幀分別對應的音量幅度特征,并選擇所述音量幅度特征滿足預設音量幅度特征條件的音頻幀確定為初始音頻幀;
基于預設的降采樣策略或幅度異常策略對所述初始音頻幀進行篩選,獲得中間音頻幀;
構建所述中間音頻幀對應的中間頻率幅度譜;
基于所述中間頻率幅度譜確定所述中間音頻幀滿足預設幅度譜分布條件的情況下,將所述中間音頻幀作為所述目標音頻幀。
可選的,所述確定所述多個音頻幀分別對應的音量幅度特征,包括:
獲取所述多個音頻幀分別對應的時域信號幅度;
根據所述時域信號幅度計算所述多個音頻幀分別對應的平均時域信號幅度,作為所述多個音頻幀分別對應的音量幅度特征,或者
根據所述時域信號幅度確定所述多個音頻幀分別對應的峰值時域信號幅度,作為所述多個音頻幀分別對應的音量幅度特征。
可選的,所述基于預設的降采樣策略對所述初始音頻幀進行篩選,獲得中間音頻幀,包括:
確定所述初始音頻幀對應的第一幅度峰值,并根據所述第一幅度峰值對所述初始音頻幀進行降采樣處理,獲得所述初始音頻幀對應的第二幅度峰值;
在所述第二幅度峰值大于第一預設峰值閾值的情況下,基于所述第一幅度峰值和所述第二幅度峰值計算所述初始音頻幀對應的目標幅度峰值;
在所述目標幅度峰值大于第二預設峰值閾值的情況下,將所述初始音頻幀確定為所述中間音頻幀。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京猿力未來科技有限公司,未經北京猿力未來科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011022357.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種圖像質量控制方法及其系統和設備
- 下一篇:一種含能材料密封軸套裝置





