[發明專利]音頻檢測方法及裝置在審
| 申請號: | 202011211792.9 | 申請日: | 2020-11-03 |
| 公開(公告)號: | CN112289340A | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 陳佳路;王曉紅;劉魯鵬;元海明;高強;夏龍;郭常圳 | 申請(專利權)人: | 北京猿力未來科技有限公司 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/27;G10L25/60 |
| 代理公司: | 北京智信禾專利代理有限公司 11637 | 代理人: | 劉曉楠 |
| 地址: | 100102 北京市朝陽區廣順南大*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 檢測 方法 裝置 | ||
本說明書提供音頻檢測方法及裝置,其中所述音頻檢測方法包括:獲取待檢測音頻文件;將所述待檢測音頻文件輸入至噴麥檢測模型進行處理,獲得所述待檢測音頻文件中的噴麥音頻區間和所述噴麥音頻區間的噴麥概率;根據所述噴麥音頻區間和所述噴麥概率確定所述待檢測音頻文件中的噴麥音頻片段;通過所述音頻檢測方法進行噴麥音頻片段的檢測,不僅可以保證檢測效率,還能夠保證檢測精準度,進一步滿足了實際應用場景的音頻處理需求。
技術領域
本說明書涉及音頻處理技術領域,特別涉及音頻檢測方法及裝置。
背景技術
隨著互聯網技術的發展,音頻的噪聲處理被應用到越來越多的場景中,如在直播場景、通話場景、語音播報場景等,都需要實時或離線的完成對音頻中的噪聲進行消除,從而使得用戶能夠收聽到較為優質的音頻。然而,現有技術在實現噪聲消除時,大多數實現方案都是對音頻中的主要聲源和次要聲源進行分辨,通過保留主要聲源刪除次要聲源的方式實現消除不需要的噪聲,然而因為噴麥是由主要聲源在發聲過程中產生的噪聲,所以該種方式并不能夠消除噴麥噪聲產生的影響,導致優化后的音頻還存在部分不利于收聽的其他聲音內容,故亟需一種有效的方案以解決該問題。
發明內容
有鑒于此,本說明書實施例提供了一種音頻檢測方法。本說明書同時涉及一種音頻檢測裝置,一種計算設備,以及一種計算機可讀存儲介質,以解決現有技術中存在的技術缺陷。
根據本說明書實施例的第一方面,提供了一種音頻檢測方法,包括:
獲取待檢測音頻文件;
將所述待檢測音頻文件輸入至噴麥檢測模型進行處理,獲得所述待檢測音頻文件中的噴麥音頻區間和所述噴麥音頻區間的噴麥概率;
根據所述噴麥音頻區間和所述噴麥概率確定所述待檢測音頻文件中的噴麥音頻片段。
可選的,所述噴麥檢測模型通過如下方式訓練:
獲取樣本音頻文件,并對所述樣本音頻文件進行格式化處理,獲得標準音頻文件;
將所述標準音頻文件切分為多個音頻區間,按照所述多個音頻區間的屬性信息對所述多個音頻區間添加噴麥標簽或正常語音標簽;
基于所述多個音頻區間和添加標簽的多個音頻區間組成樣本音頻區間對,利用所述樣本音頻區間對初始噴麥檢測模型進行訓練,獲得所述噴麥檢測模型。
可選的,所述將所述待檢測音頻文件輸入至噴麥檢測模型進行處理,獲得所述待檢測音頻文件中的噴麥音頻區間和所述噴麥音頻區間的噴麥概率,包括:
基于預設幀長的處理窗以及預設時間的幀移對所述待檢測音頻文件進行變換,獲得所述待檢測音頻文件對應的幅度譜;
按照所述幅度譜在所述待檢測音頻文件中提取低頻特征輸入至所述噴麥檢測模型進行處理,獲得所述噴麥音頻區間和所述噴麥概率。
可選的,所述根據所述噴麥音頻區間和所述噴麥概率確定所述待檢測音頻文件中的噴麥音頻片段,包括:
確定所述噴麥音頻區間中的多個噴麥音頻子區間,以及根據所述噴麥概率確定所述多個噴麥音頻子區間中的噴麥音頻子區間對應的子噴麥概率;
將所述多個噴麥音頻子區間中的噴麥音頻子區間對應的子噴麥概率與預設概率閾值進行比較;
根據比較結果選擇大于等于所述預設概率閾值的噴麥音頻子區間組成所述待檢測音頻文件中的噴麥音頻片段。
可選的,所述根據所述噴麥音頻區間和所述噴麥概率確定所述待檢測音頻文件中的噴麥音頻片段,包括:
確定所述噴麥音頻區間中的多個噴麥音頻子區間,以及根據所述噴麥概率確定所述多個噴麥音頻子區間中的噴麥音頻子區間對應的子噴麥概率;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京猿力未來科技有限公司,未經北京猿力未來科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011211792.9/2.html,轉載請聲明來源鉆瓜專利網。





