[發明專利]噪聲檢測的方法和裝置在審
| 申請號: | 202011504715.2 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112614512A | 公開(公告)日: | 2021-04-06 |
| 發明(設計)人: | 陳洲旋 | 申請(專利權)人: | 騰訊音樂娛樂科技(深圳)有限公司 |
| 主分類號: | G10L25/81 | 分類號: | G10L25/81;G10L25/87 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 寧立存 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 噪聲 檢測 方法 裝置 | ||
本申請提供了一種噪聲檢測的方法,屬于音頻處理技術領域。所述方法包括:在目標音頻中確定待定噪聲音頻段,其中,所述待定噪聲音頻段中的每個音頻幀均滿足噪聲參數條件,且與所述待定噪聲音頻段相鄰的音頻幀均不滿足所述噪聲參數條件;確定與所述待定噪聲音頻段相鄰、且時長與所述待定噪聲音頻段的時長滿足預設條件的至少一個參考音頻段;基于所述待定噪聲音頻段、所述至少一個參考音頻段以及噪聲判定模型,確定所述待定噪聲音頻段對應的噪聲判定結果,其中,所述噪聲判定結果用于指示所述待定噪聲音頻段是否存在噪聲。采用本申請,不需要對目標音頻中的所有音頻段都進行復雜的模型處理,節省了檢測時間,提高了檢測效率。
技術領域
本申請涉及音頻處理技術領域,特別涉及一種噪聲檢測的方法和裝置。
背景技術
隨著互聯網的發展,數字音樂迅速流行。對音頻進行噪聲檢測是一種非常常見的處理,例如,音樂平臺會對存入音頻庫的歌曲音頻進行噪聲檢測,K歌應用程序在對錄制的歌曲音頻進行去噪處理之前需要進行噪聲檢測。
相關技術中噪聲檢測方法是:將音頻劃分為若干固定時長的音頻段,根據噪聲判定模型判定每個音頻段是否存在噪聲。
上述的噪聲檢測方法,需要對音頻的每個音頻段都進行復雜的模型處理,需要消耗較長的時間,處理效率較低。
發明內容
本申請實施例提供了一種噪聲檢測的方法,能夠解決相關技術中噪聲檢測時需要對音頻的每個音頻段都進行復雜的模型處理進而需要消耗較長時間、處理效率較低的問題。所述技術方案如下:
第一方面,提供了一種噪聲檢測的方法,所述方法包括:
在目標音頻中確定待定噪聲音頻段,其中,所述待定噪聲音頻段中的每個音頻幀均滿足噪聲參數條件,且與所述待定噪聲音頻段相鄰的音頻幀均不滿足所述噪聲參數條件;
確定與所述待定噪聲音頻段相鄰、且時長與所述待定噪聲音頻段的時長滿足預設條件的至少一個參考音頻段;
基于所述待定噪聲音頻段、所述至少一個參考音頻段以及噪聲判定模型,確定所述待定噪聲音頻段對應的噪聲判定結果,其中,所述噪聲判定結果用于指示所述待定噪聲音頻段是否存在噪聲。
在一種可能的設計中,所述在目標音頻中確定待定噪聲音頻段,包括:
在所述目標音頻中從首個音頻幀開始向后逐個檢測音頻幀是否滿足噪聲參數條件;
當檢測到第一音頻幀滿足噪聲參數條件、且所述第一音頻幀的前一個音頻幀不滿足噪聲參數條件時,將所述第一音頻幀確定為開始音頻幀;
當檢測到第二音頻幀滿足噪聲參數條件、且所述第二音頻幀的后一個音頻幀不滿足噪聲參數條件時,將所述第二音頻幀確定為結束音頻幀;
將所述開始音頻幀至所述結束音頻幀的音頻段,確定為待定噪聲音頻段。
在一種可能的設計中,所述待定噪聲音頻段中的音頻幀的數目大于或等于數目閾值。
在一種可能的設計中,所述噪聲參數條件包括音頻幀的能量大于能量閾值、音頻幀的過零率大于過零率閾值以及音頻幀的頻譜平坦度大于頻譜平坦度閾值。
在一種可能的設計中,所述至少一個參考音頻段包括第一參考音頻段和/或第二參考音頻段;
所述確定與所述待定噪聲音頻段相鄰、且時長與所述待定噪聲音頻段的時長滿足預設條件的至少一個參考音頻段,包括:
在所述待定噪聲音頻段之前,確定與所述待定噪聲音頻段相鄰、且時長與所述待定噪聲音頻段的時長的比值為第一數值的第一參考音頻段;和/或,
在所述待定噪聲音頻段之后,確定與所述待定噪聲音頻段相鄰、且時長與所述待定噪聲音頻段的時長的比值為第二數值的第二參考音頻段。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊音樂娛樂科技(深圳)有限公司,未經騰訊音樂娛樂科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011504715.2/2.html,轉載請聲明來源鉆瓜專利網。





