[發明專利]音頻降噪方法、裝置、電子設備及計算機可讀存儲介質在審
| 申請號: | 202110227616.2 | 申請日: | 2021-03-01 |
| 公開(公告)號: | CN112951259A | 公開(公告)日: | 2021-06-11 |
| 發明(設計)人: | 潘頌聲;曹偲;李鵬;趙翔宇;劉華平 | 申請(專利權)人: | 杭州網易云音樂科技有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/028 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 王輝;闞梓瑄 |
| 地址: | 310052 浙江省杭州市蕭山區錢江世*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 方法 裝置 電子設備 計算機 可讀 存儲 介質 | ||
1.一種音頻降噪方法,其特征在于,包括:
獲取原始音頻的信噪比;
若所述信噪比小于等于預設閾值,則根據第一強度對所述原始音頻進行通用降噪處理;
若所述信噪比大于所述預設閾值,則獲取所述原始音頻的人聲片段和非人聲片段,并對所述人聲片段進行特定降噪處理,對所述非人聲片段進行特定抑制處理。
2.根據權利要求1所述的方法,其特征在于,若所述信噪比大于所述預設閾值,還包括:
根據第二強度對所述人聲片段和/或所述非人聲片段進行通用降噪處理;其中,所述第二強度小于所述第一強度。
3.根據權利要求1所述的方法,其特征在于,獲取原始音頻的信噪比,包括:
計算所述原始音頻中各人聲片段的能量均值以及所述原始音頻中各非人聲片段的能量均值;
對所述各人聲片段的能量均值進行求和,得到第一參數;
對所述各非人聲片段的能量均值進行求和,得到第二參數;
根據所述第一參數和所述第二參數計算所述信噪比。
4.根據權利要求3所述的方法,其特征在于,根據所述第一參數和所述第二參數計算所述信噪比,包括:
計算所述第一參數與第一預設權重的第一乘積;
計算所述第二參數與第二預設權重的第二乘積;
根據所述第一乘積和所述第二乘積計算所述信噪比。
5.根據權利要求1所述的方法,其特征在于,對所述人聲片段進行特定降噪處理,包括:
按照預處理窗長對所述原始音頻進行加窗,得到多幀音頻構成的參考音頻;其中,所述多幀音頻中各幀音頻均對應于所述預處理窗長;
通過特定噪聲檢測窗長對參考音頻進行加窗,得到多段音頻;其中,所述多段音頻中各段音頻均對應于所述特定噪聲檢測窗長,所述特定噪聲檢測窗長大于所述預處理窗長;
若檢測到所述多段音頻中存在至少一個包含特定噪聲的目標段音頻,則對所述人聲片段進行特定降噪處理。
6.根據權利要求5所述的方法,其特征在于,所述多幀音頻中相鄰幀音頻之間存在預設時長的音頻重疊。
7.根據權利要求5所述的方法,其特征在于,對所述人聲片段進行特定降噪處理之前,還包括:
確定所述多段音頻中各段音頻對應的音頻特征;
通過降維模型對所述各段音頻對應的音頻特征進行降維處理;
通過分類模型確定降維處理后所述各段音頻的音頻特征對應的檢測結果;其中,所述檢測結果用于表征音頻中存在特定噪聲的概率。
8.一種音頻降噪裝置,其特征在于,包括:
參數獲取單元,用于獲取原始音頻的信噪比;
降噪處理單元,用于在所述信噪比小于等于預設閾值時,根據第一強度對所述原始音頻進行通用降噪處理;
所述降噪處理單元,還用于在所述信噪比大于所述預設閾值時,獲取所述原始音頻的人聲片段和非人聲片段,并對所述人聲片段進行特定降噪處理,對所述非人聲片段進行特定抑制處理。
9.一種電子設備,其特征在于,包括:
處理器;以及
存儲器,所述存儲器上存儲有計算機可讀指令,所述計算機可讀指令被所述處理器執行時實現如權利要求1至7中任一項所述的音頻降噪方法。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現如權利要求1至7中任一項所述的音頻降噪方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州網易云音樂科技有限公司,未經杭州網易云音樂科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110227616.2/1.html,轉載請聲明來源鉆瓜專利網。





