[發(fā)明專利]噪聲檢測方法、噪聲檢測裝置、介質(zhì)及電子設(shè)備有效
| 申請?zhí)枺?/td> | 202010085321.1 | 申請日: | 2020-02-10 |
| 公開(公告)號: | CN111341333B | 公開(公告)日: | 2023-01-17 |
| 發(fā)明(設(shè)計)人: | 夏咸軍;王燕南 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L25/78;G10L25/03;G10L25/30;G10L25/45 |
| 代理公司: | 深圳市聯(lián)鼎知識產(chǎn)權(quán)代理有限公司 44232 | 代理人: | 葉虹 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 噪聲 檢測 方法 裝置 介質(zhì) 電子設(shè)備 | ||
1.一種噪聲檢測方法,其特征在于,包括:
提取多個樣本音頻信號分別對應(yīng)的頻譜特征;
根據(jù)所述頻譜特征所屬的分類類別對所述多個樣本音頻信號分類,得到多個類別子集,所述多個類別子集包括純凈語音子集和純凈噪聲子集;其中,所述類別子集與所述分類類別一一對應(yīng);
根據(jù)所述多個類別子集分別訓(xùn)練噪聲檢測網(wǎng)絡(luò);
通過訓(xùn)練后的噪聲檢測網(wǎng)絡(luò)檢測采集到的實時音頻信號中各時刻對應(yīng)的噪聲概率;其中,所述噪聲概率用于表示所述時刻的音頻信號中不包括噪聲的概率;
確定所述各時刻之前的第二預(yù)設(shè)幀對應(yīng)的平滑噪聲概率;
計算所述平滑噪聲概率與相對應(yīng)時刻的噪聲概率的平均值,作為所述各時刻對應(yīng)的噪聲概率的平滑處理結(jié)果,并依據(jù)平滑處理結(jié)果生成所述實時音頻信號對應(yīng)的噪聲序列。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,提取多個樣本音頻信號分別對應(yīng)的頻譜特征,包括:
劃分所述多個樣本音頻信號分別對應(yīng)的時間幀,得到各所述樣本音頻信號的信號片段;
對所述信號片段進(jìn)行傅里葉變換,得到所述信號片段對應(yīng)的頻譜能量分布;
根據(jù)頻譜特征生成算法生成所述頻譜能量分布對應(yīng)的頻譜特征,并將對應(yīng)于同一樣本音頻信號的頻譜特征進(jìn)行拼接,得到各所述樣本音頻信號對應(yīng)的頻譜特征。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述多個類別子集分別訓(xùn)練噪聲檢測網(wǎng)絡(luò),包括:
將所述純凈語音子集輸入所述噪聲檢測網(wǎng)絡(luò),并通過所述噪聲檢測網(wǎng)絡(luò)檢測所述純凈語音子集中樣本音頻信號對應(yīng)的第一預(yù)測噪聲序列,以及計算所述純凈語音子集對應(yīng)的標(biāo)準(zhǔn)噪聲序列與所述第一預(yù)測噪聲序列之間的第一損失函數(shù),根據(jù)所述第一損失函數(shù)調(diào)整所述噪聲檢測網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù),直到所述第一損失函數(shù)處于預(yù)設(shè)的閾值范圍內(nèi);以及,
將所述純凈噪聲子集輸入所述噪聲檢測網(wǎng)絡(luò),并通過所述噪聲檢測網(wǎng)絡(luò)檢測所述純凈噪聲子集中樣本音頻信號對應(yīng)的第二預(yù)測噪聲序列,以及計算所述純凈噪聲子集對應(yīng)的標(biāo)準(zhǔn)噪聲序列與所述第二預(yù)測噪聲序列之間的第二損失函數(shù),根據(jù)所述第二損失函數(shù)調(diào)整所述噪聲檢測網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù),直到所述第二損失函數(shù)處于所述預(yù)設(shè)的閾值范圍內(nèi)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,通過訓(xùn)練后的噪聲檢測網(wǎng)絡(luò)檢測采集到的實時音頻信號中各時刻對應(yīng)的噪聲概率,包括:
通過訓(xùn)練后的噪聲檢測網(wǎng)絡(luò)確定所述實時音頻信號中各時刻之前的第一預(yù)設(shè)幀;其中,所述第二預(yù)設(shè)幀的數(shù)量大于所述第一預(yù)設(shè)幀的數(shù)量;
根據(jù)所述第一預(yù)設(shè)幀檢測所述實時音頻信號中各時刻對應(yīng)的噪聲概率。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,依據(jù)平滑處理結(jié)果生成所述實時音頻信號對應(yīng)的噪聲序列,包括:
將所述平滑處理結(jié)果中大于等于門限值的時刻標(biāo)注為1,以及將所述平滑處理結(jié)果中小于所述門限值的時刻標(biāo)注為0,直到標(biāo)注完成所有的所述平滑處理結(jié)果;
將標(biāo)注結(jié)果按照時刻順序進(jìn)行排列,得到所述實時音頻信號對應(yīng)的噪聲序列。
6.一種噪聲檢測裝置,其特征在于,包括:
頻譜特征提取單元,用于提取多個樣本音頻信號分別對應(yīng)的頻譜特征;
音頻信號分類單元,用于根據(jù)所述頻譜特征所屬的分類類別對所述多個樣本音頻信號分類,得到多個類別子集,所述多個類別子集包括純凈語音子集和純凈噪聲子集;其中,所述類別子集與所述分類類別一一對應(yīng);
網(wǎng)絡(luò)訓(xùn)練單元,用于根據(jù)所述多個類別子集分別訓(xùn)練噪聲檢測網(wǎng)絡(luò);
噪聲檢測單元,用于通過訓(xùn)練后的噪聲檢測網(wǎng)絡(luò)檢測采集到的實時音頻信號中各時刻對應(yīng)的噪聲概率,所述噪聲概率用于表示所述時刻的音頻信號中不包括噪聲的概率;以及確定所述各時刻之前的第二預(yù)設(shè)幀對應(yīng)的平滑噪聲概率;計算所述平滑噪聲概率與相對應(yīng)時刻的噪聲概率的平均值,作為所述各時刻對應(yīng)的噪聲概率的平滑處理結(jié)果,并依據(jù)平滑處理結(jié)果生成所述實時音頻信號對應(yīng)的噪聲序列。
7.一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,其特征在于,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1-5任一項所述的方法。
8.一種電子設(shè)備,其特征在于,包括:
處理器;以及
存儲器,用于存儲所述處理器的可執(zhí)行指令;
其中,所述處理器配置為經(jīng)由執(zhí)行所述可執(zhí)行指令來執(zhí)行權(quán)利要求1-5任一項所述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010085321.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





