[發明專利]語音降噪的方法、裝置、電子設備及存儲介質有效
| 申請號: | 201910754269.1 | 申請日: | 2019-08-15 |
| 公開(公告)號: | CN110491407B | 公開(公告)日: | 2021-09-21 |
| 發明(設計)人: | 黃杰雄;戴長軍;黃健源 | 申請(專利權)人: | 廣州方硅信息技術有限公司 |
| 主分類號: | G10L21/0232 | 分類號: | G10L21/0232;G10L25/18;G10L25/30 |
| 代理公司: | 深圳市智圈知識產權代理事務所(普通合伙) 44351 | 代理人: | 呂靜 |
| 地址: | 511442 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 方法 裝置 電子設備 存儲 介質 | ||
本申請公開了一種語音降噪的方法、裝置、電子設備以及存儲介質,該方法包括獲取第一音頻,第一音頻為混合有語音信號以及背景噪聲信號的音頻;繼而對第一音頻進行預處理,以將第一音頻的頻譜能量特征由線性時域轉換到Bark頻域,得到第一音頻的Bark特征;再將Bark特征輸入預先訓練得到的目標神經網絡模型,獲取目標神經網絡模型輸出的Bark特征比例參數;再基于Bark特征比例參數計算語音信號的幅值參數;然后基于幅值參數獲取目標語音。通過將第一音頻的Bark特征輸入預先訓練得到的目標神經網絡模型,進而計算出語音信號的幅值參數,再基于幅值參數獲取目標語音,減小了神經網絡模型的計算量,降低語音信息中的背景噪聲。
技術領域
本申請涉及語音降噪技術領域,更具體地,涉及一種語音降噪的方法、裝置、電子設備及存儲介質。
背景技術
語音降噪技術是一種從混合了目標語音和背景噪聲的音頻中,消除或抑制背景噪聲得到目標語音的技術。作為一種方式,可以將大量現實中的目標語音信號和噪聲信號隨機混合,作為神經網絡的輸入,經過監督訓練后,神經網絡能夠自動地從訓練樣本中學習輸出目標語音信號。然而,隨著目標語音采樣率的提高,神經網絡的計算量將不斷增大,使其無法得到廣泛的應用。
發明內容
鑒于上述問題,本申請提出了一種語音降噪的方法、裝置、電子設備及存儲介質,以改善上述問題。
第一方面,本申請實施例提供了一種語音降噪的方法,該方法包括:獲取第一音頻,第一音頻為混合有語音信號以及背景噪聲信號的音頻;對第一音頻進行預處理,以將第一音頻的頻譜能量特征由線性時域轉換到Bark頻域,得到第一音頻的Bark特征;將Bark特征輸入預先訓練得到的目標神經網絡模型,獲取目標神經網絡模型輸出的Bark特征比例參數,Bark特征比例參數表征語音信號的頻譜幅值特征在Bark頻域中所占的比例;基于Bark特征比例參數,計算語音信號的幅值參數;基于幅值參數獲取目標語音。
第二方面,本申請實施例提供了一種語音降噪的裝置,該裝置包括:第一獲取模塊,用于獲取第一音頻,第一音頻為混合有語音信號以及背景噪聲信號的音頻;預處理模塊,用于對第一音頻進行預處理,以將第一音頻的頻譜能量特征由線性時域轉換到Bark頻域,得到第一音頻的Bark特征;第一計算模塊,用于將Bark特征輸入預先訓練得到的目標神經網絡模型,獲取目標神經網絡模型輸出的Bark特征比例參數,Bark特征比例參數表征語音信號的頻譜幅值特征在Bark頻域中所占的比例;第二計算模塊,用于基于Bark特征比例參數,計算語音信號的幅值參數;第二獲取模塊,用于基于幅值參數獲取目標語音。
第三方面,本申請實施例提供了一種電子設備,包括存儲器以及一個或多個處理器;一個或多個程序被存儲在存儲器中并被配置為由一個或多個處理器執行,一個或多個程序配置用于執行上述第一方面所述的方法。
第四方面,本申請實施例提供了一種計算機可讀存儲介質,計算機可讀存儲介質中存儲有程序代碼,其中,在程序代碼由處理器運行時執行上述第一方面所述的方法。
本申請實施例提供的一種語音降噪的方法、裝置、電子設備及存儲介質,涉及語音降噪技術領域。本方法通過獲取第一音頻,第一音頻為混合有語音信號以及背景噪聲信號的音頻;繼而對第一音頻進行預處理,以將第一音頻的頻譜能量特征由線性時域轉換到Bark頻域,得到第一音頻的Bark特征;再將Bark特征輸入預先訓練得到的目標神經網絡模型,獲取目標神經網絡模型輸出的Bark特征比例參數,Bark特征比例參數表征語音信號的頻譜幅值特征在Bark頻域中所占的比例;再基于Bark特征比例參數計算語音信號的幅值參數;然后基于幅值參數獲取目標語音。本方法通過將第一音頻的Bark特征輸入預先訓練得到的目標神經網絡模型,進而計算出語音信號的幅值參數,再基于幅值參數獲取目標語音,減小了神經網絡模型的計算量,降低語音信息中的背景噪聲。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州方硅信息技術有限公司,未經廣州方硅信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910754269.1/2.html,轉載請聲明來源鉆瓜專利網。





