[發明專利]單聲道語音降噪方法、系統、設備及可讀存儲介質在審
| 申請號: | 202011534575.3 | 申請日: | 2020-12-22 |
| 公開(公告)號: | CN112614504A | 公開(公告)日: | 2021-04-06 |
| 發明(設計)人: | 王健宗;程寧;張之勇 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L21/0216 | 分類號: | G10L21/0216;G10L25/30 |
| 代理公司: | 北京中巡通大知識產權代理有限公司 11703 | 代理人: | 郭瑤 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 單聲道 語音 方法 系統 設備 可讀 存儲 介質 | ||
本發明屬于語音降噪領域,公開了一種單聲道語音降噪方法、系統、設備及可讀存儲介質,包括獲取待降噪的單聲道語音;構建基于LSTM神經網絡的初始降噪模型;獲取預設數量的增強訓練樣本,采用預設數量的增強訓練樣本訓練初始降噪模型,得到降噪模型;通過降噪模型將待降噪的單聲道語音降噪,得到人聲音頻。降噪過程不受限于雙聲道的限制,能夠實現任何單聲道語音的降噪處理,基于同一通語音中整個時間序列的噪音類別大致相同的特性,通過采用LSTM神經網絡為基礎進行模型的訓練,便于學習到整個時間序列的噪音規律,進而達到較好的降噪效果。同時,基于噪聲影響因素的復雜性,通過增強訓練樣本對初始降噪模型再次訓練,進一步提升降噪模型的降噪效果。
技術領域
本發明屬于語音降噪領域,涉及一種單聲道語音降噪方法、系統、設備及可讀存儲介質。
背景技術
幾年之前,我們在通話的時候還經常會聽到各種噪音,非常影響通話質量,但現如今,隨著智能手機的普及,我們已經可以明顯感覺到通話時雜音的減少。這是由于現在的大部分智能手機都使用了高通的芯片,而這些芯片大多都搭載了高通專有的CVC技術,CVC技術是一種通話降噪技術,其工作原理是在通話的時候,通過手機內置的雙麥克風獲取聲音,其中,主麥克風在說話人嘴邊,可以接收到較大的說話人聲;副麥克風離說話人的嘴較遠,接收到的說話人聲較小,而兩個麥克風卻可以接收到幾乎相同大小的環境噪聲,通過結合主副麥克風收集到的聲音信號,就可以通過一定算法,分辨出哪些聲音是我們想要的說話人聲,從而實現降噪通話。
但是,該技術卻仍然有著如下缺陷。首先,該技術無法處理單聲道音頻,必須要求手機擁有雙麥克風,對于單麥克風手機沒有作用;而且,對說話人通話的姿勢有一定要求,要求說話人聲源離主麥克風很近,若說話人離麥克風遠或者帶了單麥克風的耳機也無法應用。
發明內容
本發明的目的在于克服上述現有技術中,現有的通話降噪技術無法處理單聲道音頻的缺點,提供一種單聲道語音降噪方法、系統、設備及可讀存儲介質。
為達到上述目的,本發明采用以下技術方案予以實現:
本發明第一方面,一種單聲道語音降噪方法,包括以下步驟:
獲取待降噪的單聲道語音;構建基于LSTM神經網絡的初始降噪模型;獲取預設數量的增強訓練樣本,采用預設數量的增強訓練樣本訓練初始降噪模型,得到降噪模型;通過降噪模型將待降噪的單聲道語音降噪,得到人聲音頻。
本發明單聲道語音降噪方法進一步的改進在于:
所述構建基于LSTM神經網絡的初始降噪模型包括:獲取若干人聲音頻和若干噪音音頻并隨機組合,得到若干混合音頻,各混合音頻中均包括一人聲音頻及至少一個噪音音頻;將混合音頻進行分幀加窗處理及傅里葉變換,得到若干混合音頻幀頻譜;將若干混合音頻幀頻譜分為訓練集和測試集,建立用于二分類的LSTM神經網絡模型,通過訓練集訓練LSTM神經網絡模型,通過測試集測試訓練后的LSTM神經網絡模型,測試合格后得到初始降噪模型。
所述通過訓練集訓練LSTM神經網絡模型包括:將訓練集內的混合音頻幀頻譜輸入LSTM神經網絡模型,得到人聲頻譜和噪音頻譜并進行逆傅里葉變換,得到預測的人聲音頻及噪音音頻;根據預測的人聲音頻與實際的人聲音頻之間的誤差,迭代更新LSTM神經網絡模型中的各參數,至訓練次數達到預設值或預測的人聲音頻與實際的人聲音頻之間的誤差不再下降。
所述獲取預設數量的增強訓練樣本,采用預設數量的增強訓練樣本訓練初始降噪模型包括:獲取若干初始降噪模型降噪不合格的單聲道語音,作為預設數量的增強訓練樣本;獲取若干通過人聲音頻和若干噪音音頻組合形成的測試樣本;采用無監督學習的方式,通過預設數量的增強訓練樣本訓練初始降噪模型,至訓練后的初始降噪模型對測試樣本的降噪效果與初始降噪模型對測試樣本的降噪效果在預設誤差內,且訓練后的初始降噪模型對增強訓練樣本的降噪效果大于初始降噪模型對增強訓練樣本的降噪效果預設閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011534575.3/2.html,轉載請聲明來源鉆瓜專利網。





