[發(fā)明專利]一種基于深度壓縮感知的語音去噪方法及設(shè)備在審
| 申請?zhí)枺?/td> | 202211439345.8 | 申請日: | 2022-11-17 |
| 公開(公告)號: | CN115762549A | 公開(公告)日: | 2023-03-07 |
| 發(fā)明(設(shè)計)人: | 李嘉成;暢江 | 申請(專利權(quán))人: | 山西大學(xué) |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L25/78 |
| 代理公司: | 山西五維專利事務(wù)所(有限公司) 14105 | 代理人: | 茹牡花 |
| 地址: | 030000*** | 國省代碼: | 山西;14 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 壓縮 感知 語音 方法 設(shè)備 | ||
本發(fā)明涉及一種基于深度壓縮感知的語音去噪方法及設(shè)備,包括以下步驟:對純凈語音信號加入高斯白噪聲,得到帶噪語音信號,對純凈語音信號和帶噪語音信號進行時長規(guī)整和分幀處理;對純凈語音信號和帶噪語音信號進行感知特征提取,得到純凈語音的感知特征和帶噪語音的感知特征;將帶噪語音的感知特征作為生成對抗網(wǎng)絡(luò)的輸入,純凈語音的感知特征作為目標函數(shù),訓(xùn)練生成對抗網(wǎng)絡(luò),得到生成純凈語音的感知特征;采用壓縮感知的OMP重構(gòu)算法,對生成純凈語音的感知特征進行信號重構(gòu),得到生成純凈語音信號。本發(fā)明通過深度壓縮感知,適用于非線性噪聲分析與處理,提高帶有噪聲的語音信號的去噪效果。
技術(shù)領(lǐng)域
本發(fā)明屬于語音去噪技術(shù)領(lǐng)域,特別涉及一種基于深度壓縮感知的語音去噪方法。
背景技術(shù)
語音是人類特有的功能,也是人類獲取外界信息的重要工具,也是人與人交流必不可少的重要手段。語音去噪又被稱為語音增強,主要是針對于有人聲的音頻進行處理,目的是去除那些背景噪聲,增強音頻中人聲的可懂性。傳統(tǒng)的語音去噪方法主要為譜減法和維納濾波法,能夠去除一些簡單的噪聲,但是對非線性噪聲處理效果不好,所以引入深度學(xué)習(xí)來進行語音去噪,經(jīng)過深度學(xué)習(xí)能夠很好的解決非線性問題,
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于深度壓縮感知的語音去噪方法及設(shè)備,能夠利用壓縮感知和深度學(xué)習(xí)去除非線性噪聲,并且可以通過壓縮感知將信號進行降維,加快去噪速度;
為達到上述目的,本發(fā)明采用的技術(shù)方案是:
一種基于深度壓縮感知的語音去噪方法,包括以下步驟:
信號預(yù)處理:對純凈語音信號X加入高斯白噪聲,得到帶噪語音信號,對純凈語音信號X和帶噪語音信號進行時長規(guī)整和分幀處理,之后對純凈語音信號X進行端點檢測處理;
信號壓縮:采用壓縮感知方法,對預(yù)處理后的純凈語音信號X和帶噪語音信號進行感知特征提取,得到純凈語音的感知特征Y1和帶噪語音的感知特征Y2;
模型訓(xùn)練:采用深度學(xué)習(xí)模型的生成對抗網(wǎng)絡(luò)作為去噪模型,將帶噪語音的感知特征Y2作為生成對抗網(wǎng)絡(luò)的輸入,純凈語音的感知特征Y1作為目標函數(shù),訓(xùn)練生成對抗網(wǎng)絡(luò),經(jīng)過反復(fù)迭代和多次訓(xùn)練,得到生成純凈語音的感知特征Y′;
信號重構(gòu):采用壓縮感知的OMP重構(gòu)算法,對生成純凈語音的感知特征Y′進行信號重構(gòu),得到生成純凈語音信號X′,
其中,所述信號重構(gòu)過程中,先將生成純凈語音的感知特征Y′進行分幀處理,按每幀進行重構(gòu)信號,然后對重構(gòu)的每幀信號進行拼接,得到生成純凈語音信號X′。
優(yōu)選的,所述語音時長規(guī)整包括以下步驟:
將純凈語音信號X和帶噪語音信號的長度設(shè)置為信號幀長的整數(shù)倍。
優(yōu)選的,所述端點檢測包括以下步驟:
采用短時能量和過零率的雙門限兩級判別方法對純凈語音信號X進行端點檢測,對純凈語音信號X的有語音段和無語音段進行區(qū)分。
優(yōu)選的,所述感知特征提取包括以下步驟:
將N×1維的純凈語音信號X在M×N維的隨機高斯矩陣Φ上進行感知測量,使Y1=ΦX,得到M×1維的純凈語音的感知特征Y1,且純凈語音的感知特征Y1的維數(shù)M小于純凈語音信號X的維數(shù)N,
帶噪語音信號感知特征提取選用高斯隨機矩陣與純凈語音信號X感知特征提取所用高斯矩陣Φ相同,且?guī)г胝Z音信號的維數(shù)與純凈語音信號X的維數(shù)N相同,帶噪語音信號通過感知特征提取,得到帶噪語音的感知特征Y2。
優(yōu)選的,所述感知特征提取還包括以下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山西大學(xué),未經(jīng)山西大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211439345.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于策略的業(yè)務(wù)感知模型及感知方法
- 一種基于分區(qū)感知的無線通信系統(tǒng)頻譜感知方法
- 確定空閑頻段的方法和系統(tǒng)、中心節(jié)點和感知節(jié)點
- 感知無線網(wǎng)絡(luò)的共享協(xié)作頻譜感知方法、感知節(jié)點和匯聚中心
- 感知無線網(wǎng)絡(luò)的協(xié)作頻譜感知方法和感知節(jié)點
- 頻譜感知方法、頻譜感知設(shè)備和數(shù)據(jù)庫
- 基于認知數(shù)據(jù)庫和頻譜感知的頻譜共享方法及裝置
- 一種頂層感知限位組
- 一種自動駕駛汽車用升降式智能感知模塊
- 感知數(shù)據(jù)獲取方法和裝置





