[發(fā)明專利]基于改進(jìn)GAN網(wǎng)絡(luò)的語音去噪方法、裝置、設(shè)備及介質(zhì)有效
| 申請?zhí)枺?/td> | 201810985896.1 | 申請日: | 2018-08-28 |
| 公開(公告)號: | CN108986835B | 公開(公告)日: | 2019-11-26 |
| 發(fā)明(設(shè)計(jì))人: | 成學(xué)軍 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/02 |
| 代理公司: | 11205 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 | 代理人: | 吳會英;劉芳<國際申請>=<國際公布>= |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音數(shù)據(jù) 去噪 語音特征數(shù)據(jù) 特征數(shù)據(jù) 掩膜 歸一化處理 語音去噪 語音 方差 改進(jìn) 復(fù)雜分布 特征提取 噪聲信號 網(wǎng)絡(luò) 生成器 輸出 申請 | ||
1.一種基于改進(jìn)GAN網(wǎng)絡(luò)的語音去噪方法,其特征在于,包括:
獲取待處理的語音數(shù)據(jù);
對所述待處理的語音數(shù)據(jù)進(jìn)行特征提取,形成待處理語音的特征數(shù)據(jù);
計(jì)算所述待處理語音的特征數(shù)據(jù)的均值方差歸一化處理值;
將所述待處理語音的特征數(shù)據(jù)的均值方差歸一化處理值輸入到改進(jìn)GAN網(wǎng)絡(luò)的生成器中,輸出所述待處理的語音數(shù)據(jù)對應(yīng)的去噪語音特征數(shù)據(jù)的理想掩膜值;
根據(jù)所述去噪語音特征數(shù)據(jù)的理想掩膜值確定待處理的語音數(shù)據(jù)的去噪語音數(shù)據(jù);
其中,所述待處理的語音數(shù)據(jù)對應(yīng)的去噪語音特征數(shù)據(jù)的理想掩膜值為所述待處理的語音數(shù)據(jù)對應(yīng)的去噪語音特征數(shù)據(jù)和待處理語音特征數(shù)據(jù)的比值。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述待處理的語音數(shù)據(jù)進(jìn)行特征提取,形成待處理語音的特征數(shù)據(jù),具體包括:
采用以下任一種特征提取算法對所述待處理的語音數(shù)據(jù)進(jìn)行特征提取,形成待處理語音的特征數(shù)據(jù);
所述特征提取算法為:mel filterbank特征提取算法,mfcc特征提取算法或plp特征提取算法。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述將所述待處理語音的特征數(shù)據(jù)的均值方差歸一化處理值輸入到改進(jìn)GAN網(wǎng)絡(luò)的生成器中,輸出所述待處理的語音數(shù)據(jù)對應(yīng)的去噪語音特征數(shù)據(jù)的理想掩膜值之前,還包括:
對GAN網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測試,直到所述GAN網(wǎng)絡(luò)收斂,以得到改進(jìn)GAN網(wǎng)絡(luò)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述對GAN網(wǎng)絡(luò)進(jìn)行訓(xùn)練具體包括:
將每個第一訓(xùn)練樣本輸入到所述GAN網(wǎng)絡(luò)的生成器中,對所述GAN網(wǎng)絡(luò)的生成器進(jìn)行訓(xùn)練;
將第二訓(xùn)練樣本輸入到所述GAN網(wǎng)絡(luò)的判別器中,對所述GAN網(wǎng)絡(luò)的判別器進(jìn)行訓(xùn)練。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將每個第一訓(xùn)練樣本輸入到所述GAN網(wǎng)絡(luò)的生成器中,對所述GAN網(wǎng)絡(luò)的生成器進(jìn)行訓(xùn)練之前,還包括:
對每個干凈語音數(shù)據(jù)進(jìn)行加噪處理,形成對應(yīng)的加噪語音數(shù)據(jù);
對每個加噪語音數(shù)據(jù)進(jìn)行特征提取,形成每個加噪語音特征數(shù)據(jù);
計(jì)算每個加噪語音特征數(shù)據(jù)的均值方差歸一化處理值,將每個所述加噪語音特征數(shù)據(jù)的均值方差歸一化處理值作為所述GAN網(wǎng)絡(luò)的生成器的第一訓(xùn)練樣本。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述將每個第一訓(xùn)練樣本輸入到所述GAN網(wǎng)絡(luò)的生成器中,對所述GAN網(wǎng)絡(luò)的生成器進(jìn)行訓(xùn)練之后,還包括:
從所述GAN網(wǎng)絡(luò)的生成器輸出第一訓(xùn)練樣本對應(yīng)的去噪語音特征數(shù)據(jù)的理想掩膜值。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述將所述第二訓(xùn)練樣本輸入到所述GAN網(wǎng)絡(luò)的判別器中,對所述GAN網(wǎng)絡(luò)的判別器進(jìn)行訓(xùn)練之前,還包括:
對每個干凈語音數(shù)據(jù)進(jìn)行特征提取,形成每個干凈語音特征數(shù)據(jù);
計(jì)算所述每個干凈語音特征數(shù)據(jù)的理想掩膜值;
將每個加噪語音特征數(shù)據(jù)的均值方差歸一化處理值及對應(yīng)的干凈語音特征數(shù)據(jù)的理想掩膜值組成的值對,以及每個加噪語音特征數(shù)據(jù)的均值方差歸一化處理值及對應(yīng)的去噪語音特征數(shù)據(jù)的理想掩膜值組成的值對作為所述GAN網(wǎng)絡(luò)的判別器的第二訓(xùn)練樣本。
8.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述對GAN網(wǎng)絡(luò)進(jìn)行測試,具體包括:
獲取待測試的加噪語音特征數(shù)據(jù)的均值方差歸一化處理值作為所述GAN網(wǎng)絡(luò)的生成器的測試樣本;
將所述測試樣本輸入到訓(xùn)練后的生成器中,輸出待測試的加噪語音數(shù)據(jù)對應(yīng)的去噪語音特征數(shù)據(jù)的理想掩膜值;
根據(jù)所述理想掩膜值計(jì)算所述待測試加噪語音對應(yīng)的去噪語音數(shù)據(jù);
將所述去噪語音數(shù)據(jù)與所述待測試加噪語音數(shù)據(jù)的干凈語音數(shù)據(jù)進(jìn)行參數(shù)對比,以完成GAN網(wǎng)絡(luò)的測試。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810985896.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 導(dǎo)航系統(tǒng)
- 一種語音檢測方法和系統(tǒng)
- 語音數(shù)據(jù)庫創(chuàng)建方法、聲紋注冊方法、裝置、設(shè)備及介質(zhì)
- 即時(shí)聊天中語音數(shù)據(jù)的摘要生成方法、服務(wù)器及系統(tǒng)
- 一種語音智能識別設(shè)備及語音智能識別方法
- 語音數(shù)據(jù)的獲取方法和系統(tǒng)
- 一種語音數(shù)據(jù)處理方法及裝置
- 語音數(shù)據(jù)處理方法、裝置、設(shè)備及存儲介質(zhì)
- 一種語音數(shù)據(jù)主題識別的方法及裝置
- 語音喚醒方法、裝置、系統(tǒng)、設(shè)備和存儲介質(zhì)
- 基于改進(jìn)GAN網(wǎng)絡(luò)的語音去噪方法、裝置、設(shè)備及介質(zhì)
- 聲紋特征注冊方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì)
- 語音數(shù)據(jù)處理方法、裝置及電子設(shè)備
- 目標(biāo)語音提取方法、裝置、設(shè)備、介質(zhì)和聯(lián)合訓(xùn)練方法
- 一種語音識別的前端處理方法、裝置及終端設(shè)備
- 一種語音情緒識別方法及系統(tǒng)
- 一種提取語音特征的方法、裝置、終端及存儲介質(zhì)
- 語音識別方法、裝置、電子設(shè)備和存儲介質(zhì)
- 語音數(shù)據(jù)處理方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì)
- 語音情緒識別方法、裝置、設(shè)備及存儲介質(zhì)
- 會員特征數(shù)據(jù)統(tǒng)計(jì)方法及特征數(shù)據(jù)統(tǒng)計(jì)系統(tǒng)
- 人臉特征數(shù)據(jù)獲取系統(tǒng)
- 生物特征數(shù)據(jù)檢測裝置
- 學(xué)生特征數(shù)據(jù)挖掘系統(tǒng)
- 學(xué)生特征數(shù)據(jù)挖掘系統(tǒng)
- 時(shí)間序列數(shù)據(jù)特征量提取裝置、時(shí)間序列數(shù)據(jù)特征量提取方法和時(shí)間序列數(shù)據(jù)特征量提取程序
- 特征數(shù)據(jù)庫的更新、數(shù)據(jù)特征的確定方法、裝置及設(shè)備
- 生理特征數(shù)據(jù)測量裝置
- 特征大數(shù)據(jù)提取裝置
- 數(shù)據(jù)特征處理方法及數(shù)據(jù)特征處理裝置





