[發(fā)明專利]一種基于膨脹因果卷積的語音降噪方法在審
| 申請?zhí)枺?/td> | 202010324373.X | 申請日: | 2020-04-23 |
| 公開(公告)號: | CN111524530A | 公開(公告)日: | 2020-08-11 |
| 發(fā)明(設(shè)計(jì))人: | 陳陽;劉慶云;吳慶婕 | 申請(專利權(quán))人: | 廣州清音智能科技有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L25/30 |
| 代理公司: | 北京天奇智新知識產(chǎn)權(quán)代理有限公司 11340 | 代理人: | 王澤云 |
| 地址: | 510000 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 膨脹 因果 卷積 語音 方法 | ||
本發(fā)明公開了一種基于膨脹因果卷積的語音降噪方法,該方法包括構(gòu)建網(wǎng)絡(luò)訓(xùn)練的音頻訓(xùn)練集;基于膨脹因果卷積,構(gòu)建語音降噪網(wǎng)絡(luò)模型并訓(xùn)練網(wǎng)絡(luò)模型;使用訓(xùn)練后的模型進(jìn)行降噪。本發(fā)明利用膨脹因果卷積來處理音頻時(shí)序信息,將感受范圍增大,使模型的能力更加優(yōu)秀。本發(fā)明提出的基于膨脹因果卷積的語音降噪方法,在去噪問題上,具有較好的解決能力,對噪聲種類的泛化能力也較強(qiáng)。
技術(shù)領(lǐng)域
本發(fā)明涉及語音降噪技術(shù)領(lǐng)域,尤其涉及一種基于膨脹因果卷積的語音降噪方法。
背景技術(shù)
對于音頻信號的降噪技術(shù)一直是語音領(lǐng)域的一個(gè)收到極大關(guān)注的研究方向,并且具有很大的實(shí)用性。通過降噪技術(shù),可以增強(qiáng)原始音頻的質(zhì)量,提高收聽的效果。迄今,正在被使用的語音降噪方法主要有譜減法和基于統(tǒng)計(jì)模型的方法等。諸如此類的無監(jiān)督方法,在慢變得噪聲條件下,才能取得較好的降噪效果。隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的廣泛研究,將深度學(xué)習(xí)的有監(jiān)督方法也被成功地應(yīng)用到語音降噪問題上,并且取得了不錯(cuò)的效果。
基于深度學(xué)習(xí)的語音降噪方法中的深度神經(jīng)網(wǎng)絡(luò),結(jié)構(gòu)分為輸入層,輸出層和隱藏層。在語音降噪問題中,我們將帶噪的音頻信息作為網(wǎng)絡(luò)的輸入信息傳到輸入層,用純凈不帶噪聲的音頻信息作為輸出目標(biāo)數(shù)據(jù)去做一個(gè)有監(jiān)督的訓(xùn)練。
發(fā)明內(nèi)容
為解決上述技術(shù)問題,本發(fā)明的目的是提供一種基于膨脹因果卷積的語音降噪方法。
本發(fā)明的目的通過以下的技術(shù)方案來實(shí)現(xiàn):
一種基于膨脹因果卷積的語音降噪方法,包括:
S1構(gòu)建網(wǎng)絡(luò)訓(xùn)練的音頻訓(xùn)練集;
S2基于膨脹因果卷積,構(gòu)建語音降噪網(wǎng)絡(luò)模型并訓(xùn)練網(wǎng)絡(luò)模型;
S3使用訓(xùn)練后的模型進(jìn)行降噪。
與現(xiàn)有技術(shù)相比,本發(fā)明的一個(gè)或多個(gè)實(shí)施例可以具有如下優(yōu)點(diǎn):
本發(fā)明與傳統(tǒng)的語音降噪方法不同,采用了深度學(xué)習(xí)訓(xùn)練神經(jīng)網(wǎng)絡(luò)來完成語音降噪任務(wù)。通過膨脹因果卷積,提升了卷積效果,擴(kuò)大了感受范圍,最后訓(xùn)練出來的模型能更好地進(jìn)行語音降噪工作,較好地去除帶噪聲音頻文件中的噪聲;
基于膨脹因果卷積的語音降噪方法,在去噪問題上,具有較好的解決能力,對噪聲種類的泛化能力也較強(qiáng)。
附圖說明
圖1為本發(fā)明實(shí)施例提供的一種基于膨脹因果卷積的語音降噪方法的整體流程圖;
圖2為本發(fā)明實(shí)施例提供的一種基于膨脹因果卷積的語音降噪方法的示意圖;
圖3為膨脹因果卷積的示意圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合實(shí)施例及附圖對本發(fā)明作進(jìn)一步詳細(xì)的描述。
如圖1和圖2所示,為基于膨脹因果卷積的語音降噪方法的整體流程,包括以下步驟:
S1構(gòu)建網(wǎng)絡(luò)訓(xùn)練的音頻訓(xùn)練集;
S2基于膨脹因果卷積,構(gòu)建語音降噪網(wǎng)絡(luò)模型并訓(xùn)練模型;
S3使用訓(xùn)練后的模型進(jìn)行降噪。
上述S1中所述的音頻訓(xùn)練集包括如下音頻數(shù)據(jù):帶噪音頻數(shù)據(jù)以及與之對應(yīng)的用于監(jiān)督的純凈音頻數(shù)據(jù)。所述的數(shù)據(jù)集構(gòu)建方法為:
S11采集純凈的音頻信號和噪聲信號。純凈的音頻信號采集自TIMIT數(shù)據(jù)庫以及與錄音室中錄制的純凈不帶噪聲的語音音頻信號,噪聲信號同樣采集自TIMIT數(shù)據(jù)庫以及錄制的噪聲音頻信號。
S12將純凈的語音音頻信號和噪聲信號混合,得到帶噪聲的語音音頻信號。合成的方法有單噪聲和多噪聲的合成方法,有效地豐富了數(shù)據(jù)集。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州清音智能科技有限公司,未經(jīng)廣州清音智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010324373.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于行為時(shí)間序列的社交網(wǎng)絡(luò)因果關(guān)系發(fā)現(xiàn)算法
- 一種自底向上的高維數(shù)據(jù)因果網(wǎng)絡(luò)學(xué)習(xí)方法
- 情態(tài)生成裝置以及計(jì)算機(jī)可讀取記錄介質(zhì)
- 對短文本進(jìn)行常識性因果推理的方法
- 一種基于動量動力學(xué)模型的行人間因果關(guān)系識別方法
- 因果句解析裝置、因果句解析系統(tǒng)、程序以及因果句解析方法
- 訂單歸因方法及裝置
- 一種基于因果推理對玻璃熔爐環(huán)境控制的方法及系統(tǒng)
- 一種結(jié)合知識圖譜和自動變分編碼的因果發(fā)現(xiàn)方法
- 一種基于弱證據(jù)聚合的常識因果推理方法及系統(tǒng)
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)





