[發明專利]基于計算聽覺場景分析和生成對抗網絡模型的語音降噪方法在審
| 申請號: | 201810606145.4 | 申請日: | 2018-06-13 |
| 公開(公告)號: | CN108806708A | 公開(公告)日: | 2018-11-13 |
| 發明(設計)人: | 陳龍;張小博;張曉燦 | 申請(專利權)人: | 中國電子科技集團公司第三研究所 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/0308 |
| 代理公司: | 北京天盾知識產權代理有限公司 11421 | 代理人: | 張彩珍 |
| 地址: | 100015 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聽覺場景 語音 網絡模型 中間結果 降噪 對抗 背景環境 語音信號 最終結果 分析 判別器 生成器 畸變 去除 信道 噪聲 網絡 | ||
本發明涉及一種基于計算聽覺場景分析和生成對抗網絡模型的語音降噪方法,包括:步驟1,基于生成對抗網絡的生成器及判別器對含噪語音進行處理,獲取中間結果;步驟2,基于計算聽覺場景分析方法對所述中間結果進行處理,得到最終結果。本發明能夠去除復雜信道背景環境下所獲取的語音信號中的部分噪聲,且能較好地保持語音部分不出現畸變。
技術領域
本發明涉及一種語音降噪方法,尤其涉及一種基于計算聽覺場景分析和生成對抗網絡模型的語音降噪方法。
背景技術
語音是人類相互傳遞信息的最重要手段,一段語音承載了說話人的意圖、身份、情緒等豐富的信息。語音信號可以通過空氣、水、無線電等多種媒介進行傳播。語音信號在傳播的過程中,或者由于采集設備的限制,通常都會受到各種噪聲的干擾。尤其是在某些專業應用中,外界的噪聲是不可避免的,而且在許多情況下,噪聲種類復雜、強度較大。這類噪聲會對后續語音信號處理造成嚴重的影響,例如會降低語音識別的準確性。此外,如果通過人工的方式來處理這種含噪聲的語音數據,長時間的工作會對人的聽覺系統造成損傷。
發明內容
本發明的目的在于提供一種基于計算聽覺場景分析和生成對抗網絡模型的語音降噪方法,以去除復雜信道背景環境下所獲取的語音信號中的部分噪聲,并保持語音部分不出現畸變。
本發明提供了一種基于計算聽覺場景分析和生成對抗網絡模型的語音降噪方法,包括:
步驟1,基于生成對抗網絡的生成器及判別器對含噪語音進行處理,獲取中間結果;
步驟2,基于計算聽覺場景分析方法對中間結果進行處理,得到最終結果。
進一步地,步驟1中,生成對抗網絡的訓練過程包括:
1)將含噪數據和純凈數據輸入判別器,令判別器判斷為不相同,通過反向傳播的方式調整判別器的網絡參數;
2)將含噪數據輸入生成器進行降噪處理,得到輸出結果,之后與含噪數據一同輸入判別器,令判別器判斷為相同,通過反向傳播的方式調整判別器的網絡參數;
3)固定步驟2)中得到的判別器的網絡參數,通過反向傳播的方式調整生成器的網絡參數,目標為使生成器判斷為不相同。
進一步地,步驟2包括:
將所述中間結果作為計算聽覺場景分析的輸入,對輸入信號進行掩蔽估計,根據估計結果對所述中間結果進行再合成,得到降噪后的語音數據。
與現有技術相比本發明的有益效果是:
能夠去除復雜信道背景環境下所獲取的語音信號中的部分噪聲,且能較好地保持語音部分不出現畸變。
附圖說明
圖1是本發明基于計算聽覺場景分析和生成對抗網絡模型的語音降噪方法的流程圖;
圖2是生成器的網絡結構圖;
圖3是生成對抗網絡的網絡訓練過程圖。
具體實施方式
下面結合附圖所示的各實施方式對本發明進行詳細說明,但應當說明的是,這些實施方式并非對本發明的限制,本領域普通技術人員根據這些實施方式所作的功能、方法、或者結構上的等效變換或替代,均屬于本發明的保護范圍之內。
本實施例提供了一種基于計算聽覺場景分析(Computational auditory sceneanalysis,CASA)和生成對抗網絡(Generative adversarial networks,GAN)模型的語音降噪方法,包括:
步驟1,基于生成對抗網絡的生成器(Generator)及判別器(Discriminator)對含噪語音進行處理,獲取中間結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電子科技集團公司第三研究所,未經中國電子科技集團公司第三研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810606145.4/2.html,轉載請聲明來源鉆瓜專利網。





