[發明專利]基于計算聽覺場景分析和生成對抗網絡模型的語音降噪方法在審

申請號：	201810606145.4	申請日：	2018-06-13
公開（公告）號：	CN108806708A	公開（公告）日：	2018-11-13
發明（設計）人：	陳龍;張小博;張曉燦	申請（專利權）人：	中國電子科技集團公司第三研究所
主分類號：	G10L21/0208	分類號：	G10L21/0208;G10L21/0308
代理公司：	北京天盾知識產權代理有限公司 11421	代理人：	張彩珍
地址：	100015 ***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	聽覺場景語音網絡模型中間結果降噪對抗背景環境語音信號最終結果分析判別器生成器畸變去除信道噪聲網絡
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明涉及一種基于計算聽覺場景分析和生成對抗網絡模型的語音降噪方法，包括：步驟1，基于生成對抗網絡的生成器及判別器對含噪語音進行處理，獲取中間結果；步驟2，基于計算聽覺場景分析方法對所述中間結果進行處理，得到最終結果。本發明能夠去除復雜信道背景環境下所獲取的語音信號中的部分噪聲，且能較好地保持語音部分不出現畸變。

技術領域

本發明涉及一種語音降噪方法，尤其涉及一種基于計算聽覺場景分析和生成對抗網絡模型的語音降噪方法。

背景技術

語音是人類相互傳遞信息的最重要手段，一段語音承載了說話人的意圖、身份、情緒等豐富的信息。語音信號可以通過空氣、水、無線電等多種媒介進行傳播。語音信號在傳播的過程中，或者由于采集設備的限制，通常都會受到各種噪聲的干擾。尤其是在某些專業應用中，外界的噪聲是不可避免的，而且在許多情況下，噪聲種類復雜、強度較大。這類噪聲會對后續語音信號處理造成嚴重的影響，例如會降低語音識別的準確性。此外，如果通過人工的方式來處理這種含噪聲的語音數據，長時間的工作會對人的聽覺系統造成損傷。

發明內容

本發明的目的在于提供一種基于計算聽覺場景分析和生成對抗網絡模型的語音降噪方法，以去除復雜信道背景環境下所獲取的語音信號中的部分噪聲，并保持語音部分不出現畸變。

本發明提供了一種基于計算聽覺場景分析和生成對抗網絡模型的語音降噪方法，包括：

步驟1，基于生成對抗網絡的生成器及判別器對含噪語音進行處理，獲取中間結果；

步驟2，基于計算聽覺場景分析方法對中間結果進行處理，得到最終結果。

進一步地，步驟1中，生成對抗網絡的訓練過程包括：

1)將含噪數據和純凈數據輸入判別器，令判別器判斷為不相同，通過反向傳播的方式調整判別器的網絡參數；

2)將含噪數據輸入生成器進行降噪處理，得到輸出結果，之后與含噪數據一同輸入判別器，令判別器判斷為相同，通過反向傳播的方式調整判別器的網絡參數；

3)固定步驟2)中得到的判別器的網絡參數，通過反向傳播的方式調整生成器的網絡參數，目標為使生成器判斷為不相同。

進一步地，步驟2包括：

將所述中間結果作為計算聽覺場景分析的輸入，對輸入信號進行掩蔽估計，根據估計結果對所述中間結果進行再合成，得到降噪后的語音數據。

與現有技術相比本發明的有益效果是：