[發明專利]語音增強方法、裝置、設備及介質有效
| 申請號: | 202011635949.0 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112767959B | 公開(公告)日: | 2023-10-17 |
| 發明(設計)人: | 梁彧;傅強;馬多佳;田野;楊滿智;蔡琳;王杰;金紅;陳曉光 | 申請(專利權)人: | 恒安嘉新(北京)科技股份公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/0232;G10L21/0264;G10L25/30 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100098 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 增強 方法 裝置 設備 介質 | ||
本發明實施例公開了一種語音增強方法、裝置、設備及介質。該方法包括:獲取目標含噪語音信號并對其進行短時傅里葉變換,得到與目標含噪語音信號對應的目標頻域信號;將目標頻域信號當前信號幀的目標特征輸入預先訓練得到的語音噪聲抑制模型中的編碼器中,得到與目標頻域信號當前信號幀對應的編碼特征;將編碼特征、語音噪聲抑制模型中的解碼器輸出的目標頻域信號當前信號幀的前一個信號幀對應的解碼特征,輸入解碼器中,得到與目標頻域信號當前信號幀對應的解碼特征;將與目標頻域信號各個信號幀對應的解碼特征進行信號重構,得到與目標含噪語音信號對應的目標增強語音信號。上述技術方案可以提高語音增強效果,減少計算時間和計算成本。
技術領域
本發明實施例涉及信號處理技術領域,尤其涉及一種語音增強方法、裝置、設備及介質。
背景技術
語音增強的任務是最大化語音信號的感知質量,抑制背景噪聲的干擾。語音增強技術普遍是基于語音信號的頻域信號或語音信號的信號特征進行的,在傳統的方法中,語音增強使用的方法主要包括:譜減法、維納濾波法、基于統計特征的最小二次均方法和子空間算法等,這些算法中的大多數算法處理的噪音類型的條件有限,并依賴于一階統計特性。為了規避這些算法中的局限性,深層網絡已經被越來越多地應用在噪聲抑制問題中。
目前,深層網絡的方法主要集中在生成式對抗網絡(Generative AdversarialNetwork,GAN)方面,例如語音增強生成式對抗網絡(Speech Enhancement GenerativeAdversarial Network,SEGAN),它由生成器和判別器組成,生成器的目的在于迷惑判別器,而判別器的目的在于不被生成器迷惑,生成器是通過與辨別器的對抗訓練來學習映射關系的。在SEGAN中,生成器輸入的是帶噪的語音信號,輸出的是干凈的語音信號,判別器的輸入是生成器輸出的干凈的語音信號及原始的干凈的語音信號,輸出的是對輸入語音的二分類,SEGAN將生成器作為語音增強網絡,通過判別器來區分原始干凈的語音信號和增強后的語音信號。在語音增強應用中,還可以采用其他的深度網絡,例如,卷積神經網絡(Convolutional Neural Network,CNN)、深度神經網絡(Deep Neural Networks,DNN)和循環神經網絡(Recurrent Neural Network,RNN)等,但是CNN和DNN只能對語音信號對應的頻域信號逐幀進行處理,導致語音增強效果不夠理想,而由于語音信號本身具有數據量較大的特性,使得RNN和GAN方法又受限于遞歸計算,無法并行計算而造成計算時間較長且計算成本大的問題。因此,如何提高語音增強效果,減少計算時間和計算成本,是亟待解決的問題。
發明內容
本發明實施例提供一種語音增強方法、裝置、設備及介質,以提高語音增強效果,減少計算時間和計算成本。
第一方面,本發明實施例提供了一種語音增強方法,包括:
獲取目標含噪語音信號,對所述目標含噪語音信號進行短時傅里葉變換,得到與所述目標含噪語音信號對應的目標頻域信號;
將所述目標頻域信號當前信號幀的目標特征輸入預先訓練得到的語音噪聲抑制模型中的編碼器中,得到與所述目標頻域信號當前信號幀對應的編碼特征;
將所述編碼特征、所述語音噪聲抑制模型中的解碼器輸出的所述目標頻域信號當前信號幀的前一個信號幀對應的解碼特征,輸入所述解碼器中,得到與所述目標頻域信號當前信號幀對應的解碼特征;
將與所述目標頻域信號各個信號幀對應的解碼特征進行信號重構,得到與所述目標含噪語音信號對應的目標增強語音信號。
第二方面,本發明實施例還提供了一種語音增強裝置,包括:
目標頻域信號生成模塊,設置為獲取目標含噪語音信號,對所述目標含噪語音信號進行短時傅里葉變換,得到與所述目標含噪語音信號對應的目標頻域信號;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于恒安嘉新(北京)科技股份公司,未經恒安嘉新(北京)科技股份公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011635949.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種具有藥物保護功能的醫療護理盤
- 下一篇:一種螺栓被連接件剛度的確認方法





