[發明專利]重構語音信號的方法和裝置有效
| 申請號: | 201711250483.0 | 申請日: | 2017-12-01 |
| 公開(公告)號: | CN109887494B | 公開(公告)日: | 2022-08-16 |
| 發明(設計)人: | 袁豪磊 | 申請(專利權)人: | 騰訊科技(深圳)有限公司;騰訊云計算(北京)有限責任公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/26;G10L21/0216;G10L21/0272;G10L15/10 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 劉映東 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 信號 方法 裝置 | ||
本發明實施例公開了一種重構語音信號的方法和裝置,屬于語音識別領域。所述方法包括:通過麥克風陣列的多個傳感器進行聲音采集,得到多個聲音信號;在所述多個聲音信號中確定第一語音信號;對所述第一語音信號進行信號分離,得到第二語音信號;將所述第二語音信號通過失真恢復模型進行重構,得到重構的語音信號。采用本發明,可以提高語音識別結果的準確性。
技術領域
本發明涉及語音識別領域,特別涉及一種重構語音信號的方法和裝置。
背景技術
隨著語音識別技術的發展,終端可以對用戶語音的內容進行識別,進而可以對語音的內容做出響應。
終端一般采用麥克風陣列來采集遠場空間中的聲音信號。麥克風陣列利用空間相干性檢測區分出各個聲音信號的入射方向,對聲場中的各種信號的入射方向做出估計,定位跟蹤能量最強的前幾個聲音信號。對于每一個所跟蹤的聲音信號,判斷其是否屬于語音信號。在麥克風陣列的每個傳感器(如麥克風)上施加相應的時延和增益控制,使陣列形成波束指向,使得語音信號方向上的增益盡可能大、并且在噪聲信號方向上的增益盡可能小。從麥克風陣列的輸出結果中估計出語音信號與噪聲信號在頻率特征分布上的不同,構造一個時變的濾波器,從統計的意義上進一步將語音信號與噪聲信號做分離,從而將語音信號分離出來。
在實現本發明的過程中,發明人發現現有技術至少存在以下問題:
如果麥克風陣列內的傳感器數量達到無窮,則將語音信號和噪聲信號進行分離時,可以達到清晰的分離。但是,實際情況中,麥克風陣列內的麥克風數量是有限的,區分各個聲音信號入射方向的能力也是有限的,因此語音信號和噪聲信號必定會存在重疊部分。在濾除噪聲信號時,一般需要對語音信號和噪聲信號進行頻域維納濾波,在消除噪聲的同時會對語音信號造成損傷。將損傷的語音信號輸入語音識別系統ASR(Automatic SpeechRecognition,語音識別)時,可能導致語音識別結果的準確性較低,因此,亟需一種對語音信號進行重構的方法。
發明內容
為了解決現有技術的問題,本發明實施例提供了一種重構語音信號的方法和裝置。所述技術方案如下:
一方面,提供了一種重構語音信號的方法,所述方法包括:
通過麥克風陣列的多個傳感器進行聲音采集,得到多個聲音信號;
在所述多個聲音信號中確定第一語音信號,所述第一語音信號為通過檢測確定的語音信號;
對所述第一語音信號進行信號分離,得到第二語音信號;
將所述第二語音信號通過失真恢復模型進行重構,得到重構的語音信號;
其中,所述失真恢復模型是基于干凈語音信號和失真語音信號進行訓練得到。
一方面,提供了一種話音檢測模型的訓練方法,所述方法包括:
獲取第一對抗生成網絡,所述第一對抗生成網絡包含初始混響濾波模型與初始話音檢測模型,所述初始混響濾波模型的輸出作為所述初始話音檢測模型的輸入;
獲取多個樣本聲音信號,其中,所述樣本聲音信號至少包括干凈語音信號與純噪聲信號;
基于所述多個樣本聲音信號對所述第一對抗生成網絡中的初始混響濾波模型與初始話音檢測模型進行訓練,得到所述話音檢測模型;
其中,所述話音檢測模型用于檢測聲音信號對應的信號類型,所述信號類型至少包括語音信號或噪聲信號。
一方面,提供了一種失真恢復模型的訓練方法,所述方法包括:
獲取第二對抗生成網絡,所述第二對抗生成網絡包含初始失真判別模型與初始失真恢復模型,所述初始失真恢復模型的輸出與干凈語音信號作為所述初始失真判別模型的輸入;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司;騰訊云計算(北京)有限責任公司,未經騰訊科技(深圳)有限公司;騰訊云計算(北京)有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711250483.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種文字音頻推送方法
- 下一篇:聲音處理裝置、聲音處理方法及記錄介質





