[發明專利]語音識別方法、計算機程序產品、計算機設備及存儲介質在審
| 申請號: | 202111168014.0 | 申請日: | 2021-09-29 |
| 公開(公告)號: | CN114333769A | 公開(公告)日: | 2022-04-12 |
| 發明(設計)人: | 馬東鵬 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/20;G10L21/0208;G06K9/62 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強;杜維 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 計算機 程序 產品 設備 存儲 介質 | ||
1.一種語音識別方法,其特征在于,包括:
在獲取到基于目標對象的語音聲音和干擾噪聲所生成的目標麥克風信號后,對所述目標麥克風信號進行去噪處理,以得到所述目標對象的目標單通道語音信號;
對所述目標單通道語音信號進行特征提取,得到第一信號特征;以及,對所述目標麥克風信號進行特征提取,得到第二信號特征;
根據所述第一信號特征和所述第二信號特征,為所述目標單通道語音信號分配第一動態權重,以及為所述目標麥克風信號分配第二動態權重;
基于所述第一動態權重和所述第二動態權重,對所述第一信號特征和所述第二信號特征進行特征融合,得到融合信號特征;
采用所述融合信號特征對所述目標單通道語音信號進行語音識別,得到語音識別結果。
2.根據權利要求1所述的方法,其特征在于,所述目標麥克風信號是M個原始麥克風信號中的其中一個原始麥克風信號,每個原始麥克風信號均是基于所述目標對象的語音聲音和所述干擾噪聲生成的,M為大于1的整數;
所述對所述目標麥克風信號進行去噪處理,以得到所述目標對象的目標單通道語音信號,包括:
對每個原始麥克風信號進行回音消除處理,得到M個回音消除后的麥克風信號;
對每個回音消除后的麥克風信號進行降噪處理,得到M個降噪后的麥克風信號;
根據所述M個降噪后的麥克風信號執行波束形成操作,得到所述目標對象的目標單通道語音信號。
3.根據權利要求1所述的方法,其特征在于,所述根據所述第一信號特征和所述第二信號特征,為所述目標單通道語音信號分配第一動態權重,以及為所述目標麥克風信號分配的第二動態權重,包括:
整合所述第一信號特征和所述第二信號特征,得到整合信號特征;
調用權重預測模型根據所述整合信號特征進行權重預測,得到權重向量;以及,將所述權重向量分割成第一向量和第二向量;
按照所述第一信號特征和所述第二信號特征的整合先后順序,從所述第一向量和所述第二向量中選取一個向量,作為第一動態權重分配給所述目標單通道語音信號;以及,將未被選取的向量作為第二動態權重分配給所述目標麥克風信號。
4.根據權利要求3所述的方法,其特征在于,所述第一信號特征包括:所述目標單通道語音信號的頻域特征;所述第二信號特征包括:所述目標麥克風信號的頻域特征;
所述整合所述第一信號特征和所述第二信號特征,得到整合信號特征,包括:
基于所述目標單通道語音信號的時域特征以及所述目標麥克風信號的時域特征,進行信號重構處理,得到重構語音信號;
在頻域上對所述重構語音信號進行特征提取,得到所述重構語音信號的頻域特征;
整合所述重構語音信號的頻域特征、所述第一信號特征以及所述第二信號特征,得到整合信號特征。
5.根據權利要求4所述的方法,其特征在于,所述基于所述目標單通道語音信號的時域特征以及所述目標麥克風信號的時域特征,進行信號重構處理,得到重構語音信號,包括:
根據所述目標單通道語音信號的時域特征以及所述目標麥克風信號的時域特征,為所述目標單通道語音信號分配第一特征權重,以及為所述目標麥克風信號分配第二特征權重;
根據所述第一特征權重和所述第二特征權重,對所述目標單通道語音信號的時域特征和所述目標麥克風信號的時域特征進行特征融合,得到特征融合后的時域特征;
對所述特征融合后的時域特征進行轉化,得到所述特征融合后的時域特征對應的重構語音信號。
6.根據權利要求4所述的方法,其特征在于,所述融合信號特征是通過調用信號處理模型得到的,所述目標麥克風信號是通過對用于模型優化的樣本單通道語音信號進行加噪處理得到;所述方法還包括:
對所述樣本單通道語音信號進行特征提取,得到樣本信號特征;
根據所述融合信號特征和所述樣本信號特征之間的差異,計算所述信號處理模型的模型損失值;
根據所述信號處理模型的模型損失值,對所述信號處理模型進行模型優化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111168014.0/1.html,轉載請聲明來源鉆瓜專利網。





