[發明專利]一種遠場語音識別方法在審
| 申請號: | 202110372848.7 | 申請日: | 2021-04-07 |
| 公開(公告)號: | CN113096680A | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 陳芒 | 申請(專利權)人: | 深圳市輕生活科技有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L25/18;G10L25/24;G10L15/26 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 吳金水 |
| 地址: | 518000 廣東省深圳市福田區福田*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 識別 方法 | ||
1.一種遠場語音識別方法,其特征在于,包括:
獲取遠場語音信號;
對所述遠場語音信號進行降噪預處理,獲得預處理后的遠場語音信號;
將所述預處理后的遠場語音信號輸入至語音特征提取模型,基于所述語音特征提取模型獲取所述遠場語音信號對應的語音特征;所述語音特征提取模型是采用小波變換與梅爾倒譜系數相結合的方法實現語音特征提取,其中,所述小波變換采用局部能量計算原則;
基于獲取的所述語音特征,采用聲學模型和語言模型匹配完成遠場語音識別。
2.根據權利要求1所述的遠場語音識別方法,其特征在于,所述語音特征提取模型的構建方法包括:
將所述遠場語音信號分幀處理;
將每一幀的遠場語音信號進行離散小波分解處理,獲得分解后的小波系數;
將所述小波系數做快速傅里葉變換,確定所有小波系數對應的若干個頻帶局部能量;
確定若干個頻帶局部能量分布,基于所述分布結合梅爾濾波器組確定梅爾倒譜系數;
基于所述梅爾倒譜系數確定動態特性的差分參數;
基于所述差分參數對語音特征的提取進行訓練,獲取語音特征。
3.根據權利要求2所述的遠場語音識別方法,其特征在于,所述確定所有小波系數對應的若干個頻帶局部能量,包括:
將遠場語音信號進行離散小波分解,分解為6層,形成7個頻帶能量;
將每個頻帶能量進行按照時間段劃分為若干個頻帶局部能量。
4.根據權利要求2所述的遠場語音識別方法,其特征在于,所述將所述遠場語音信號分幀處理,之后包括:
對分幀處理后的遠場語音信號進行加窗處理;
所述將每一幀的遠場語音信號進行離散小波分解處理,包括:
對加窗處理后的每一幀的遠場語音信號進行離散小波分解處理。
5.根據權利要求4所述的遠場語音識別方法,其特征在于,所述對分幀處理后的遠場語音信號進行加窗處理中,所述窗函數經過傅里葉變換后的頻譜采用下述公式表示:
其中,W(w)為窗函數的頻譜,M為窗函數的長度,w為頻域變量,j2=-1。
6.根據權利要求2所述的遠場語音識別方法,其特征在于,所述確定若干個頻帶局部能量分布,所述頻帶局部能量分布公式采用下述公式表示:
其中,P為頻帶局部能量分布的向量;為小波分解系數構成的特征信號的第L個離散點系數,M1和M2分別為特征信號在兩個時刻分別對應的離散點的下標,M1≥0,M2≤M,M為特征信號的離散點的個數;j=1,2…N,N為小波分解的層數;為第j層的細節系數;i=1,2…Nm,Nm為頻帶局部能量的個數。
7.根據權利要求1所述的遠場語音識別方法,其特征在于,所述對所述遠場語音信號進行降噪預處理,獲得預處理后的遠場語音信號,包括:
將所述遠場語音信號采用經驗模態分解,將語音信號分解為高頻內涵模態分量和低頻內涵模態分量;
針對所述高頻內涵模態分量進行小波變換分解,分解出高頻系數和低頻系數;
針對所述高頻系數采用閾值函數的方式進行閾值處理,獲得閾值處理后的估計小波系數;
根據經過閾值處理的估計小波系數以及所述低頻系數對小波系數進行重構,獲得重構后的小波系數;
基于所述重構后的小波系數及所述低頻內涵模態分量對所述語音信號進行重構,獲得降噪處理后的遠場語音信號。
8.根據權利要求1所述的遠場語音識別方法,其特征在于,所述對所述遠場語音信號進行降噪預處理,獲得預處理后的遠場語音信號,包括:
采用麥克風陣列算法確定期望信號的方向;
通過重新排列麥克風陣列的空間位置,增強期望信號并抑制噪聲信號和干擾信號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市輕生活科技有限公司,未經深圳市輕生活科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110372848.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種消防管道磨平設備
- 下一篇:一種面料生產設備





