[發(fā)明專利]一種語音識別方法、裝置、電子設備以及存儲介質在審
| 申請?zhí)枺?/td> | 202110610069.6 | 申請日: | 2021-06-01 |
| 公開(公告)號: | CN113327586A | 公開(公告)日: | 2021-08-31 |
| 發(fā)明(設計)人: | 汪雪;黃石磊;程剛 | 申請(專利權)人: | 深圳市北科瑞聲科技股份有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/16;G10L15/26;G10L25/24 |
| 代理公司: | 深圳智匯遠見知識產權代理有限公司 44481 | 代理人: | 劉潔;牛悅涵 |
| 地址: | 518036 廣東省深圳市福田區(qū)梅林街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 識別 方法 裝置 電子設備 以及 存儲 介質 | ||
1.一種語音識別方法,其特征在于,所述方法包括:
獲取音頻數據,對所述音頻數據進行頻譜分析,生成所述音頻數據的梅爾倒譜圖;
利用預先訓練好的音頻識別模型對所述梅爾倒譜圖進行特征提取,得到特征音頻信號,并識別所述特征音頻信號的音素序列;
對所述音素序列進行文字提取,將文字提取的結果作為所述音頻數據的識別結果。
2.如權利要求1所述的語音識別方法,其特征在于,所述對所述音頻數據進行頻譜分析,生成所述音頻數據的梅爾倒譜圖,包括:
對所述音頻數據進行預處理,并將預處理后的音頻數據進行短時傅里葉變換,得到所述音頻數據的聲譜圖;
對所述聲譜圖進行梅爾譜濾波,并將梅爾譜濾波后的聲譜圖進行倒譜分析,得到所述音頻數據的初始梅爾倒譜圖;
對所述初始梅爾倒譜圖進行離散變換,得到所述音頻數據的梅爾倒譜圖。
3.如權利要求1所述的語音識別方法,其特征在于,所述利用預先訓練好的音頻識別模型對所述梅爾倒譜圖進行特征提取之前,還包括:
獲取訓練倒譜圖及對應的第一特征音頻信號,從所述第一特征音頻信號中提取音素序列,得到第一音素序列;
對所述訓練倒譜圖進行頻譜增強,將頻譜增強后的訓練倒譜圖和所述訓練倒譜圖作為模型訓練數據;
將所述模型訓練數據輸入所述音頻識別模型的卷積模塊中,以輸出所述模型訓練數據的第二特征音頻信號,并利用所述音頻識別模型的音素識別模塊識別所述第二特征音頻信號的第二音素序列;
根據所述第一特征音頻信號、第二特征音頻信號、第一音素序列以及第二音素序列,計算所述音頻識別模型的訓練損失;
若所述訓練損失不滿足預設條件,調整所述音頻識別模型的參數,并返回將所述模型訓練數據輸入所述音頻識別模型的卷積模塊中的步驟;
若所述訓練損失滿足預設條件,得到訓練好的音頻識別模型。
4.如權利要求3所述的語音識別方法,其特征在于,所述將所述模型訓練數據輸入所述音頻識別模型的卷積模塊中,以輸出所述模型訓練數據的第二特征音頻信號,包括:
利用所述卷積模塊中的卷積層對所述模型訓練數據進行卷積操作,得到初始特征音頻信號;
利用所述卷積模塊中的線性整流層對所述初始特征音頻信號進行線性調整;
利用卷積模塊中的池化層對線性調整后的初始特征音頻信號進行降維;
利用所述卷積模塊中的全連接層輸出降維后的初始特征音頻信號,得到第一特征音頻信號。
5.如權利要求3所述的語音識別方法,其特征在于,所述利用所述音頻識別模型的音素識別模塊識別所述第二特征音頻信號的第二音素序列,包括:
利用所述音素識別模塊中的輸入層接收所述第二特征音頻信號,并設置所述第二特征音頻信號的延時數據;
根據所述延時數據,利用所述音素識別模塊中的隱藏層提取所述第二特征音頻信號的音素序列;
利用所述音素識別模塊中的輸出層輸出提取的音素序列,得到第二音素序列。
6.如權利要求3所述的語音識別方法,其特征在于,所述根據所述第一特征音頻信號、第二特征音頻信號、第一音素序列以及第二音素序列,計算所述音頻識別模型的訓練損失,包括:
根據所述第一特征音頻信號及第二特征音頻信號,計算所述音頻識別模型的第一訓練損失;
根據所述第一音素序列以及第二音素序列,計算所述音頻識別模型的第二訓練損失;
根據所述第一訓練損失和第二訓練損失,計算所述音頻識別模型的訓練損失。
7.如權利要求1至6中任意一項所述的語音識別方法,其特征在于,所述對所述音素序列進行文字提取,包括:
計算從所述音素序列的文字生成概率;
根據所述文字生成概率,識別所述音素序列之間的文字信息關系,根據所述文字信息關系,生成對應的文字。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市北科瑞聲科技股份有限公司,未經深圳市北科瑞聲科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110610069.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多組分抗靜電紗及其紡制方法
- 下一篇:一種清潔設備





